.
(3.6.3)
З урахуванням властивості функції Лапласа: Ф(х)=1-Ф(-х), перетворимо (3.6.3) до вигляду:
.
(3.6.4)
Наприклад, для Q=0.05за таблицею значень
функції Лапласа [175-178] з урахуванням (3.6.4) для Ф(х)= 1- Q / 2
= 0.975, знайдемо значення аргументу функції . Тоді похибка eQ змінюється залежно від обсягу навчальної вибірки n за гіперболічним
законом:
. (3.6.5)
На рис. 3.7 наведено графік функції eQ = f(n) (крива 1) і умовно виділено три області значень аргументу, які відрізняються крутизною функції. Область І є забороненою областю, оскільки похибка перебільшує допустиме значення. Область ІІІ характеризується значними економічними втратами при малій швидкості зменшення похибки eQ. Область II є компромісною і охоплює інтервал приблизно від 40 до 100 випробувань. Легко довести, що при різних значеннях рівня значущості Q графік функції eQ = f(n)буде зміщуватися паралельно по вертикалі, не змінюючи свого вигляду.
Рис.3.7. До визначення мінімального обсягу навчальної вибірки:
1 - графік функції eQ = f(n);
2 - графік
емпіричної частоти ;
3 - верхня межа довірчого інтервалу;
4 - нижня межа довірчого інтервалу.
Графічно
довірчий інтервал можна побудувати за формулою (3.6.2), обчислюючи для кожного
випробування n за виразом
(3.6.5) похибку eQ i відкладаючи її зверху та знизу від графіка частоти ki n (крива 2). При
цьому верхня
(крива 3) та нижня
(крива 4) межи довірчого інтервалу при
збільшенні числа випробувань, як показано на рис. 3.7, мають тенденцію до
зближення з емпіричною частотою.
Для
знаходження мінімального числа випробувань nmin, яке
гарантує прийнятні з практичних міркувань величину похибки і оперативність реалізації
алгоритму обчислювання, необхідно задати критерій зупину випробувань. Таким
моментом можна вважати випробування, при якому поточний довірчий інтервал
накривається заданим інтервалом [0,5±D], де ½D½< 0,5. Останній (правий) перетин заданого інтервалу з однією з меж
довірчого інтервалу визначає випробування nmin, яке
гарантує з імовірністю 1-Q, що максимальна похибка eQ не перебільшує значення функції =f(n) при n=nmin. Таким чином, за
критерієм Парето вибір nmin доцільно здійснювати в
компромісній області ІІ (на рис. 3.7 nmin =54) за умови
відсутності викидів значень емпіричної частоти до значень, близьких до нуля або
одиниці. Для багатьох практичних задач значення D визначається з інтервалу [0,3;0,4] за алгоритмом, наведеним,
наприклад, у праці [2].
У загальному випадку, треба будувати довірчі інтервали для всіх N ознак і вибирати nmin за умови:
nmin=(nmin 1, ..., nmin i, ..., nmin N).
При відповідному виборі СКД на незалежні ознаки розпізнавання та забезпеченні умов статистичної сталості та статистичної однорідності функціонально-статистичних випробувань можна вибирати nmin за довірчим інтервалом, побудованим для будь-якої однієї ознаки, що значно знижує обчислювальну трудомісткість алгоритму.
3.7. Функціональна ефективність і надійність СК, що навчається
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.