Однак існують ситуації, у яких максимальне значення критерію є неінформативним, наприклад, перебування максимальне вилученого в інформаційному змісті класу. У таких випадках використовується площа робочої області критерію. Алгоритм її обчислення схожий з алгоритмом перебування максимального значення з тією різницею, що виробляється підсумовування всіх значень критерію в робочій області.
2.4 Визначення мінімального обсягу навчальної вибірки
Навчальна вибірка має на практиці скінченну довжину n, що обумовлює наявність статистичної похибки e між імовірністю pi та емпіричною частотою ki n знаходження значення i -ої ознаки розпізнавання у своєму контрольному полі допусків δдо,і . Верхня оцінка похибки e =|pi - | у залежності від кількості випробувань n визначається за теоремою Муавра-Лапласа [ ]:
(2.4.1)
де ki - кількість подій, при яких значення i -ої ознаки знаходиться в полі допусків δдо,і ; qi=1-pi - імовірність відсутності значення i -ої ознаки в полі допусків; ?(...) - функція Лапласа.
Визначення мінімальної довжини nmin навчальної вибірки зробимо за умови отримання допустимої статистичної похибки та оперативності алгоритму обчислення nmin . Ці вимоги є суперечливими, що обумовлює компромісний характер розв'язання цього завдання. Скористаємось методом динамічного довірчого інтервального оцінювання. Суть методу полягає в побудові після шкірного випробування довірчого інтервалу, який оцінює ймовірність рі знаходження i -ої ознаки в полі допусків δдо,і з імовірністю 1-Q :
. (2.4.2)
Визначення максимальної похибки eQ у залежності від обсягу вибірки n при заданому рівні значущості Q здійснюється за співвідношенням
. (2.4.3)
За Q вибирають бу-яку мале позитивне число (звичайно вибирають одне із значень: 0.05; 0.01; 0.001). З урахуванням властивості функції Лапласа Ф(х)=1-Ф(-х) перетворимо (2.4.3) до вигляду
. (2.4.4)
Для Q=0.05 за таблицею функції Лапласа , з урахуванням (2.4.4) для Ф(х)= 1 - Q/2 = 0.975, знайдемо значення аргументу . Тоді похибка eQ змінюється в залежності від довжини навчальної вибірки n за гіперболічним законом:
. (2.4.5)
Для знаходження мінімального числа випробувань nmin , яку гарантує прийнятні з практичних міркувань величину похибки і оперативність реалізації алгоритму обчислювання, необхідно знайти критерій зупину випробувань. Таким моментом вважається випробування, при якому поточний довірчий інтервал накривається заданим інтервалом [0,5±D], де ½D½<0,5. Останній (правий) перетин заданого інтервалу з однією з меж довірчого інтервалу визначає випробування nmin , яку гарантує з імовірністю 1-Q, що максимальна похибка eQ не перебільшує значення функції εQ =f(n) при n=nmin.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.