Оцінка функціональної ефективності системи керування, що навчається, страница 8

3.8. Оцінка точнісних характеристик навчання СК з відкритим алфавітом класів розпізнавання

Одним із важливих показників СК, що навчається, є асимптотична повна достовірність розпізнавання  , яка визначається функціональною ефективністю навчання системи та характеризує потенційні точнісні характеристики побудованого в процесі навчання вирішального правила. Поява нових класів, що може призводити як до збільшення ступеня перетину класів, так і до зменшення їх середньої міжкласової відстані, обумовлює зниження асимптотичної ймовірності правильного прийняття рішень. Проаналізуємо вплив потужності відкритого алфавіту класів розпізнавання на асимптотичні (екстремальні) точнісні характеристики процесу навчання СК при незмінному словнику ознак розпізнавання.

Нехай {X|m=,...}^-відкритий алфавіт класів розпізнавання, який поповнюється в процесі функціонування СК новими класами. У бінарному просторі ознак  WБ  задано навчальну матрицю  і множину еталонних векторів  }. Розіб’ємо множину    на пари сусідніх векторів  = < xm, xl >  за умови мінімальної кодової відстані між ними, яку позначимо через  d(xmxl), , lm, де  xl - еталонний вектор класу  X, найближчого до класу  X. Для визначення факторів, що впливають на зменшення вірогідності  D1,m  при збільшенні потужності алфавіту  ,  розглянемо характеристики розбиття простору  WБ, які безпосередньо впливають на точнісні характеристики. Введемо парний коефіцієнт перетину для класу  X, який у геометричній інтерпретації має вигляд:

hm,l=Vm () / Vm  ,                                        (3.8.1)

де      Vm() - область перетину класу    з класом  lm;

          Vm - обсяг контейнера класу  ;

і множинний коефіцієнт перетину для класу  X:

                           qm,1..r=Vm(X  X) / Vmlm ,                        (3.8.2)

де      r - кількість перетинів для класу X,  r < M–1.

При прийнятті гіпотези нечіткої компактності реалізацій образів обчислення характеристик (3.8.1) і (3.8.2) у рамках МФСВ не викликає ускладнень, оскільки контейнери класів розпізнавання будуються в радіальному базисі і їх геометричні параметри визначаються в процесі навчання системи за ітераційною процедурою пошуку максимуму інформаційного критерію. Розглянемо твердження, які встановлюють вплив потужності абетки    на достовірність рішень, що приймаються.

Т в е р д ж е н н я 3.8.1.  Нехай у бінарному просторі  WБ ознак розпізнавання потужності  N  здійснюється за МФСВ нечітке розбиття на  M  класів, в якому задано множину вершин еталонних векторів  , і відома кодова відстань між центрами сусідніх класів  d(xmxl), то парний коефіцієнт  h m, l  перетину класу    з класом    залежить як від міжцентрової відстані класів розпізнавання, так і від середньоквадратичних відхилень реалізацій класів, що перетинаються.

Д о в е д е н н яНехай випадковий вектор-реалізація образу має нормальний розподіл. Для наглядності розглянемо дві системи двох випадкових величин  (N=2)  з  функціями щільності розподілу  f(x1, x2)  і  f l (x1, x2),  центрами розсіювання яких є відповідно вершини векторів  xm  і  xl. Відомо, що перерізи поверхні розподілу двох випадкових величин, проведені паралельно функції щільності, аналогічні кривим нормального розподілу для однієї випадкової величини. На рис.3.10  наведено такий переріз поверхней розподілу для функцій  f( x1, x2)  і  f l (x1, x2)  з дисперсіями    і   (<),  який проходить через їх центри розсіювання.

Рис.  3.10.  Переріз функції щільності ймовірностей для класів    і

Парний коефіцієнт перетину класів (3.8.1) у ймовірнісній інтерпретації, згідно з рис. 3.10, має вигляд:

h m ,l = ,                           (3.8.3)

оскільки областями класів    і є симетричні інтервали  [xm-dm;  xm +dm]  і   [xl - (xl – (xm+ dm));  xl+ (xl – (xm+ dm))]  відповідно.

З урахуванням властивості функції нормального розподілу:          Ф(-x)=1-Ф(x),  отримаємо