Аналіз проблеми інформаційного синтезу систем керування, що навчаються, страница 12

В основу переважної більшості алгоритмів класифікації покладено гіпотезу компактності реалізацій образу, яка поділяється на гіпотези “унімодальної”, “полімодальної” і “локальної” компактності, а відносно проекцій реалізацій образу на координатні вісі вона поділяється на відповідні проективні компактності. Згідно з працями [71,90] гіпотеза компактності полягає в тому, що реалізації одного класу відображаються в просторі ознак у геометрично близькі точки, утворюючи “компактні” згущення. Існують різні міри компактності реалізацій образу. Так, у найпростішому випадку можна вважати , що реалізації компактні, якщо відстань між векторами- реалізаціями образу не перевищує деяку порогову величину  c.

У загальному випадку під впливом випадкових факторів реалізації одного і того самого образу можуть опинитися далеко одна від одної, а реалізації “чужого“ образу навпаки наблизитись і навіть збігтися із “своїми” реалізаціями. У розпізнаванні образів такий випадок характеризується за термінологією       М.Г. Загоруйка [71] як “погано організований образ”, який необхідно шляхом його нормалізації перетворити в “добре організований образ” з метою застосування відомих детермінованих або статистичних класифікаторів. При цьому штучно усуваються із розгляду алфавіти, класи яких перетинаються через наявність в їх векторах-реалізаціях однакових ознак розпізнавання, що є характерним для більшості практичних задач контролю та керування слабо формалізованими процесами. Тому об’єктивно виникає необхідність класифікації компактності на чітку і нечітку компактності реалізацій образу як це вже застосовується відносно таких топологічних категорій, як класи, розбиття, покриття та простір [155-160]. Сформулюємо необхідні та достатні умови нечіткої компактності реалізацій образу в задачах розпізнавання образів.

Позначимо множину реалізацій образу    через  A, а факт компактності реалізацій у підмножині    через . Відповідно позначимо множину реалізацій найближчого сусіднього класу    через  B, а нову реалізацію образу    через  b. Тоді необхідну умову компактності реалізацій образу можна характеризувати предикатним виразом:

.

Для виконання достатньої умови компактності потрібно, щоб реалізації множини  Bне належали множині  A. Цей факт позначимо як  . Тоді має місце визначення чіткої компактності реалізацій образу, яке збігається з умовами компактності, сформульованими в праці [71].

Визначення 1.4.1.Компактність реалізацій образу називається чіткою, якщо її необхідні та достатні умови задаються таким предикатним виразом:

.

Нехай підмножина реалізацій    належить множині  A. Позначимо цей факт як  . Тоді має місце таке визначення нечіткої компактності.

Визначення 1.4.2.Компактність реалізацій образу називається нечіткою, якщо її необхідні та достатні умови задаються предикатним виразом:

,

де      – нечітка множина.

Гіпотезу унімодальної чіткої компактності покладено в основу чисельних алгоритмів автоматичної класифікації, які використовують поняття “ядро класу” і відновлюють роздільні гіперповерхні в радіальному базисі простору ознак [53,72]. Значне місце серед них належить таксономічним алгоритмам типу Форель [69-71], за допомогою яких у радіальному базисі будуються таксони. При цьому ядра таких таксонів збігаються з їх геометричним центром. В алгоритмах типу Форель єдиним керуючим параметром є поріг – радіус куль, якими покривається вибірка реалізацій  Х. Нехай   – куля радіуса  rз центром у точці  e. Підвибірка Х(1)=Х   називається незміщеною в  , якщо її вибіркове середнє збігається з точкою  e. Класифікація за алгоритмом Форель  відбувається за декілька послідовних етапів. На першому етапі у вибірці  Х  відокремлюється незміщена відносно деякої кулі    підвибірка  , яка оголошується першим таксоном. На другому етапі ця процедура застосовується до вибірки  Х\  і так до тих пір, поки не будуть побудовані таксони для всієї вибірки.