Класифікаційний аналіз даних: Навчальний посібник, страница 3

Третя задача оцінки функціональної ефективності СППР пов'язана з проблемою вибору та обчислення КФЕ. До цього часу все ще відсутній єдиний підхід до вибору виду та структури КФЕ. Можна тільки виділити два основних підходи до оцінювання функціональної ефективності, один із яких базується на економічних показниках, а інший - на інформаційних. Проміжним є підхід, що базується на узагальненому КФЕ, що оцінює дві складові ефективності: інформаційну здатність системи та зведену вартість її функціонування [7, 9]. Оскільки класифікація здійснюється за критерієм схожості, а мірою відображеної різноманітності, що має ціннісний аспект, є кількість інформації, то застосування інформаційного КФЕ СППР є природним. Підтвердженням цього є встановлений вченими-фізіологами той факт, що живий мозок приймає рішення не шляхом послідовного перебору варіантів, а за спрямованим планом, який веде до чітко усвідомленої мети. При цьому людина розв'язує задачі деяким найкращим оптимальним способом. А оскільки критерій оптимальності рішень, які приймає людина, обумовлений усвідомленою метою, то він має інформаційну природу, бо процес усвідомлення - це інформаційний процес.

     Четверта задача є центральною при розв'язанні задачі інформаційного синтезу СППР. Параметрами функціонування СППР виступають показники, які є результатом обробки  структурованих вхідних даних і які безпосередньо впливають на точнісні характеристики системи. Нехай елементами впорядкованого вектора  є параметри функціонування СППР, які оптимізуються. Оскільки інформаційний КФЕ є функціоналом точнісних характеристик, від яких його значення в робочій області залежать однозначно, то задача інформаційного синтезу СППР полягає в знаходженні такого вектора , при якому критерій Е досягає максимального значення, тобто

    ,                  (В.1)

де область існування параметрів  G задається системою нерівностей  .

     Як параметри СППР, що регулюються, слід розглядати в першу чергу параметри навчання системи, які впливають безпосередньо на асимптотичну ефективність її функціонування. Такими параметрами є, наприклад, геометричні параметри РГП класів розпізнавання, система контрольних допусків на ознаки розпізнавання, рівні селекції даних, які є рівнями квантування навчальної вибірки, еталонні вектори класів розпізнавання та інше. Послідовність оптимізації параметрів навчання визначається планом навчання, параметри якого теж можуть, в свою чергу, виступати  як параметри СППР, що регулюються. Взагалі визначення параметрів функціонування СППР потребує ретельного фахового аналізу на етапі апріорного моделювання.

     Розв’язання п’ятої задачі зниження розмірності ознакового простору Ω дозволяє збільшити оперативність алгоритмів класифікації і достовірність розпізнавання за рахунок виключення «завадових» ознак, які обумовлені впливом внутрішніх і зовнішніх завад, як випадкових, так і організованих. Передумовою постановлення такої задачі є сильна залежність ознак розпізнавання, їх дублювання, можливість їх агрегатування, наприклад, шляхом об’єднання, складання, групування та інше, а  також їх різна інформаційна завантаженість (інформативність). Формальне постановлення задачі зниження розмірності ознакового простору полягає в такому. Нехай дана вхідна впорядкована вибіркова послідовність: , де  - первинні ознаки,  - вторинні ознаки. Нехай певним чином задана міра інформаційної здатності СППР . Треба вибрати таку послідовність , де   i  , щоб   у класі допустимих перетворень первинних ознак . У випадку  розв’язок цієї задачі є неоптимальним в інформаційному сенсі.

     Зниження розмірності ознакового простору Ωможе здійснюватися з такою метою:

·    забезпечення наочного подання (візуалізація) вихідних даних;

·    суттєве стиснення обсягів інформації для підвищення оперативності обробки та ємності її зберігання;

·    відбір інформативних ознак і вилучення неінформативних «завадових» ознак розпізнавання.

Шоста задача інформаційного синтезу СППР полягає в проведенні розвідувального аналізу.

     Визначення В.3 Розвідувальний аналіз - сукупнісь моделей і методів аналізу багатовимірних вхідних даних шляхом їх відображення в простір меншої розмірності із збереженням істотних їх структурних особливостей.

     Ця задача набуває особливого значення, коли невідома належнісь вхідної вибіркової послідовності до конкретного класу розпізнавання. Суть методів розвідувального аналізу полягає у відображенні  даних на простір  меншої розмірності   q (звичайно ) з метою пошуку найбільш виразних проекцій, за якими приймається остаточне рішення, наприклад, для  за гістограмами, для  за діаграмами розсіювання, для  за тривимірними графічними зображеннями. При цьому сучасна комп’ютерна графіка надає можливості візуалізації даних в інтерактивному режимі та з високою оперативністю.