Перша і друга задачі є типовими задачами математичної статистики [2,72]. Специфіка другої задачі полягає в тому, що для аналізу результатів спостережень за множиною об’єктів з метою виявлення емпіричних закономірностей даних розглядаються тільки такі багатовимірні структури, які може бути подано або у вигляді матриць типу (1.6.1), або у вигляді матриць відношень (попарних порівнянь) між об’єктами. У загальному випадку матриця (1.6.1) може бути тривимірною (наприклад, при квантуванні значень ознак розпізнавання у часі) і чотирьохвимірною (при квантуванні як у часі, так і за рівнем). У матриці відношень елемент аk,l визначає результат співставлення об’єктів i в розумінні деякого заданого відношення: схожості (відмінності), взаємозв’язку, переваги, відстані та інше. Поряд з такими видами взаємозв’язків між компонентами багатовимірної структури даних, як кількісні, якісні (некількісні), змішані (різновидові) і порядкові, які досліджуються класичними методами статистичного аналізу, об’єктом дослідження класифікаційного аналізу даних є, насамперед, класифікаційний взаємозв’язок. Саме цей тип взаємозв’язку дозволяє розбивати досліджувану множину об’єктів на підмножини, які знаходяться між собою у певному відношенні еквівалентності.
Рис. 1.6. Основні типові задачі інформаційного синтезу СК,
що навчається
Третя задача оцінки функціональної ефективності СК, що навчається, пов'язана з проблемою вибору та обчислення КФЕ. До цього часу все ще відсутній єдиний підхід до вибору виду та структури КФЕ. Можна тільки виділити два основних підходи до оцінювання функціональної ефективності, один із яких базується на економічних показниках [191,192], а інший – на інформаційних [189,190,194]. Об’єднуючим є підхід, що базується на узагальненому КФЕ, який дозволяє оцінювати дві складові ефективності: інформаційну здатність системи та зведену вартість її функціонування [193]. Оскільки класифікація здійснюється за критерієм схожості, а мірою відображеної різноманітності, що має ціннісний аспект, є кількість інформації, то застосування інформаційного КФЕ системи є природним.
Четверта задача є центральною при розв'язанні задачі інформаційного синтезу СК, що навчається. Як параметри функціонування інтелектуальної СК виступають її просторово-часові характеристики, які прямо або непрямо впливають на точнісні характеристики системи. Як параметри, які регулюються, слід розглядати, в першу чергу, параметри навчання системи, які впливають безпосередньо на асимптотичну ефективність її функціонування. Послідовність оптимізації параметрів навчання визначається планом навчання, параметри якого теж можуть, в свою чергу, виступати як параметри функціонування СК, що регулюються. Взагалі, визначення параметрів, які впливають на ефективність функціонування інтелектуальної СК, потребує ретельного системного аналізу на етапі апріорного моделювання.
Розв’язок п’ятої задачі пониження розмірності ознакового простору, що аналізується, дозволяє збільшити оперативність алгоритмів класифікації і достовірність розпізнавання за рахунок виключення «заважаючих» ознак, які обумовлені впливом внутрішніх і зовнішніх завад, як випадкових, так і організованих, наприклад, з метою дезінформації. Передумовою постановки такої задачі є сильна залежність ознак розпізнавання, їх дублювання, можливість їх агрегатування, наприклад, шляхом об’єднання, складання, групування та інше, а так само їх різна інформаційна навантаженість (інформативність). Формальна постановка задачі пониження розмірності ознакового простору така. Нехай дана вхідна впорядкована вибіркова послідовність: , де – первинні ознаки, – вторинні ознаки. Нехай задана міра інформаційної спроможності СК – . Треба вибрати таку послідовність , де i , щоб у класі допустимих перетворень первинних ознак . У випадку розв’язок цієї задачі є неоптимальним в інформаційному розумінні.
Пониження розмірності ознакового простору Ω може здійснюватися з наступною метою:
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.