В итоге оба решения дают точную классификацию: в оконечных узлах (Terminal Nodes; на экране они имеют красный цвет) имеются только ситуации одного типа, что видно из гистограмм, изображенных внутри оконечных узлов. Фактически, на рис. Рис. 47 последними ветвлениями была исправлена возникшая ошибка.
После некоторого экспериментирования со значениями параметров программы, из нескольких деревьев, имеющих различное количество узлов, следует выбрать окончательное. В данном случае это просто: оба дерева дают точное решение, следует выбрать из них наиболее простое, то есть изображенное на рис. Рис. 48.
По получившемуся дереву можно сформулировать и окончательные правила принятия решения. Они имеют следующий вид.
Если относительное значение потенциала не больше единицы,
то если относительное значение цены не больше единицы,
то цена пересматривается,
иначе не пересамтриватся.
Если относительное значение потенциала больше единицы,
то если относительная цена не больше единицы,
то цена не пересматривается,
иначе пересматривается.
Это соответствует описанию задачи, то есть можно сказать, что сущность проблемы была правильно выявлена компьютером по имеющимся случаям.
В формате, близком к формату универсального языка программирования, полученный результат выглядит следующим образом.
Если относительное значение потенциала не больше единицы, то
если относительное значение цены не больше единицы, то
цена пересматривается,
иначе
цена не пересматривается,
иначе
если относительная цена не больше единицы, то
цена не пересматривается,
иначе
пересматривается.
Наконец, в формате функций рабочего листа Excel то же можно записать как
=ЕСЛИ(ПОТЕНЦИАЛ<=1;ЕСЛИ(ЦЕНА<=1; «ПЕРЕСМАТРИВАТЬ»; «НЕ ПЕРЕСМАТРИВАТЬ);ЕСЛИ(ЦЕНА<=1;
«НЕ ПЕРЕСМАТРИВАТЬ»; «ПЕРЕСМАТРИВАТЬ»))
Таким образом, полученные правила легко интерпретируются и используются в различных системах автоматизации управленческой деятельности.
Кроме того, и здесь видна роль предварительной визуализации данных. Пример продемонстрировал также необходимость перебора различных режимов для получения различных вариантов и последующего выбора наилучшего. В реальных случаях этот выбор не столь прост, так как данные «зашумлены», ситуации с различными решениями перепутаны. Это повышает важность задания параметров допустимой ошибки и правил остановки ветвлений, чтобы результат не оказался переусложненным.
Полученные правила могут быть использованы в экспертной системе. В реальных случаях экспертная система маркетингового аудита содержит большое число подобных правил.
Однако разработка экспертных систем через деревья классификации не совсем типична. Чаще экспертная система воплощает опыт экспертов-людей. Поэтому правильнее было бы взять в качестве источника правил таблицу решений для рассматриваемого примера, а из нее получить правила, аналогичные вышеприведенным.
Эту же задачу построения классификатора можно решить с помощью программы построения нейронных сетей. Как отмечалось в теоретической части книги, нейронная сеть имеет две составляющие: структуру (количество и способ вязи нейронов) и параметры каждого нейрона (веса входов и значения порога). Хотя в общем случае структура нейронной сети заранее неизвестна, в данном случае это не так. Рассматриваемая задача относится к хорошо изученным примерам, часто применяемым для демонстрации возможностей нейронных сетей – так называемая проблема «исключающего или» (XOR problem). Структура сети имеет вид рис. Рис. 49 [82]. (На этом рисунке I – входы, N – нейроны, O – выходы). Поэтому вначале будет происходить только настройка параметров сети известной структуры. В качестве входного набора данных и правильного решения используется та же таблица обучающих ситуаций, что и во всех предыдущих примерах.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.