Построение деревьев классификации с помощью трех методов

Страницы работы

Содержание работы

МИНИСТЕРСТВО НАУКИ И ОБРАЗОВАНИЯ УКРАИНЫ

ХАРЬКОВСКИЙ НАЦИОНАЛЬНЫЙ ЭКОНОМИЧЕСКИЙ УНИВЕРСИТЕТ

Кафедра экономической кибернетики

ОТЧЕТ

По лабораторной работе №7

На тему: «Построение деревьев классификации»

                                                                                       Выполнила:

Студентка ФФ 5-14

                                                                                                    Романова Е.Н.

                                                                                       Проверила:

Харьков-2008


Деревья классификации

Деревья классификации представляют собой группу методов, которые позволяют восстановить систему показателей, отношений между ними и их иерархию в соответствии с которой происходит классификация объектов.

Алгоритм построения дерева классификации:

1. Выявление признаков.

2. Кодирование признаков.

3. Построение матрицы соответствий.

4. Признак с наибольшей дискриминирующей силой – тот признак, для которого значение правильной дроби (класс1/класс2) является минимальным.

5. Построение текущего уровня классификации.

Последние 2 шага повторяются для получаемых подмножеств до построения удовлетворительного разделения объектов.

6. Построение обобщенных правил.

Для каждого получаемого подмножества выписываются логические условия, соответствующие прохождению от вершины дерева до данного подмножества, после чего, полученные условия для объектов 1 класса объединяются в общее правило.

На первом этапе необходимо стандартизировать исходные данные и разбить совокупность на несколько кластеров (2).

Рис.1. Матрица исходных данных.

Далее необходимо выбрать зависимую и независимые переменные. В данном случае зависимой является переменная CLUSTER, а независимыми – переменные Х1, Х2, Х3, Х4, Х5, Х6.

Рис.2. Независимые и зависимая переменные.

Для построения дерева классификации необходимо задать параметры построения, выбрать метод исследования и т.д.

Рис.3. Исходные данные для построения дерева классификации.

Сначала выбираем первый метод исследования.

Рис.3. Методы исследования.

С помощью данного метода построим дерево классификации.

Рис.4. Дерево классификации (метод 1).

 


Рис.5. Структура дерева.

Определим количество наблюдений относящихся к разным классам.

Рис.6. Количество наблюдений относящихся к разным классам.

Рис. 7. Определение правильности классификации наблюдений.

Из рис.7. следует, что неправильно классифицированных наблюдений нет.

Проведем построение дерева классификации с помощью второго метода исследования и сравним полученные результаты с полученными при исследовании с помощью первого метода.

Рис.8. Методы исследования.

Рис. 9. Определение правильности классификации наблюдений.

Неправильно классифицированных наблюдений нет.

С помощью данного метода построим дерево классификации.

Рис.10. Дерево классификации (метод 2).

Определим количество наблюдений относящихся к разным классам.

Рис.11. Количество наблюдений относящихся к разным классам.

Рис.12. Структура дерева.

          Результат построения с помощью второго метода полностью совпадает с результатом построения с помощью первого метода.

Проведем построение дерева классификации с помощью третьего метода исследования и сравним полученные результаты с результатами, полученными при исследовании с помощью первого и второго методов.

Рис.13. Методы исследования.

Рис.14. Структура дерева.

Рис.15. Задаем структуру дерева.

С помощью данного метода построим дерево классификации.

Рис.16. Дерево классификации (метод 3).

В результате выполнения исследования оказалось, что результаты построения деревьев классификации с помощью трех методов совпадают. Это является положительным моментом, поскольку свидетельствует о том, что дерево классификации построено правильно.

Похожие материалы

Информация о работе