Классификация объектов с использованием теории распознавания образов: Методические указания для самостоятельных занятий по подготовке к лабораторным работам по курсу «Техническая кибернетика», страница 9

Результаты описанного метода зависят от геометрических характеристик данных, а также от значения пороговой величины Т и порядка просмотра объектов.

Поэтому получение хороших результатов с помощью этого метода требует многочисленных экспериментов с различными значениями порога и порядком просмотра объектов.

При этом следует придерживаться следующих рекомендаций:

1.  Поскольку обычно изучаемые объекты имеют высокую размерность, и визуальная интерпретация результатов исключается, то необходимая информация может быть получена при помощи составления после каждого цикла просмотра данных таблиц расстояний, разделяющих центры кластеров, и таблиц количества объектов, вошедших в различные кластеры.

2.  При выполнении очередного просмотра данных в первую очередь просматриваются точки наиболее близкие к центрам кластеров, а затем все остальные.

3.  Если число полученных кластеров велико, следует увеличивать Т при очередном применении алгоритма.

2 Индивидуальное задание

Написать  программу для классификации объектов методом реализации алгоритма выявления кластеров.

Для проверки работоспособности программы по своему варианту  (номер в журнале) ввести исходные данные, распечатать листинг программы, таблицу исходных данных и результатов. При выполнении задания к значениям X1 в четных вариантах 1 прибавляется 1, в нечетных - отнимается 1 . К значениям X2 в 2 четных номерах прибавляется 1.

3 Порядок выполнения работы

1.  Смоделировать распознающую систему ,  написать и отладить программу для классификации объектов с произвольными значениями признаков. Программа должна запрашивать у пользователя значения обучающей выборки (или читать их из файла), выдавать на экран или принтер исходные данные и результат классификации.

2.  Для проверки работоспособности программы по своему варианту  (номер в журнале) ввести исходные данные, распечатать листинг программы, таблицу исходных данных и результатов. При выполнении задания к значениям X1 в четных вариантах 1 прибавляется 1, в нечетных - отнимается 1 . К значениям X2 в 2 четных номерах прибавляется 1.

3.  Сделать выводы о применимости метода.

4.  Оформить отчет, в котором привести листинг программы, копии экранов и результаты  работы программы. Сделать выводы о применимости метода.

Содержание отчета

Наименование и цель работы; основные положения кратких сведений из теории; индивидуальное задание, в котором привести листинг программы, копии экранов и результаты  работы программы. Вывод по работе.

 Контрольные вопросы

1.  Сформулируйте, какие достоинства и недостатки имеет простейший алгоритм выявления кластеров.

2.  Примените простейший алгоритм отыскания кластеров к следующему множеству данных { =(0,0), =(0,1), =(5,4), =(5,5), =(4,5), =(1,0)}.

3.  Вычислите значения критерия Q для полученного в задаче 2 разбиения объектов на классы.

4.  Составьте и проанализируйте таблицы расстояний между центрами кластеров, количества объектов в классах и дисперсий значений признаков в каждом классе.

Лабораторная работа № 6

МЕТОД ОБЪЕДИНЕНИЯ.

      Цель работы: Изучить метод объединения, выявить преимущества и недостатки метода. Написать  программу, позволяющую классифицировать объекты  методом объединения.

1 Краткие сведенья из теории

Сущность метода объединения заключается в объединении ближайших точек в одну с учетом их весов. Для этого задается число классов m. Сначала все точки классифицируемой выборки имеют единичный вес. Среди них отыскиваются две ближайшие точки  и , объединяющиеся в одну, расположенную в их центре тяжести:

,

которая включается в выборку с весом 2 вместо точек и и т. д. Если в процессе такого объединения встречаются точки  и с весами Wi и Wj, то они объединяются в одну, расположенную в их центре тяжести

,

которая записывается в выборку с весом Wi + Wj.