Результаты описанного метода зависят от геометрических характеристик данных, а также от значения пороговой величины Т и порядка просмотра объектов.
Поэтому получение хороших результатов с помощью этого метода требует многочисленных экспериментов с различными значениями порога и порядком просмотра объектов.
При этом следует придерживаться следующих рекомендаций:
1. Поскольку обычно изучаемые объекты имеют высокую размерность, и визуальная интерпретация результатов исключается, то необходимая информация может быть получена при помощи составления после каждого цикла просмотра данных таблиц расстояний, разделяющих центры кластеров, и таблиц количества объектов, вошедших в различные кластеры.
2. При выполнении очередного просмотра данных в первую очередь просматриваются точки наиболее близкие к центрам кластеров, а затем все остальные.
3. Если число полученных кластеров велико, следует увеличивать Т при очередном применении алгоритма.
Написать программу для классификации объектов методом реализации алгоритма выявления кластеров.
Для проверки работоспособности программы по своему варианту (номер в журнале) ввести исходные данные, распечатать листинг программы, таблицу исходных данных и результатов. При выполнении задания к значениям X1 в четных вариантах 1 прибавляется 1, в нечетных - отнимается 1 . К значениям X2 в 2 четных номерах прибавляется 1.
1. Смоделировать распознающую систему , написать и отладить программу для классификации объектов с произвольными значениями признаков. Программа должна запрашивать у пользователя значения обучающей выборки (или читать их из файла), выдавать на экран или принтер исходные данные и результат классификации.
2. Для проверки работоспособности программы по своему варианту (номер в журнале) ввести исходные данные, распечатать листинг программы, таблицу исходных данных и результатов. При выполнении задания к значениям X1 в четных вариантах 1 прибавляется 1, в нечетных - отнимается 1 . К значениям X2 в 2 четных номерах прибавляется 1.
3. Сделать выводы о применимости метода.
4. Оформить отчет, в котором привести листинг программы, копии экранов и результаты работы программы. Сделать выводы о применимости метода.
Наименование и цель работы; основные положения кратких сведений из теории; индивидуальное задание, в котором привести листинг программы, копии экранов и результаты работы программы. Вывод по работе.
Контрольные вопросы
1. Сформулируйте, какие достоинства и недостатки имеет простейший алгоритм выявления кластеров.
2. Примените простейший алгоритм отыскания кластеров к следующему множеству данных { =(0,0), =(0,1), =(5,4), =(5,5), =(4,5), =(1,0)}.
3. Вычислите значения критерия Q для полученного в задаче 2 разбиения объектов на классы.
4. Составьте и проанализируйте таблицы расстояний между центрами кластеров, количества объектов в классах и дисперсий значений признаков в каждом классе.
Цель работы: Изучить метод объединения, выявить преимущества и недостатки метода. Написать программу, позволяющую классифицировать объекты методом объединения.
Сущность метода объединения заключается в объединении ближайших точек в одну с учетом их весов. Для этого задается число классов m. Сначала все точки классифицируемой выборки имеют единичный вес. Среди них отыскиваются две ближайшие точки и , объединяющиеся в одну, расположенную в их центре тяжести:
,
которая включается в выборку с весом 2 вместо точек и и т. д. Если в процессе такого объединения встречаются точки и с весами Wi и Wj, то они объединяются в одну, расположенную в их центре тяжести
,
которая записывается в выборку с весом Wi + Wj.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.