6. Задайте вывод статистик. Щелчком по кнопке Statistics... откройте диалоговое окно Hierarchical Cluster Analysis: Statistics (Иерархический кластерный анализ: Статистики) и установите флажок Agglomeration schedule (последовательность слияния).
7. Задайте режимы вывода графической информации. Для этого щёлкните по кнопке Plots... (Диаграммы). Установите флажок Dendrogram (древовидная диаграмма) и посредством радиокнопки None (Нет) в рамке Icicle (сосулькообразная[16] [диаграмма]) отмените вывод диаграммы кластеризации.
8. Вызовите окно задания метода кластеризации, нажав кнопку Method… В поле Cluster method (метод кластеризации) выберите Between groups linkage (связь между группами), в рамке Measure (мера [расстояния]) около выделенной радиокнопки Interval (интервальная [шкала])[17] выберите Squared Euclidian distance (квадрат евклидова расстояния)[18].
9. Для использования стандартизации переменных в рамке Transform Values (преобразовывать переменные) выберите в поле Standartize (стандартизировать) значение Z-scores (z-шкалы) и установите радиокнопку By variable (по переменной): в данном случае требуется нормализировать положение элементов исследования на осях координат.
10. Выполните анализ. Вернувшись в главное диалоговое окно, начните расчёт нажатием кнопки ОК. Найдите в окне результатов
- Agglomeration schedule (ход объединения) рис. 6;
- Dendrogram (дендрограмма) рис.7.
Для определения, выбираемого количества кластеров решающее значение имеет показатель, выводимый под заголовком Coefficient (коэффициент).
В примере это квадрат евклидового расстояния между объединяемыми на каждом шаге кластерами, определенный с использованием стандартизованных значений.
Если оказывается, что на каком-либо шаге коэффициент увеличивается скачкообразно, кластеризацию обычно прекращают, так как далее происходит объединение элементов, находящихся на относительно большом расстоянии друг от друга.
Изменение коэффициента по шагам кластеризации отображено на рис. 8. Такой график можно построить с помощью Excel, скопировав в нее столбец значений коэффициента.
Рис. 6. Таблица хода объединения
Рис. 7. Дендрограмма кластеризации
Видно, что резкого скачка не происходит. Однако можно условно считать, что девятый шаг уже заметно увеличивает коэффициент, поэтому он и является «лишним»: кластеризацию следует остановить на шаге 8. Количество кластеров, которые получаются в данном случае, равно числу элементов исследования (исследовалось 11 организаций, которые и объединялись в кластеры) минус номер последнего шага (8). Таким образом, рекомендованное число кластеров равно 3, что совпадает с исходным визуальным наблюдением.
Дендрограмма (рис.7) визуализирует процесс слияния, приведенный в обзорной таблице хода кластеризации. Для каждого шага кластеризации она показывает объединённые кластеры и значения коэффициентов, приведенные к шкале от 0 до 25.
Некоторые типы дендрограмм и соответствующие им расположения точек элементов исследования изображены на рис.9.
Рис. 9, а отражает ситуацию, когда элемент 1 близок к элементу 3, о чем говорит близость соединяющей их линии к левому краю дендрограммы. Расстояние между элементами 2 и 4 также мало, но они расположены чуть дальше друг от друга: линия, соединяющая их, расположена правее. Элемент 5 довольно близок к элементам 2 и 4 (линия, связывающая кластер 2—4 и элемент 5 расположена довольно низко). Наконец, пара элементов 1 и 3 далеко отстоит от всех остальных (линия, связывающая кластер 1—3 и кластер 2—4—5 расположена справа). Таким образом, в качестве основы для сегментирования элементов можно взять пару 1—3, а также тройку 2—4—5.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.