1. Во вводимой таблице данных строки соответствуют вопросам, столбцы – респондентам. Поэтому переменные можно назвать, например, Респ1, Респ2, …
2. Вводить переменную для обозначения наблюдений необязательно.
3. Для анализа следует выбрать все переменные.
4. Кластеризация проводится среди переменных (респондентов).
5. Вывод можно ограничить дендрограммой.
6. Используется метод кластеризации Furthest neighbor.
7. Используется мера расстояния Pearson correlation (корреляция Пирсона) или Squared Euclidian distance (квадратичное евклидово расстояние).
8. Интерпретация данных проводится аналогично интерпретации рис. 9.
9. Результатом анализа должны стать кластеры, являющиеся основой сегментов. По ним следует сделать описание отличительных признаков сегментов и выбрать сегмент, для которого будет проведена разработка журнала:
если, например, респонденты одного кластера схожи своим высоким интересом к некоторым вопросам современной науки и не проявляют интереса к другим отраслям знаний, то они образуют перспективный сегмент читателей. Для них довольно легко определяется тематика журнала;
если респонденты объединились в отсутствии интереса к знаниям, то их лучше пока не рассматривать, так как заинтересовать их рассказами о научных достижениях будет непросто;
наконец, если респонденты кластера интересуются всем подряд, то удовлетворить их будет не так то просто: для них журнал должен стать разносторонним. Это означает, что понадобятся разносторонние авторы, рецензенты, редакторы и другие специалисты. С другой стороны, если этот сегмент велик, журнал имеет перспективу хорошо продаваться.
10. Примите обоснованное решение о том, на какой сегмент ориентироваться. Далее разработка журнала производится только для выбранного сегмента.
11. Посмотрите, понравится ли представителям других сегментов тот журнал, который Вы разработали.
Как Вы уже, наверное, догадались, начальным шагом кластерного анализа является автоматический расчет матрицы расстояний между элементами исследования. Но такую матрицу можно ввести и вручную.
Вот пример, когда это может оказаться необходимым. Пусть организация занимается торговлей на некоторой территории с несколькими населенными пунктами. Это может быть страна, регион, область. Имеется таблица расстояний между населенными пунктами[20].
Торговые представители обслуживают по нескольку населенных пунктов. Подразумевается, что число перемещений из пункта в пункт в пределах обслуживаемой территории происходит очень часто и из произвольного пункта в произвольный. Требуется распределить зоны обслуживания таким образом, чтобы перемещения между населенными пунктами были бы минимальными.
Из постановки задачи видно, что надо найти кластеры населенных пунктов, близко расположенных друг к другу.
Для решения поставленной задачи следует ввести матрицу расстояний между городами, взяв ее из атласа автомобильных дорог. При выполнении практического занятия допускается использование условных или приближенных данных.
Матрица – особая структура данных в SPSS.
Первый ее столбец, под именем rowtype_ (пишите именно так, как приведено здесь, с символом подчеркивания на конце!) содержит тип матрицы. Задайте для каждой строки значение PROX (Proximity Matrix – матрица сходства).
Второй столбец, имеющий имя varname_, должен содержать названия населенных пунктов.
Остальные столбцы имеют имена, соответствующие населенным пунктам, причем строго в том же порядке и строго в том же написании, что и в столбце varname_.
Данные заполняются на основе таблицы расстояний в километрах. Главная диагональ матрицы заполняется нулями (расстояние от пункта А до пункта А равно нулю).
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.