Дискриминантный и кластерный анализ в системе Statistica, страница 2

«высокий»: -518,344+15,447*ВВП-42,861*РАСХЗДРА-1,195*ЧИСВРАЧ+7,564*СМЕРТНОС.

Аналогично для остальных.

Если подставить значения соответствующих показателей классифицируемых стран нашего примера в формулы, то можно приписать наблюдение к той группе, для которой оно имеет максимальное классификационное значение.

Страна

ВВП

РАСХЗДРА

ЧИСВРАЧ

СМЕРТНОС

Классификационные значения для групп

Групповая принадлежность наблюдения

«высокий»

«удовлетв»

«низкий»

Россия

Казахстан

Греция

Дания

20,4

13,4

44,4

79,2

3,2

3,3

5,7

6,7

44,5

38,1

41,5

36,7

84,98

69,04

32,84

34,07

249,26

23,92

122,03

631,77

348,43

214,02

155,08

361,52

351,03

222,08

144,16

323,99

низкий

низкий

удовлетв.

высокий

Итак, уровень медицинского обеспечения в Дании ближе к развитым европейским странам (высокий), в Греции - удовлетворительный, а Россия и Казахстан попали в группу «низкий» уровень.


Шаг 7. Кнопка Квадраты расстояний Махаланобиса показывает квадрат расстояний от каждого наблюдения до центров тяжести групп. Понятно, что наименьшее расстояние определяет групповую принадлежность наблюдения.

Шаг 8. Рассмотрим опцию Апостериорные вероятности, которая показывает рассчитанную на основе расстояния Махаланобиса вероятную принадлежность конкретного наблюдения к какому-либо классу.

Их практическое значение состоит в том, чтобы отнести наблюдение к конкретной группе, для которой они имеют максимальное значение.

Значение апостериорной вероятности равное 1 говорит о том, что наблюдение с вероятностью 100% принадлежит этому классу.

Шаг 9. Определение классовой принадлежности новых наблюдений.

При рассмотрении квалификационных функций мы уже упоминали об одном из способов определения принадлежности новых наблюдений в той или иной группе. Напомним, что в полученные функции подставлялись соответствующие значения показателей рассматриваемых наблюдений и вычислялись классификационные значения. Максимальное из них указывало на принадлежность к этому классу.

Теперь рассмотрим остальные возможные способы определения классификационной принадлежности новых наблюдений.

Вернемся к таблице с исходными данными и добавим в неё страны: Россию, Казахстан, Данию и Грецию. Графу УРОМЕОБ оставим незаполненной так, как показано ниже.


Шаг 10. Проверим результаты с помощью опции Квадраты расстояний Махаланобиса.

Как видим, полученные нами выше результаты оказались верными - Россия и Казахстан попали в группу с низким уровнем обеспечения (их минимальные расстояния до этой группы 168,47 и 19,03 соответственно), Греция - с удовлетворительным уровнем обеспечения, а Дания - с высоким.

Шаг 11. Еще один способ определения групповой принадлежности новых наблюдений связан с опцией Апостериорные вероятности классификации.


Исходя из анализа данных, можно утверждать, что наблюдения «Россия» и «Казахстан» относятся к классу «низкий уровень» с вероятностями 0,93 и 0,99 соответственно. Греция с вероятностью 0,99 попала в удовлетворительный уровень, а Дания на все 100% - в высокий.

Шаг 12. Графическая интерпретация.

Таким образом, решить поставленную задачу отнесения новых наблюдений к той или иной группе можно, воспользовавшись следующими опциями:

·  функции классификации;

·  квадраты расстояний Махаланобиса;

·  апостериорные вероятности классификации.


Задания для самостоятельной работы.

Задача №1. На основе анализа данных за последние пять лет, характеризующих урожайность зерновых культур, сельскохозяйственные предприятия области были условно разбиты на две группы: с «высоким» уровнем урожайности и «низким». Используя возможности дискриминантного анализа, классифицируйте три последних сельхозпредприятия.