Анализ временных рядов и прогнозирование в системе STATGRAFICS, страница 10

В области Method(Метод) установим переключатель FurthestNeighbor (Дальнего соседа), т.е. кластеризация   будет проводиться методом дальнего соседа. Активизируем переключатель метрических расстояний Euclidian  (Евклидово расстояние). Отметим флажком поле  Standardize (Стандартизировать) для нормирования входных переменных. В поле NumberofClusters (Количество кластеров) введем цифру три. Переключатель Cluster (Кластер) оставим без изменения, т.е. разобьем динамический ряд на три периода (рисунок 5.2.3.)

После активизации кнопки OKсистема выдаст сводку (рисунок 5.2.4.)

Analysis Summary

----------------

Data variables:

     X1

     X10

     X2

     X3

     X4

     X5

     X6

     X7

     X8

     X9

     Y

Number of complete cases: 14

Clustering Method: Furthest Neighbor (Complete Linkage)

Distance Metric: Euclidean

Cluster   Members   Percent

---------------------------

1         3          21,43

2         7          50,00

3         4          28,57

---------------------------

Centroids

Cluster   X1       X10      X2       X3      X4      X5        X6           X7           X8          

------------------------------------------------------------------------------------------

1  0,362653 3,1389 0,186333  25,2667 25,7667 8,66667     513,6        1497,57      10174,3     

2  0,92823 0,1997  0,274143  43,2  18,1571  5,44286      1516,51      142,271      30380,0     

3  1,02941 0,273  0,4445    58,775 1,65     3,25         508,05       115,068      22331,8     

------------------------------------------------------------------------------------------   

Cluster   X9           Y           

-----------------------------------

1         400,8        16,0        

2         191,971      17,4571     

3         162,875      19,6        

-----------------------------------

Рисунок 5.2.4. Сводка кластерного анализа

Данные кластеризации свидетельствуют, что методом дальнего соседа образованы три кластера. В первый кластер входят 3 наблюдения, или 21,43% всех анализируемых лет. Второй кластер включает 7 лет, или 50% всех наблюдений. Третий кластер содержит 4 года, или 28,57% совокупности наблюдений. Система также рассчитала центроидные значения переменных. Средняя обеспеченность жильем населения края самого наихудшего периода социально-экономического развития края составила 16 кв.м. В период становления рыночных отношений  средняя обеспеченность жильем немного выросла  и достигла 17,5 кв.м. Период стабилизации характеризуется наиболее высоким показателем обеспеченности – 19,6 кв.м (рисунок 5.2.4.)

Вызовем панель табличных опций (рисунок 5.3.5.) и установим флажок в поле  MembershipTable (Таблица принадлежности наблюдений) STATGRAFICS выведет указанную таблицу, которая представлена на рисунке 5.2.6.

AnalysisSummary – Резюме анализа; MembershipTable - Таблица принадлежности наблюдений; IciclePlot – Область кластеров; AgglomerationSchedule – Накопительный список.

Рисунок 5.2.5. – Панель TabularOption (Табличные опции).

Данные свидетельствуют, наихудший период развития включает 1992-1994 годы, период становления - 1995-2001 годы и период стабилизации -2001-2005годы (рисунок 5.2.6.).

Membership Table

----------------

Clustering Method: Furthest Neighbor (Complete Linkage)

Distance Metric: Euclidean

Row     Cluster  

---------------

1       1      

2       1      

3       1      

4       2      

5       2      

6       2      

7       2      

8       2      

9       2      

10      2      

11      3      

12      3      

13      3      

14      3      

Рисунок 5.2.6. Группировка динамического ряда по кластерам (периодам).

Проведенный анализ можно дополнить рядом графиков. Активизируем панель графических опций (рисунок 5.2.7.).

Dendrogram – Дендрограмма; 2DScatterplot – Двумерная диаграмма; 3DScatterplot -  Трехмерная диаграмма; AgglomerationDistancePlot – График накопленных расстояний.

Рисунок 5.2.7. Панель GraphicalOption (Графические опции)

Установим флажок в поле Dendrogram (Дендрограмма). Система построит указанный график (рисунок 5.2.8.)

 


Рисунок 5.2.8. Дендрограмма периодизации

На дендрограмме по вертикальной оси отложено расстояние для каждого шага выполнения агломеративного иерархического алгоритма классификации. По горизонтальной оси показаны номера лет, в соответствии с проведенным кластерным анализом.

Приложение А

Значение  и  критерия Дарбина-Уотсона при 5% уровне значимости ( - длина временного ряда, - число объясняющих переменных в модели)