Задачи работы:
Рассчитать главные компоненты. Получить таблицу сходимости собственных чисел и таблицу с нагрузками ГК. По временным рядам ГК построить графики.
Провести факторный анализ: получить таблицу сходимости факторного разложения и таблицу нагрузок факторов после второго вращения. Построить графики по временным рядам факторов.
Исходные данные:
матрица среднегодовых значений ТПО в 47 точках северо-восточной части Тихого Океана с 1958 по 2002 год.
Анализ:
Исходная матрица размером 47х48 была разложена методом главных компонент при количестве главных факторов равном 47 и при минимальном собственном числе =0,001.
Было получено 3 отчетных таблицы: собственные числа, собственные векторы (нагрузки) и значения главных компонент.
Из таблицы собственных чисел видно, что скорость сходимости разложения достаточно высока, так как первые два числа описывают в сумме 73% диперсии. Первые пять чисел оказались больше единицы, но их общая дисперсия составила 92%, что намного превышает рекомендуемое значение в 70%, поэтому было взято три главных компоненты с общей долей описываемой дисперси 83% для дальнейшего исследования.
Для первой компоненты максимальные нагрузки расположены вокруг южной части Камчатки (около 0,9) и уменьшаются более-менее одинаково во всех направлениях до значений около 0,5, кроме юго-западной части райоа: здесь они уменьшаются гораздо более резко. Нагрузки второй ГК равномерно уменьшаются с юга на север с 0,8 до 0 около 52-53ºс.ш. и далее опять увеличиваются достигая значений 0,4 у северной границы области. Третья нагрузка имеет распределение с запада на восток , в отличие от первых двух, уменьшаясь с 0,4-0,6 до нуля на траверзе Камчатки, и далее увеличиваясь до 0,4-0,5 у западной границы района. Таким образом первая компонента «захватывает» всю область почти целиком с максимумом 0,9 в центре, оставляя второй компоненте часть Тихого океана на юге области с максимумом 0,8 и Японское море на юго-западе третьей компоненте с максимумом 0,7. Нагрузки первой компонетнты отрицательны на всей области, нагрузки второй компоненты положительны на юге области и отрицательны на севере, нагрузки третьей положительны на западе и отрицательны на западе. Это говорит об отрицательной и положительной связи между ТПО и компонентами соответственно.
Также были построены графики временной изменчивости главных компонент. Все три компоненты изменяются в пределах -2-+2 лишь с некоторыми пиками, немного превышающими эти значения. В целом компоненты колеблются около нуля. Первые две компоненты имеют слабый отрицательный тренд, а третья слабый положительный. Все тренды оказались незначимы.
Было проведено разложение исходной матрицы методом факторного анализа. В качестве общностей выбран множественный коэффициент корреляции, количество факторов принято равным 47, минимальное собственное число задано равным 0,001. По таблице распределения собственных чисел была оценена сходимость разложения. Как и в методе ГК первые пять собственнх чисел больше единицы. В сумме они описывают 83% дисперсии, поэтому были выбраны три фактора с общей дисперсией 75%. Первый фактор описывает 50% дисперсии, второй 15%, а третий 9%.
Далее было проведено второе разложение, аналогичное первому, но с количеством факторов равном трем. Затем выполнено второе вращение факторов методом Варимакс. Получена таблица собственных векторов (нагрузок факторов) и по ней нарисована карта распределения нагрузок. Первый фактор имеет максимум около 0,8 в северо-восточной части области — Беринговом море. Его значения быстро уменьшаются в южном направлении и медленнее в западном и юго-западном до нуля у границ района. Второй фактор имеет максимальные значения 0,8 на юге области — в Тихом океане и уменьшается к северу достигая нуля в северной части Охотского моря и в Беринговом море, и далее немного увеличиваясь. Третий фактор имеет максимум в Японском море с максимумом 0,8 и уменьшается в восточном направлении до нуля у юго-западной границы области в тихом океане.
Таким образом, в отличие от распределения ГК, максимум нагрузок первого фактора смещен к западу, а третий фактор увеличил свой масимум и площадь влияния. Также все факторы имеют положительную связь с ТПО, кроме второго на севере.
По таблице значений главных компонент. Нарисованы графики временной изменчивости факторов. В целом величины изменяются от -2 до +2, лишь с несколькими пиками, выходящими за эти пределы. Первый и третий факторы имеют слабый положительный тренд, второй имеет слабый отрицательный тренд. Все тренды оказались незначимы.
В целом временная изменчивость процесса по ФА очень схожа с изменчивостью по ГК.
РОССИЙСКИЙ ГОСУДАРСТВЕННЫЙ ГИДРОМЕТЕОРОЛОГИЧЕСКИЙ
УНИВЕРСИТЕТ
Кафедра “ПО и ОПВ”
Лабораторная работа №1
Анализ главных компонент и факторный анализ.
Выполнил: ст. гр. МО-612
Куссе-Тюз Н.А.
Проверила: Гордеева С.М.
Санкт-Петербург
2009
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.