Сравнительный анализ объектов и факторных эффектов, страница 3

Таблица 7. T-критерий (сентябрь)

Mean

Std.Dv.

N

Diff.

Std.Dv.

t

df

P

Сентябрь 2001

11,07433

3,888692

Сентябрь 2002

12,80100

4,685878

30

-1,72667

5,669127

-1,66822

29

0,106036

Таблица 8. T-критерий (октябрь)

Mean

Std.Dv.

N

Diff.

Std.Dv.

t

df

p

Октябрь 2001

2,784516

5,324848

Октябрь 2002

1,956774

4,801101

31

0,827742

5,360985

0,859669

30

0,396789

Таблица 9. T-критерий (декабрь)

Mean

Std.Dv.

N

Diff.

Std.Dv.

t

df

p

Декабрь 2001

-15,7677

8,893879

Декабрь 2002

-18,6029

6,994123

31

2,835161

13,98875

1,128443

30

0,268076

Если нулевая гипотеза Н0 не отклоняется на уровне значи­мости 0.05 и с числом степеней свободы (n-1), то различие между средними можно считать статистически значимым (на экране строка подсвечена красным цветом).

В нашем случае вычисленное значение р намного превышает уровень значимо­сти 0.05, поэтому сделаем вывод о том, что различие в средних несущественно и смена 2001 на 2002 год не повлияло на распределение средних температур по данным месяцам.

Но данные методы, основанные на предположении о нормальности законов распределения (это предположение также нуждается в более строгом доказательстве) следует использовать с большой осторожностью, так как выборка очень мала, и даже небольшое количество выбросов может отрицательно сказаться на результатах.

Непараметрическая статистика и подгонка распределения

Непараметрические методы не основываются на оценке параметров (таких как среднее или стандартное отклонение) при описании выборочного распределения интересующей величины. Поэтому эти методы иногда также называются свободными от параметров или свободно распределенными.

Используем два критерия: критерий знаков и критерий Вилкоксона для оценки распределений в двух месяцах: ноябрь 2001\2002 годы и июль 2001\2002 годы.

Перед началом вычислений отметим тот факт, что количество значений в ноябре 2001 года на 1 меньше, чем в ноябре 2002 года. Исходя из необходимости одинакового числа значений, добавим в первую выборку значение, равное среднему арифметическому за последние 4 дня (-16,53).

Критерий знаков

Этот критерий - непараметрическая альтернатива t-критерия для зависимых выборок. Критерий применяется в ситуациях, когда исследователь проводит два измерения (например, при разных условиях) одних и тех же субъектов и желает установить, дают измерения разный результат или нет (имеется эффект обработки или нет).

Критерий основан на следующих простых соображениях: он подсчитывает, сколько раз определенное значение первой переменной (A) больше соответствующего значения переменной (B), иными словами, определяется количество положительных разностей между значениями переменной (A) и значениями переменной (B). Учитываются только знаки разностей (а не их значения). При нулевой гипотезе (состоящей в том, что две переменные не отличаются друг от друга, отсутствует эффект обработки) высчитанное значение будет равно примерно половине от общего числа наблюдений (положительных разностей будет примерно столько же сколько отрицательных). Основываясь на биномиальном распределении, можно вычислить z значение для числа наблюдений, в которых A > B, а также вычислить соответствующую вероятность для этого z значения.

Таблица 10. Критерий знаков (июль)

Критерий знаков (июль 2001-2002 в ram3ec_workspace) Отмеченные критерии значимы на уровне p <,05000

Число

Процент

Z

p-уров.

2001 & 2002

31

54,83871

0,359211

0,719438

Таблица 11. Критерий знаков (ноябрь)

Критерий знаков (ноябрь 2001-2002 в ram3ec_workspace) Отмеченные критерии значимы на уровне p <,05000

Число

Процент

Z

p-уров.

2001 & 2002

30

40,00000

0,912871

0,361310

Критерий Вилкоксона

Критерий Вилкоксона парных сравнений является непараметрической альтернативой t-критерия для зависимых (коррелируемых) выборок.

Требования для критерия более строгие, чем для знакового. Однако если они удовлетворены, то он обеспечивает большую мощность, чем знаковый, что, конечно, объясняется тем, что критерий знаков использует информацию только о знаках разностей, тогда как критерий Вилкоксона использует также относительную величину разностей и, таким образом, более чувствителен. Фактически, если предположения параметрического t-критерия для зависимых выборок (интервальная шкала) выполнены, то U критерий имеет почти такую же мощность, как и t-критерий.

Таблица 12. Критерий Вилкоксона (июль)

Критерий Вилкоксона (июль 2001-2002 в ram3ec_workspace) Отмеченные критерии значимы на уровне p <,05000

Число

T

Z

p-уров.

2001 & 2002

31

204,0000

0,862248

0,388552

Таблица 13. Критерий Вилкоксона (ноябрь)

Критерий Вилкоксона (ноябрь 2001-2002 в ram3ec_workspace) Отмеченные критерии значимы на уровне p <,01000

Число

T

Z

p-уров.

2001 & 2002

30

178,5000

1,110690

0,266702

Выводы по непараметрической статистике

По результатам анализа приведенных таблиц (см. табл. 10-13) можно говорить о статистической взаимосвязи выборок в соответствующие месяца разных лет (при соответствующих критериям уровнях значимости). Хотя критерий Вилкоксона обеспечивает большую мощность, чем знаковый, даже он однозначно указывает на тот факт, что значения представленных двух выборок имеют схожий закон распределения и взяты из одной генеральной совокупности. Диаграммы размаха (см. рис. 25-26) также указывают на близость средних значений средних температур в июле и ноябре.


Выводы

Цель, поставленная для данной лабораторной работы, была выполнена. В ходе работы были найдены все основные статистики для заданной выборки значений, построены гистограммы, диаграммы рассеяния, оценена нормальность законов распределения и связь между средними значениями средней температуры по одинаковым месяцам за 2001 и 2002 год.

Также необходимо отметить, что не всегда критерии использования методов согласовывались с параметрами, получаемыми из данных выборок, а следовательно полностью полагаться на результаты, полученные в ходе выполнения лабораторной работы нельзя. Для повышения уровня достоверности данных необходимо увеличить количество отчетов в генеральной совокупности.