Сравнительный анализ объектов и факторных эффектов, страница 2

Кроме гистограммы анализ статистических данных возможен и по другим видам графиков. Например, по диаграммам размаха (рис. 25-26)

Рис. 25 Диаграмма размаха на 2001 год

Рис. 26 Диаграмма размаха на 2002 год

Анализируемый график включает четыре компоненты:

·  центральную точку, определяющую главную тенденцию или положение;

·  прямоугольник, показывающий положение верхних и нижних процентилей;

·  отрезки вокруг прямоугольника, соответствующие диапа­зону значений переменной, без выбросов;

·  выбросы.

Следует также отметить, что количество выбросов в холодное время года больше, чем в теплое. Это предположение высказывалось и ранее, но в данном случаем можно уже сделать некоторый вывод, а именно, на графике, чем ближе выброс к диапазону значений, тем меньше он влияет на итоговую статистику по данному месяцу. Если бы количество выбросов было велико нужно было бы позаботиться об их сглаживании с помощью одного из методов.

Критерии нормальности

В статистике часто требуется, чтобы исходные данные имели нормальный закон распределения. Это объясняется тем обсто­ятельством, что большинство методов математической стати­стики разработаны применительно именно к случаям нормаль­ного распределения.

В данной работе для определения нормальности закона распределения используем три критерия:

·  критерий Колмогорова-Смирнова;

·  критерий Лилиеформа;

·  критерий Шапиро-Уилкса.

Результаты представлены в табл. 2.

Таблица 2 Анализ по критериям нормальности

N

max D

K-S

Lilliefors

W

p

Январь 001

31

0,181812

p < ,20

p < ,05

0,892652

0,004748

Февраль 2001

28

0,152697

p > .20

p < ,10

0,923454

0,042252

Март 2001

31

0,171763

p > .20

p < ,05

0,910504

0,013319

Апрель 2001

30

0,087872

p > .20

p > .20

0,961494

0,338053

Май 2001

31

0,140024

p > .20

p < ,15

0,947127

0,130013

Июнь 2001

30

0,093694

p > .20

p > .20

0,978906

0,795786

Июль 2001

31

0,143139

p > .20

p < ,15

0,933088

0,053237

Август 2001

31

0,129490

p > .20

p > .20

0,949873

0,154853

Сентябрь 2001

30

0,133381

p > .20

p < ,20

0,977674

0,760926

Октябрь 2001

31

0,076669

p > .20

p > .20

0,971804

0,569959

Ноябрь 2001

29

0,129498

p > .20

p > .20

0,904157

0,012338

Декабрь 2001

31

0,124544

p > .20

p > .20

0,951159

0,168031

Январь 2002

31

0,080486

p > .20

p > .20

0,967268

0,447183

Февраль 2002

28

0,106152

p > .20

p > .20

0,971904

0,632472

Март 2002

31

0,116351

p > .20

p > .20

0,933629

0,055086

Апрель 2002

30

0,095766

p > .20

p > .20

0,952875

0,201734

Май 2002

31

0,071943

p > .20

p > .20

0,985973

0,947699

Июнь 2002

30

0,155190

p > .20

p < ,10

0,935245

0,067775

Июль 2002

31

0,122198

p > .20

p > .20

0,919595

0,023029

Август 2002

31

0,088153

p > .20

p > .20

0,956087

0,229164

Сентябрь 2002

30

0,111648

p > .20

p > .20

0,960955

0,327616

Октябрь 2002

31

0,119360

p > .20

p > .20

0,966370

0,425110

Ноябрь 2002

30

0,081624

p > .20

p > .20

0,965983

0,435860

Декабрь 2002

31

0,080572

p > .20

p > .20

0,973546

0,621129

Анализируя полученную таблицу (а также таблицу основных статистик и гистограммы) можно сделать вывод, что для месяцев, для которых рассчитанная W-статистика значима (значение данной статистики подсвечено красным цветом) гипотеза о том, что данные имеют нормальный закон распределения, должна быть отвергнута. Для месяцев, предположительно с ненормальным законом распределения средних температур (ноябрь 2001 год и июль 2002 год) данная гипотеза подтвердилась.

Проверка гипотез о равенстве средних для нормальных распределений (t-критерий)

Проверка гипотезы о равенстве средних двух совокупностей имеет важное практическое значение. Действительно, иногда оказывается, что среднее значение одной выборки отличается от среднего значения другой, хотя, казалось, выборки взяты из схожих совокупностей. Т-критерий позволит сравнить средние  значения в двух группах.

Сравнение будет происходить для одинаковых месяцев в 2001 и 2002 годах, но в рассмотрение берутся лишь те месяцы, значения средней температуры в которых подчинены нормальному закону распределения (см. табл. 2).

Таблица 3. T-критерий (апрель)

Mean

Std.Dv.

N

Diff.

Std.Dv.

t

df

P

Апрель 2001

3,395667

5,206322

Апрель 2002

2,749667

6,564097

30

0,646000

7,732206

0,457604

29

0,650647

Таблица 4. T-критерий (май)

Mean

Std.Dv.

N

Diff.

Std.Dv.

t

df

p

Май 2001

16,68452

5,933591

Май 2002

14,35516

4,743069

31

2,329355

7,299310

1,776784

30

0,085746

Таблица 5. T-критерий (июнь)

Mean

Std.Dv.

N

Diff.

Std.Dv.

t

df

p

Июнь 2001

18,50433

2,877416

Июнь 2002

17,70400

2,574312

30

0,800333

4,458230

0,983262

29

0,333611

Таблица 6. T-критерий (август)

Mean

Std.Dv.

N

Diff.

Std.Dv.

t

df

p

Август 2001

18,67323

2,475455

Август 2002

17,80032

4,299410

31

0,872903

4,042409

1,202283

30

0,238658