Кроме гистограммы анализ статистических данных возможен и по другим видам графиков. Например, по диаграммам размаха (рис. 25-26)
Рис. 25 Диаграмма размаха на 2001 год
Рис. 26 Диаграмма размаха на 2002 год
Анализируемый график включает четыре компоненты:
· центральную точку, определяющую главную тенденцию или положение;
· прямоугольник, показывающий положение верхних и нижних процентилей;
· отрезки вокруг прямоугольника, соответствующие диапазону значений переменной, без выбросов;
· выбросы.
Следует также отметить, что количество выбросов в холодное время года больше, чем в теплое. Это предположение высказывалось и ранее, но в данном случаем можно уже сделать некоторый вывод, а именно, на графике, чем ближе выброс к диапазону значений, тем меньше он влияет на итоговую статистику по данному месяцу. Если бы количество выбросов было велико нужно было бы позаботиться об их сглаживании с помощью одного из методов.
В статистике часто требуется, чтобы исходные данные имели нормальный закон распределения. Это объясняется тем обстоятельством, что большинство методов математической статистики разработаны применительно именно к случаям нормального распределения.
В данной работе для определения нормальности закона распределения используем три критерия:
· критерий Колмогорова-Смирнова;
· критерий Лилиеформа;
· критерий Шапиро-Уилкса.
Результаты представлены в табл. 2.
Таблица 2 Анализ по критериям нормальности
N |
max D |
K-S |
Lilliefors |
W |
p |
|
Январь 001 |
31 |
0,181812 |
p < ,20 |
p < ,05 |
0,892652 |
0,004748 |
Февраль 2001 |
28 |
0,152697 |
p > .20 |
p < ,10 |
0,923454 |
0,042252 |
Март 2001 |
31 |
0,171763 |
p > .20 |
p < ,05 |
0,910504 |
0,013319 |
Апрель 2001 |
30 |
0,087872 |
p > .20 |
p > .20 |
0,961494 |
0,338053 |
Май 2001 |
31 |
0,140024 |
p > .20 |
p < ,15 |
0,947127 |
0,130013 |
Июнь 2001 |
30 |
0,093694 |
p > .20 |
p > .20 |
0,978906 |
0,795786 |
Июль 2001 |
31 |
0,143139 |
p > .20 |
p < ,15 |
0,933088 |
0,053237 |
Август 2001 |
31 |
0,129490 |
p > .20 |
p > .20 |
0,949873 |
0,154853 |
Сентябрь 2001 |
30 |
0,133381 |
p > .20 |
p < ,20 |
0,977674 |
0,760926 |
Октябрь 2001 |
31 |
0,076669 |
p > .20 |
p > .20 |
0,971804 |
0,569959 |
Ноябрь 2001 |
29 |
0,129498 |
p > .20 |
p > .20 |
0,904157 |
0,012338 |
Декабрь 2001 |
31 |
0,124544 |
p > .20 |
p > .20 |
0,951159 |
0,168031 |
Январь 2002 |
31 |
0,080486 |
p > .20 |
p > .20 |
0,967268 |
0,447183 |
Февраль 2002 |
28 |
0,106152 |
p > .20 |
p > .20 |
0,971904 |
0,632472 |
Март 2002 |
31 |
0,116351 |
p > .20 |
p > .20 |
0,933629 |
0,055086 |
Апрель 2002 |
30 |
0,095766 |
p > .20 |
p > .20 |
0,952875 |
0,201734 |
Май 2002 |
31 |
0,071943 |
p > .20 |
p > .20 |
0,985973 |
0,947699 |
Июнь 2002 |
30 |
0,155190 |
p > .20 |
p < ,10 |
0,935245 |
0,067775 |
Июль 2002 |
31 |
0,122198 |
p > .20 |
p > .20 |
0,919595 |
0,023029 |
Август 2002 |
31 |
0,088153 |
p > .20 |
p > .20 |
0,956087 |
0,229164 |
Сентябрь 2002 |
30 |
0,111648 |
p > .20 |
p > .20 |
0,960955 |
0,327616 |
Октябрь 2002 |
31 |
0,119360 |
p > .20 |
p > .20 |
0,966370 |
0,425110 |
Ноябрь 2002 |
30 |
0,081624 |
p > .20 |
p > .20 |
0,965983 |
0,435860 |
Декабрь 2002 |
31 |
0,080572 |
p > .20 |
p > .20 |
0,973546 |
0,621129 |
Анализируя полученную таблицу (а также таблицу основных статистик и гистограммы) можно сделать вывод, что для месяцев, для которых рассчитанная W-статистика значима (значение данной статистики подсвечено красным цветом) гипотеза о том, что данные имеют нормальный закон распределения, должна быть отвергнута. Для месяцев, предположительно с ненормальным законом распределения средних температур (ноябрь 2001 год и июль 2002 год) данная гипотеза подтвердилась.
Проверка гипотезы о равенстве средних двух совокупностей имеет важное практическое значение. Действительно, иногда оказывается, что среднее значение одной выборки отличается от среднего значения другой, хотя, казалось, выборки взяты из схожих совокупностей. Т-критерий позволит сравнить средние значения в двух группах.
Сравнение будет происходить для одинаковых месяцев в 2001 и 2002 годах, но в рассмотрение берутся лишь те месяцы, значения средней температуры в которых подчинены нормальному закону распределения (см. табл. 2).
Таблица 3. T-критерий (апрель)
Mean |
Std.Dv. |
N |
Diff. |
Std.Dv. |
t |
df |
P |
|
Апрель 2001 |
3,395667 |
5,206322 |
||||||
Апрель 2002 |
2,749667 |
6,564097 |
30 |
0,646000 |
7,732206 |
0,457604 |
29 |
0,650647 |
Таблица 4. T-критерий (май)
Mean |
Std.Dv. |
N |
Diff. |
Std.Dv. |
t |
df |
p |
|
Май 2001 |
16,68452 |
5,933591 |
||||||
Май 2002 |
14,35516 |
4,743069 |
31 |
2,329355 |
7,299310 |
1,776784 |
30 |
0,085746 |
Таблица 5. T-критерий (июнь)
Mean |
Std.Dv. |
N |
Diff. |
Std.Dv. |
t |
df |
p |
|
Июнь 2001 |
18,50433 |
2,877416 |
||||||
Июнь 2002 |
17,70400 |
2,574312 |
30 |
0,800333 |
4,458230 |
0,983262 |
29 |
0,333611 |
Таблица 6. T-критерий (август)
Mean |
Std.Dv. |
N |
Diff. |
Std.Dv. |
t |
df |
p |
|
Август 2001 |
18,67323 |
2,475455 |
||||||
Август 2002 |
17,80032 |
4,299410 |
31 |
0,872903 |
4,042409 |
1,202283 |
30 |
0,238658 |
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.