Требуется выполнить статистическое исследование в следующем объеме:
1. Провести первичную обработку статистических данных. Результаты представить в виде таблиц. Построить статистические ряды для каждого признака.
2. Построить гистограмму и полигон частот (или относительных частот) по каждому признаку.
3. Используя метод “условного нуля”, определить числовые характеристики выборок по каждому признаку: выборочное среднее; выборочную дисперсию; исправленную выборочную дисперсию; исправленное выборочное среднее квадратическое отклонение. Дать объяснение результатам.
4. При заданном уровне значимости a проверить гипотезу о нормальном законе распределения генеральных совокупностей по признаку Х или признаку У.
5. Для признаков X и Y построить корреляционное поле и дать предварительный анализ зависимости между признаками.
6. Определить параметры уравнения линейной регрессии.
7. Определить коэффициент корреляции и проверить его значимость. Найти коэффициент детерминации. Сделать вывод о наличии связи между признаками, используя шкалу Чеддока.
8. Построить полученную линию регрессии.
9. Определить абсолютную и относительную среднеквадратическую погрешность уравнения регрессии.
10. Используя полученное уравнение регрессии, дать точечный прогноз по признаку У при заданном значении признака X .
· В пункте 4) взять a = 0,01 и проверить на нормальность закона распределения признака Х .
· в пункте 10) сделать прогноз при Х =1,5 м.
Образец выполнения задания
1. А) Для признака Х определим наибольшее и наименьшее значение признака: Xmin=0,8 ; Xmax=4,8 ; объем выборки n = 49.
Число интервалов разбиения определим по формуле Стэрджесса:
К =1 + 3,322× lg n = 1 + 3,322× lg 49 = 6,61 » 7.
Найдем шаг разбиения h = (Хmax – Xmin) / К.
В данном случае h = (4,8 – 0,8) / 7 = 0,6.
Произведем группировку данных для признака Х. Для этого подсчитаем, сколько значений признака Х попадет в каждый из интервалов разбиения.
Результаты группировки заносим в табл.1, которая представляет статистический ряд по признаку Х.
Таблица 1
Интервал |
0,8 –1,4 |
1,4 – 2 |
2 – 2,6 |
2,6 – 3,2 |
3,2 – 3,6 |
3,6 – 4,4 |
4,4 – 5 |
Середина интервала х i |
1,1 |
1,7 |
2,3 |
2,9 |
3,5 |
4,1 |
4,7 |
Частота ni |
14 |
7 |
5 |
7 |
6 |
8 |
2 |
Проверка :14+7+5+7+6+8+2=49. Верно.
Б) Для признака У определим наибольшее и наименьшее значение признака: Уmin=60 ; Уmax=158 ; объем выборки n = 49.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.