Математическая статистика в горно-геологических расчетах, страница 89

Требуется выполнить статистическое исследование в следующем объеме:

1.  Провести первичную обработку статистических данных. Результаты представить в виде таблиц. Построить статистические ряды для каждого признака.

2.  Построить гистограмму и  полигон частот (или относительных частот)  по каждому признаку.

3.  Используя метод “условного нуля”, определить числовые характеристики выборок по каждому признаку: выборочное среднее; выборочную дисперсию; исправленную выборочную дисперсию; исправленное выборочное среднее квадратическое отклонение. Дать объяснение  результатам.

4.  При заданном  уровне значимости a проверить гипотезу о нормальном законе распределения генеральных совокупностей по  признаку Х или признаку У.

5.  Для признаков X и Y построить корреляционное поле и дать предварительный анализ зависимости между признаками.

6.  Определить параметры уравнения линейной регрессии.

7.  Определить коэффициент корреляции и проверить его значимость. Найти коэффициент детерминации. Сделать вывод о наличии связи между признаками, используя шкалу Чеддока.

8.  Построить полученную линию регрессии.

9.  Определить абсолютную и относительную среднеквадратическую погрешность уравнения  регрессии.

10.  Используя полученное уравнение регрессии, дать точечный прогноз  по признаку У  при заданном значении признака X .

·  В пункте  4)  взять  a = 0,01  и  проверить на нормальность закона распределения признака  Х .

·  в  пункте 10)  сделать прогноз при  Х =1,5 м.

Образец выполнения задания

1.  А) Для признака Х  определим наибольшее и наименьшее значение признака:   Xmin=0,8 ;    Xmax=4,8  ;      объем выборки  n = 49.

Число интервалов разбиения определим по формуле Стэрджесса:

К =1 + 3,322× lg n =  1 + 3,322× lg 49 = 6,61 » 7.

Найдем шаг разбиения  h = (Хmax – Xmin) / К.

В данном случае  h = (4,8 – 0,8) / 7 = 0,6.

Произведем группировку данных для признака  Х.  Для этого подсчитаем, сколько значений признака Х  попадет в каждый из интервалов разбиения.

Результаты группировки заносим в табл.1, которая представляет статистический ряд по признаку Х.

 Таблица 1

Интервал

0,8 –1,4

1,4 – 2

2 – 2,6

2,6 – 3,2

3,2 – 3,6

3,6 –  4,4

4,4 – 5

Середина интервала х  i

1,1

1,7

2,3

2,9

3,5

4,1

4,7

Частота  ni

14

7

5

7

6

8

2

Проверка :14+7+5+7+6+8+2=49.  Верно.

Б)  Для признака У  определим наибольшее и наименьшее значение признака:  Уmin=60 ;          Уmax=158  ;      объем выборки n = 49.