Х |
10 |
20 |
18 |
8 |
25 |
У |
15 |
26 |
26 |
16 |
32 |
Требуется:
а) составить уравнение линейной регрессии;
б) найти выборочный коэффициент корреляции и проверить его на значимость;
в) построить корреляционное поле, линию регрессии и сделать вывод;
г) дать точечный прогноз по показателю У при Х=30%.
д) найти абсолютную и относительную погрешности уравнения линейной регрессии.
Задача 2. Пусть взята выборка по количеству прогулов в месяц, приходящихся на одного рабочего:
Х |
2 |
2 |
0 |
1 |
0 |
3 |
Требуется:
а) найти основные характеристики выборки: выборочное среднее, выборочнную дисперсию, выборочное СКО, исправленную выборочную дисперсию, исправленное выборочное СКО;
б) построить доверительный интервал для оценки математического ожидания и СКО при доверительной вероятности Р=0,95;
в) проанализировать полученные результаты и сделать выводы.
В этом разделе читателям предлагается попробовать свои силы в довольно большом статистическом исследовании, связанном с установлением корреляционных зависимостей между некоторыми факторами, играющих важную роль в горном деле. Данные, используемые в заданиях, являются выборками из фактических результатов, полученных в процессе научных исследований. Для студентов дневной и заочной формы обучения прелагается выполнять работу в различных объемах, но для одних и тех же выборок.
Для каждого варианта статистических данных Х и У выполнить расчеты в следующей последовательности.
1. Провести первичную обработку статистических данных (включая проверку данных). Результаты представить в виде таблиц. Построить статистические ряды для каждого признака.
2. Построить гистограмму, полигон относительных частот и кумуляту по каждому признаку.
3.1 Используя метод “условного нуля”, определить числовые характеристики выборок по каждому признаку: выборочное среднее; выборочную дисперсию; исправленную выборочную дисперсию; исправленное выборочное среднее квадратическое отклонение. Дать объяснение полученным результатам.
3.2 При помощи табличного процессора Excel и соответствующих формул статистики произвести расчет следующих точечных выборочных параметров выборки: выборочное среднее; выборочную дисперсию; исправленную выборочную дисперсию; исправленное выборочное среднее квадратическое отклонение; выборочные асимметрию и эксцесс, моду и медиану.
4. Для каждого признака построить 99% или 95% доверительные интервалы для оценки генеральных средних, генеральных средних квадратических отклонений. Дать объяснение полученным результатам.
5. При уровне значимости a проверить гипотезы о нормальных законах распределения генеральных совокупностей по каждому признаку. Для одного из признаков Х или У подобрать наиболее подходящий закон распределения.
6. Для признаков X и Y построить корреляционное поле, эмпирическую ломанную регрессии и дать предварительный анализ зависимости между признаками.
7. Для признаков X и Y вычислить эмпирический коэффициент детерминации и эмпирическое корреляционное отношение.
8. Определить параметры уравнения линейной регрессии.
9. Определить коэффициент корреляции и проверить его на значимость. Сделать вывод о наличии линейной связи между признаками.
10. Составить нелинейное уравнение регрессии, выбрав подходящий тип нелинейности.
11. Построить полученные линии регрессии в одной системе координат.
12. Для всех моделей рассчитать теоретический коэффициент детерминации и теоретическое корреляционное отношение; среднюю квадратическую погрешность уравнения; среднюю относительную погрешность аппроксимации.
13. Используя лучшее из полученных уравнений регрессии дать точечный прогноз и построить доверительный интервал для оценки прогнозного индивидуального значения У при заданном значении признака X .
Для статистических данных в соответствии с вариантом выполнить расчет в следующей последовательности:
1. Провести первичную обработку статистических данных. Результаты представить в виде таблиц. Построить статистические ряды для каждого признака.
2. Построить гистограмму и полигон частот (или относительных частот) по каждому признаку.
3. Используя метод “условного нуля”, определить числовые характеристики выборок по каждому признаку: выборочное среднее; выборочную дисперсию; исправленную выборочную дисперсию; исправленное выборочное среднее квадратическое отклонение. Дать объяснение результатам.
4. При заданном уровне значимости a проверить гипотезу о нормальном законе распределения генеральных совокупностей по признаку Х или признаку У.
5. Для признаков X и Y построить корреляционное поле и дать предварительный анализ зависимости между признаками.
6. Определить параметры уравнения линейной регрессии.
7. Определить коэффициент корреляции и проверить его значимость. Найти коэффициент детерминации. Сделать вывод о наличии связи между признаками, используя шкалу Чеддока.
8. Построить полученную линию регрессии.
9. Определить абсолютную и относительную среднеквадратическую погрешность уравнения регрессии.
10.Используя полученное уравнение регрессии, дать точечный прогноз по признаку У при заданном значении признака X .
ВАРИАНТ 1
В нижеследующей таблице собраны сведения о производительности труда рабочего очистного забоя для струговых установок на антрацитовых шахтах. Обозначения: Х – скорость подвигания забоя, м/мес;
У – средняя производительность за месяц, т/вых.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.