Может спросить что это такое?
Рис. 2.1.
Регрессионная статистика:
Множественный R - множественный коэфициент корреляции Пирсона.
R квадрат - коэффициент детерминации.
Нормирванный R квадрат -нормированный коэффициент детерминации.
Все коэффициенты характеризуют тесноту связи между Х и У.
Стандартная ошибка - среднее квадратическое отклонение регрессии от исходных данных.
Наблюдение - число наблюдений.
Дисперсионный анализ:
df -Число степеней свободы:
Строка Регрессия - число факторов в уравнении регрессии Yx=a+bx - (один фактор - Х).
Строка Остаток - размер выборки (12) минус число факторов (1), минус 1 =12-1-1=10
Строка Итого - размер выборки (12) минус 1=12-1=11
SS-Сумма квадратов отклонений:
Строка Регрессия -(s2y(х) ) - факторная дисперсия
Строка Остаток - (s2y, x) - остаточная дисперсия
Строка Итого - (s2y ) - полная дисперсия
MS-Модифицированная сумма квадратов отклонений
Строка Регрессия - MS/df
Строка Остаток - MS/df
F -Cтатистика оценки связи между Y и X
F=MS(Регрессия)/MS(Остаток)
SignificanceF - Значимость F - вероятность гипотезы отсутствия связи - P= 1-F - Вероятность альтернативной гипотезы наличия связи между Y и X
Параметры уравнения регрессии Yx=a+bx:
Коэффициенты:
Yпересечение - Значение постоянной а
Переменная X 1 - Значениеb
Стандартна ошибка -Среднее квадратическое отклонение (СКО) найденных коэффициентов регрессии от исходных данных.
t статистика - - параметры уравнения с использованием t- статистики. Рассчитываются как отношения коэффициентов a и b регрессии к СКО
P-значение - уровень значимости ac для t - статистики
Нижние 95%, Верхние 95% -граничные нижние и верхние значения коэффициентов уравнения регрессии, которые они получают при уровне надежности 0,95.
Получаем линейную модель вида: YX = -1,956745623 + 7,559217302x
Задание 2. Определить достоверность найденного уравнения линейной регрессионной модели, используя критерий Фишера.
Для использования критерия Фишера (F) устанавливается отношение (h) полной дисперсии (s2y) к остаточной (s2y, x):
(2.1. 4.) |
(2.1.5.) |
(2.1.6.) |
m - число факторов в модели (m=1).
Из расчетов табл. 2 имеем:
S (y-Yx)2 = 1342,95
S (y-y*)2 = 5966,67
s2y,x = 1342,95/(12-2) = 134,29
s2y = 5966,67/(12-1) = 542,42
Найдем теперь отношениеh=542,42/134,29=4,04
В соответствующей статистической таблице F - распределения (Приложение 1) определим, что с доверительной вероятностью, например, в 95 случаях из 100 мы имеем удовлетворительный результат, так как f(0.95)= 2.94, и меньше значения h = 4,04. Полученный результат позволит нам использовать рассчитанное уравнение регрессии для различных целей, включая прогнозирование.
В основе расчета коэффициента корреляции и параметров оценивания его надежности лежит метод наименьших квадратов с использованием в качестве математической модели нормальной системы уравнений линейной регрессии. Найденный коэффициент корреляции показывает уровень тесноты связи между исследуемыми факторами. Чем выше значение коэффициента корреляции, тем теснее исследуемая связь. Расчет линейного коэффициента корреляции выполняется по формуле:
(2.1.7.) |
Величина линейного коэффициента корреляции изменяется в диапазоне от -1 до +1.
Задание 3. Найти значение коэффициента корреляции для проверки статистической зависимость между годовым объемом работы по грузообороту (млрд ткм), (x) и фондоемкостью перевозок (y).
Решение:
По данным табл. … находим показатели, необходимые для расчета r. Подставляя их значения в формулу имеем:
Задание 4. Определить значимость найденных в задании 3, коэффициентов корреляции. Сделать вывод о доверительности найденных значений, используя таблицу нижних границ значимости коэффициента корреляции с уровнем значимости 0.95. Вывод о значимости найденного значения линейного коэффициента корреляции в 95 случаях из 100 принимается при условии, что оно больше соответствующей нижней границы. В приложении 2. приведены значения нижних границ коэффициента корреляции.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.