Рис. 4.
Полученные числа имеют следующий смысл, представленный в таблице 3:
Таблица 3
mn |
mn-1 |
… |
b |
Sen |
Sen-1 |
… |
Seb |
R2 |
Sey |
||
F |
Df |
||
Ssreg |
Ssresid |
Se – стандартная ошибка для коэффициента m;
Seb – стандартная ошибка для свободного члена b;
R2 – коэффициент детерминированности, который показывает как близко уравнение описывает исходные данные. Чем ближе он к 1, тем больше сходится теоретическая зависимость и экспериментальные данные.
Sey – стандартная ошибка для y;
F – критерий Фишера определяет случайная или нет взаимосвязь между зависимой и независимой переменнымы;
Df – степень свободы системы;
Ssreg – регрессионная сумма квадратов;
Ssresid – остаточная сумма квадратов.
Таким образом, в классе однофакторных регрессионных моделей наиболее информативным предиктором (предсказателем) является (табличная функция ЛИНЕЙН показала, что R2=0,8716)- общая площадь квартиры. Включим эту переменную в выстраиваемую методом включения модель.
Вычислим скорректированный коэффициент детерминации при k=1:
(2)
2-й шаг (k=2). Среди всевозможных пар , выбираем наиболее информативную (в смысле или, что то же самое, в смысле ) пара.
Последовательно применяем табличную функцию ЛИНЕЙН к различным парам:
Очевидно, что наиболее информативной парой является , которая дает
.
С включением параметра коэффициент детерминации вырос, следовательно, это правильное решение. Линейное уравнение с учетом факторов имеет вид:
.
Используя надстройку «Регрессия, проведем анализ значимости найденных коэффициентов
(рис.5).
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
|
Y-пересечение |
0,597648128 |
0,85917455 |
0,695607346 |
0,489116913 |
х1 |
0,515346379 |
0,012197632 |
42,249707 |
1,65355E-49 |
х5 |
-0,330969116 |
0,046597167 |
-7,102773329 |
1,06313E-09 |
Рис.5. Фрагмент отчета регрессии по двум переменным
Столбец t-статистика содержит наблюдаемые значения t-критерия Стьюдента . Столбец «Р-значение» используется для проверки гипотезы : (о незначимости i-го коэффициента регрессии) с помощью критерия Стьюдента. Столбец содержит вероятности того, что в силу случайных причин принимает это или большее значение, хотя коэффициент регрессии . «Р-значение» сравнивается с выбранным уровнем значимости а, если «Р-значение» больше или равно а, то гипотеза подтверждается и коэффициент незначим. В противном случае коэффициент существенно отличен о 0, т.е. значим. Рассмотрев столбец «Р-значение» (рис.4), приходим к выводу: два коэффициента при независимых переменных статистически значимо отличаются от нуля при уровне значимости а=0,05. Коэффициент 0,5976 («Y-пересечение») не значим, и его следует исключить из уравнения.
Таким образом, уравнение имеет вид:
.
3-шаг (k=3). Попытаемся добавить третью переменную в наше уравнение регрессии. Среди всевозможных троек , выбираем аналогично 1 и 2 шагу наиболее информативную.
Наиболее информативной является , которая дает (3)=0,9650.
Вычислим частный критерий Фишера для оценки прироста факторной дисперсии, обусловленного включением в модель фактора :
(3)
= вычислим с помощью табличной функции FРАСПОБР(0,05;1;69).
<=3,97.
Следовательно, третью переменную в модель включать нецелесообразно, т.к. она существенно не повышает значение .
Этот же результат получим, применив надстройку «Регрессия» (рис. 6).Отметим, что коэффициент не значим.
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
|
Y-пересечение |
0,337074321 |
0,852944835 |
0,395188888 |
0,693997444 |
х1 |
0,589092639 |
0,040157912 |
14,66940406 |
2,6705E-22 |
х5 |
-0,334189998 |
0,045702885 |
-7,312229756 |
4,85926E-10 |
х2 |
-0,127120945 |
0,066083794 |
-1,923632659 |
0,058782024 |
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.