Разведывательный анализ данных и регрессионный анализ средствами пакета STATISTICA, страница 3

-  Скорректированный коэффициент детерминации adjusted R? = 0,877 показывает, насколько вариация зависимой переменной объясняется изменением объясняющих переменных по сравнению с влиянием случайных факторов; в данном случае построенная регрессия объясняет 87,7 % разброса значений относительно среднего.

F = 13,678 значение F критерия (Фишера).

-  Вероятность P = 0,001 - уровень значимости p F-критерия используются для проверки значимости регрессии; в данном случае гипотеза о незначимости коэффициентов bm отвергается, т.к. значение p = 0,001 < 0,05, следовательно, регрессия значима.

df =   9,7  число степеней свободы

Standard error of estimate: 4,824 - оценка сигма, корень квадратный из дисперсии ошибки.

Intercept: - 212,559 - коэффициент β0, пересечение с осью у.

В первой итерации  выявлены такие значимые переменные как x3, x4, x5.

Проанализировали результаты регрессии: проверили значимости регрессии (вкладка Advanced / ANOVA (Overall goodness of fit) ; определили наименее значимую переменную (Advanced / Summary: Regression results). Сделали выводы о влиянии переменных, исключили самую незначимую переменную для дальнейшего анализа.

Результат дисперсионного анализа ANOVA (для проверки значимости регрессии) представлен в таблице 7.

Таблица 7 - Проверка значимости уравнения регрессии

Sums of

df

Mean

F

p-level

Regress.

2865,837

9

318,4263

13,67830

0,001159

Residual

162,958

7

23,2797

Total

3028,795

Гипотеза о значимости регрессии принимается, так как p мало.

Определение значимых/незначимых переменных представлено в таблице 8

Таблица 8 - Определение значимых/незначимых переменных

Beta

Std.Err.

B

Std.Err.

t(7)

p-level

Intercept

-212,559

68,30846

-3,11175

0,017039

x1

-0,008325

0,260014

-0,018

0,57293

-0,03202

0,975351

x2

-0,496569

0,239023

-1,231

0,59249

-2,07749

0,076367

x3

-0,681119

0,223494

-1,834

0,60178

-3,04759

0,018646

x4

0,352575

0,148743

35,083

14,80058

2,37036

0,049580

x5

0,609121

0,106075

3,012

0,52454

5,74236

0,000704

x6

-0,084329

0,163186

-0,658

1,27260

-0,51676

0,621242

x7

0,118002

0,130989

0,040

0,04444

0,90086

0,397598

x8

0,333566

0,180339

0,786

0,42497

1,84966

0,106820

x9

0,031808

0,235509

0,024

0,17569

0,13506

0,896365

Для последующего анализа необходимо исключить наименее значимую переменную с наибольшим значением вероятности p, т.е. x1 (р≈97%)

7.2.2  Выполнили последующие итерации метода пошаговой регрессии, исключая незначимые переменные по аналогии с п.7.2.1 до тех пор, пока результаты регрессии не будут состоять только из значимых факторов  Полученный результат представлен в таблице 9.

Таблица 9- Значимые переменные множественной регрессии

Beta

Std.Err.

B

Std.Err.

t(11)

p-level

Intercept

-201,883

48,43698

-4,16796

0,001568

x2

-0,608481

0,108166

-1,508

0,26812

-5,62545

0,000154

x3

-0,724841

0,097975

-1,952

0,26381

-7,39824

0,000014

x4

0,384994

0,081078

38,308

8,06755

4,74846

0,000601

x5

0,592865

0,083727

2,932

0,41402

7,08094

0,000020

x8

0,286988

0,091702

0,676

0,21610

3,12956

0,009585

Уравнение регрессии будет иметь следующий вид (значения коэффициентов при переменных задаются по соответствующим значениям столбца B):

y = - 201,883- 1,508 * x2  - 1,952 * x3 + 38,308 * x4 + 2,932 * x5 + 0,676 * x8

Анализ избыточности объясняемых переменных

Таблица 10 - Проверка объясняющих переменных на избыточность

Toleran.

R-square

Partial

Semipart

x2

0,513311

0,486689

-0,861429

-0,435950

x3

0,625649

0,374351

-0,912501

-0,573334

x4

0,913603

0,086397

0,819823

0,367987

x5

0,856701

0,143299

0,905585

0,548745

x8

0,714164

0,285836

0,686298

0,242528