Множественная регрессия. Предварительная обработка данных. Удаление наблюдений по максимуму приращения коэффициента детерминации, страница 3

Коэффициенты вариации:

ny

92.1%

nx1

6.1%

nx2

16.1%

nx3

16.5%

nx4

89.4%

nx5

94.3%

Уровни варьирования результирующего показателя y и факторов x4 и x5 превышают допустимую величину (35%). Совокупность наблюдений неоднородна, необходимо выявить и удалить аномальные наблюдения.

Регрессия для исходной выборки (60 наблюдений)

Удаление наблюдений по максимуму приращения коэффициента детерминации (с помощью макроса Удаление3_60)

Текст макроса Удаление3_60

Sub Удаление3_60()

'

' Удаление1 Макрос

' Макрос записан 26.08.2006 (Голинков)

'

' Сочетание клавиш: Ctrl+a

'

For i = 1 To 100

Range("A130:I154").Select

Selection.Clear

Range("A9:H69").Select

Selection.Sort Key1:=Range("H10"), Order1:=xlAscending, Header:=xlGuess, _

OrderCustom:=1, MatchCase:=False, Orientation:=xlTopToBottom

Range("A67:G69").Select

Selection.Copy

Range("A126").Select

ActiveSheet.Paste

Application.Run "ATPVBAEN.XLA!Regress", Range("B9:B66"), Range("C9:G66"), False, True, , Range("A130"), False, _

False, False, False, , False

If Range("B135").Value > Range("M135").Value Then

Range("A125:I154").Select

Selection.Copy

Range("L125").Select

ActiveSheet.Paste

End If

Next i

End Sub

За счет удаления 20-го, 28-го и 31-го наблюдений скорректированная величина коэффициента детерминации возрастает с 0.6181 до 0,6738.

Удаление аномальных наблюдений с помощью пакета Statistica (по критериям расстояние  Махаланобиса, удаленный остаток и расстояние Кука)           

Прямоугольная выноска: Аномальное наблюдениеПрямоугольная выноска: Аномальное наблюдение

По критерию расстояние Махаланобиса наблюдение 15 признается аномальным и удаляется из выборки.

Коэффициенты вариации

для исходной выборки

после удаления        15-го наблюдения

ny

92.1%

92.7%

nx1

6.1%

6.0%

nx2

16.1%

16.1%

nx3

16.5%

16.6%

nx4

89.4%

86.6%

nx5

94.3%

95.9%

Удаление аномального наблюдения по критерию Махаланобиса не привело к существенному изменению показателей вариации.

По критериям: удаленный остаток и расстояние Кука наблюдение 23 признается аномальным и удаляется из выборки.

Коэффициенты вариации

для исходной выборки

после удаления        23-го наблюдения

ny

92.1%

77.2%

nx1

6.1%

6.1%

nx2

16.1%

15.0%

nx3

16.5%

16.5%

nx4

89.4%

88.4%

nx5

94.3%

92.6%

Удаление аномального наблюдения по критериям удаленный остаткок и расстояния Кука не привело к радикальному улучшению показателей вариации.

В целом, удаление аномальных наблюдений по критериям расстояние Махаланобиса,  удаленнй остаток и расстояние Кука не привело к существенному улучшению показателей вариации. Предпочтение следует отдать первому методу удаления аномальных наблюдений.

Для построения модели регрессии используется выборка из 57 наблюдений (без 20-го, 28-го и 31-го наблюдений):