Анализ микроданных обследования о расходах на определенную группу услуг (налоги) и уровня благосостояния домохозяйств по выбранному территориальному округу, страница 2

Проведено исключение аномальных наблюдений: установлен фильтр AnomalyIndexRaspRes < 2,634

Расходы на конечное потребление:

Список индексов аномальных наблюдений приведен в таблице 3.


Таблица 3 – список индексов аномальных наблюдений

Наблюдения

Индекс аномальности

124

7,637

68

5,921

69

5,921

425

4,393

497

3,650

498

3,650

409

3,624

105

3,623

210

3,606

274

3,600

3

3,541

89

3,533

402

3,449

432

3,385

126

3,319

437

3,280

414

3,142

415

3,142

416

3,142

264

3,121

162

3,059

254

3,043

199

3,040

200

3,040

275

3,037

Проведено исключение аномальных наблюдений: установлен фильтр AnomalyIndexKonPotr < 3,037

Потребительские расходы:

Список индексов аномальных наблюдений приведен в таблице 4.


Таблица 4 – список индексов аномальных наблюдений

Наблюдения

Индекс аномальности

166

4,194

291

3,894

126

3,787

56

3,502

276

3,399

141

3,382

478

3,351

71

3,311

77

3,299

459

3,193

79

3,038

109

3,017

181

3,016

1

2,992

298

2,970

143

2,965

171

2,912

172

2,912

458

2,891

406

2,883

7

2,871

380

2,835

461

2,819

349

2,755

Проведено исключение аномальных наблюдений: установлен фильтр AnomalyIndexPotrRash < 2,755

Налоги, сборы и платежи:

Список индексов аномальных наблюдений приведен в таблице 5.


Таблица 5 – список индексов аномальных наблюдений

Наблюдения

Индекс аномальности

385

9,957

318

9,270

351

6,141

374

5,459

340

4,353

360

3,911

361

3,911

182

3,890

233

3,890

294

3,749

403

3,619

404

3,619

417

3,579

196

3,459

320

2,822

78

2,525

365

2,413

232

2,399

388

2,325

418

2,325

277

2,248

121

2,242

122

2,242

Проведено исключение аномальных наблюдений: установлен фильтр AnomalyIndexNalog < 2,242

Построим корреляционные поля после процедуры исключения аномальных наблюдений по всем переменным (рис. 5-8). Общий фильтр получился:

AnomalyIndexDenDoh<2.648 & AnomalyIndexRaspRes < 2.634 & AnomalyIndexKonPotr < 3.037 & AnomalyIndexPotrRash < 2.755&AnomalyIndexNalog < 2.242

Рисунок 5 – Зависимость налогов от денежного дохода населения

Рисунок 6 – Зависимость налогов от располагаемых ресурсов

Рисунок 7 – Зависимость налогов от расходов на конечное потребление

Рисунок 8 – Зависимость налогов от потребительских расходов

Произведена проверка на нормальность (гипотеза H0: y ϵ N) распределения тремя способами:

1)  Ассиметрия, ексцесс.

Значения ассиметрии и эксцесса представлены в таблице 6.

Таблица 6 – Описательные статистики

N

Skewness

Kurtosis

Statistic

Statistic

Std. Error

Statistic

Std. Error

Налоги, сборы, платежи

331393

,527

,004

-,762

,009

Valid N (listwise)

331393

Проверяем условия: |А|≤3*SA; |Э|≤5*SЭ

0,527≥3*0,004; 0,762≥5*0,009

Оба условия не выполняются, поэтому гипотеза о нормальности распределения отвергается.

2)  С помощью критерия Колмагорова-Смирнова (табл. 7)

Условие: p < 0,05 – не нормальное распределение (p – Ассимпт.знч. (двустороннее))

Таблица 7 – Обновыборочный критерий Колмагорова-Смирнова

Налоги, сборы, платежи

N

433

Normal Parameters(a,b)

Mean

4831,3675

Std. Deviation

4001,97924

Most Extreme Differences

Absolute

,114

Positive

,104

Negative

-,114

Kolmogorov-Smirnov Z

2,365

Asymp. Sig. (2-tailed)

,000

p=0,000, что меньше 0,05, значит гипотеза о нормальности распределения отвергается.

3) Графики для проверки нормальности (табл. 8).

Таблица 8 – Критерий нормальности

Kolmogorov-Smirnov(a)

Statistic

df

Sig.

Налоги, сборы, платежи

,107

331393

,000

a  Lilliefors Significance Correction

По критерию Колмагорова-Смирнова значимость равна 0,000, что меньше значения 0,05, поэтому распределение не является нормальным. Также это отражено на графиках (рис. 9,10).

Рисунок 9 – Вероятностный график (квантили)

Рисунок 10 – Вероятностный график (квантили) с удаленным трендом

Проведено нормализующее преобразование.

Преобразование переменной: доля налогов в расходах на конечное потребление.

Создана переменная Dolya = nalog / rassq (налоги / расходы на конечное потребление).