Математична статистика в гірничо-геологічних розрахунках, страница 19

Після запуску програми з'являється порожня електронна таблиця в STATISTICA File Server. Потім уводять дані в таблицю; заміняють стандартні назви перемінних на необхідні; змінюють формат даних. Тут же можна виконати деякі дії над даними: візуалізація даних, основні статистичні характеристики даних. Для більш складних дій застосовують спеціалізовані модулі. Для запуску їх потрібно вибрати на панелі інструментів Module Switcher - Перемикач модулів. Опишемо основні статистичні модулі і їхні можливості.

·  Basic Statistics – Модуль Основні статистики і таблиці

Цей модуль містить у собі практично всі описові статистики, групування даних; довірчі інтервали; тести на нормальний закон розподілу; розрахунок кореляційних матриць (розмірів до 300 на 300); тести на незалежність ознак; гістограми; таблиці частот.

·  Nonparametrics / Distrib. – Модуль Непараметричні статистики і підгонка розподілів

Модуль містить великий набір непараметричних критеріїв згоди, зокрема, критерій Колмогорова-Смирнова; рангові критерії Мана-Уітні, Вілкоксона та багато інших.

Модуль дозволяє підібрати до вихідних даних відповідний закон розподілу (13 найбільш відомих видів).

·  Multiply Regression – Модуль Множинна регресія

У цьому модулі будуються залежності між багатомірними перемінними; перевіряється адекватність моделей; оцінюються і будуються залишки, досліджуються моделі на наявність автокореляції.

·  Nonlinear Estimation – Модуль Нелінійне оцінювання

Цей модуль незамінний, якщо користувачу потрібно скласти нелінійне рівняння регресії, перевірити його на адекватність, розрахувати тісноту зв'язку залежного і незалежного факторів.

Перелічимо інші модулі:

·  Time series / Forecasting – Модуль Аналіз тимчасових рядів і прогнозування

·  Cluster Analysis – Модуль Кластерный аналіз

·  Process Analysis – Модуль Аналіз процесів

·  Canonical Analysis – Модуль Канонічний аналіз

·  Discriminant Function Analysis – Модуль Дискриминантний аналіз

·  Factor Analysis – Модуль Факторний аналіз

·  ANOVA/MANOVA – Модуль дисперсійного аналізу

·  Classification Trees – Модуль Класифікаційне дерево

·  Data Management – Модуль Керування даними

·  Quality Control – Модуль Контроль якості

Більш докладна інформація про роботу з даними в середовищі STATISTICA міститься в [3 ]

Для приклада візьмемо задачу про складання рівняння множинної регресії, що розв’язувалась нами засобами пакета Mathcad у пункті 5.8 і в середовищі Excel у пункті 6.1.

а) Заповнюємо даними вихідну таблицю ( приводимо фрагмент таблиці):

Рисунок 6.9

б)   використовуючи перемикач модулів, переходимо в модуль Множинна регресія.

Вибираємо залежні (dependent -У) і незалежні (independent X1, X2) змінні (variables). Після натискання кнопки ОК результати виводяться у виді таблиці

Regression Summary for Dependent Variable: Y (yyy.sta)

R= ,78210169 RІ= ,61168305 Adjusted RІ= ,56599870

F(2,17)=13,389 p<,00032 Std.Error of estimate: 7,3732

St. Err.

St. Err.

BETA

of BETA

B

of B

t(17)

p-level

Своб.член

10,986

12,145

0,905

0,378

X1

0,454

0,163

23,471

8,412

2,790

0,013

X2

-0,490

0,163

-0,018

0,006

-3,007

0,008

Тут R=0,782 – кореляційне відношення; RI=0,612 – коефіцієнт детермінації; F(2,17)=13,389 – спостережуване значення критерію Фішера; p<0,00032 - значимість помилки першого роду, при якій гіпотезу про адекватність отриманої моделі потрібно відкинути. Мала імовірність говорить про те, що модель адекватна.

Параметри моделі містяться в стовпці В. Вони збігаються зі знайденими раніше. У наступних стовпцях розміщені СКВ цих параметрів; їхні t-статистики і рівні ймовірностей помилок (p-level). Якщо вибрати значущість a=0,1 , то коефіцієнти регресії при Х1 і Х2 визнаються значущими, вільний член рівняння регресії визнається незначущим. Отже потрібно вибрати іншу специфікацію моделі, можливо, без вільного члена.

7 Задачі для самостійного рішення

У цьому розділі надані задачі, зв'язані з перевіркою статистичних гіпотез, які пропонується розв’язувати самостійно.

Варіант № 1

Передбачається, що застосування нової технології в розробці пластових родовищ  приведе до збільшення якості вугілля. Результати контролю з якості  добутого вугілля двома бригадами, що працюють в аналогічних умовах, але використовують  різні технології, приведені нижче. Виміри велися за відсотком засмічення вугілля, видобутого однією бригадою за зміну за старою технологією (ознака Х1) і другою бригадою за новою технологію (ознака Х2).

Х1(у %): 20; 12; 11; 12; 20; 18; 10    Х2 (у %): 10; 13; 21; 7; 15; 9; 9;13

Чи підтверджують ці результати припущення про ефективність застосування нової технології?  Прийняти a = 0,05 .

Варіант № 2

Вивчають зв’язок між стажем роботи  и  кваліфікацією робітника. Кваліфікацію робітника вимірювали як кількісну ознаку за підсумком виконання плану.

Стаж роботи

Відмітка за підсумком виконання плану

Виконують план

Не виконують план

Менше 5 років

100

60

Не менше 5 років

200

70

Всього

300

140

Чи можна вважати при рівні значущості  помилки першого роду 0,01, що стаж роботи не впливає на кваліфікацію робітника?

Варіант № 3

Порівнюють  реальну пропускну здатність за добу (Ас)  по транспортуванню вантажів двох штреків I  і  II. Отримано наступні результати:

Штрек I :   вибіркова середня Ас  = 3000 т;   S= 20 т ; n = 20

Штрек II :   вибіркова середня Ас  = 3450 т;    S = 25 т ; n = 18

Який із двох штреків має більшу реальну пропускну здатність ?