Після запуску програми з'являється порожня електронна таблиця в STATISTICA File Server. Потім уводять дані в таблицю; заміняють стандартні назви перемінних на необхідні; змінюють формат даних. Тут же можна виконати деякі дії над даними: візуалізація даних, основні статистичні характеристики даних. Для більш складних дій застосовують спеціалізовані модулі. Для запуску їх потрібно вибрати на панелі інструментів Module Switcher - Перемикач модулів. Опишемо основні статистичні модулі і їхні можливості.
· Basic Statistics – Модуль Основні статистики і таблиці
Цей модуль містить у собі практично всі описові статистики, групування даних; довірчі інтервали; тести на нормальний закон розподілу; розрахунок кореляційних матриць (розмірів до 300 на 300); тести на незалежність ознак; гістограми; таблиці частот.
· Nonparametrics / Distrib. – Модуль Непараметричні статистики і підгонка розподілів
Модуль містить великий набір непараметричних критеріїв згоди, зокрема, критерій Колмогорова-Смирнова; рангові критерії Мана-Уітні, Вілкоксона та багато інших.
Модуль дозволяє підібрати до вихідних даних відповідний закон розподілу (13 найбільш відомих видів).
· Multiply Regression – Модуль Множинна регресія
У цьому модулі будуються залежності між багатомірними перемінними; перевіряється адекватність моделей; оцінюються і будуються залишки, досліджуються моделі на наявність автокореляції.
· Nonlinear Estimation – Модуль Нелінійне оцінювання
Цей модуль незамінний, якщо користувачу потрібно скласти нелінійне рівняння регресії, перевірити його на адекватність, розрахувати тісноту зв'язку залежного і незалежного факторів.
Перелічимо інші модулі:
· Time series / Forecasting – Модуль Аналіз тимчасових рядів і прогнозування
· Cluster Analysis – Модуль Кластерный аналіз
· Process Analysis – Модуль Аналіз процесів
· Canonical Analysis – Модуль Канонічний аналіз
· Discriminant Function Analysis – Модуль Дискриминантний аналіз
· Factor Analysis – Модуль Факторний аналіз
· ANOVA/MANOVA – Модуль дисперсійного аналізу
· Classification Trees – Модуль Класифікаційне дерево
· Data Management – Модуль Керування даними
· Quality Control – Модуль Контроль якості
Більш докладна інформація про роботу з даними в середовищі STATISTICA міститься в [3 ]
Для приклада візьмемо задачу про складання рівняння множинної регресії, що розв’язувалась нами засобами пакета Mathcad у пункті 5.8 і в середовищі Excel у пункті 6.1.
а) Заповнюємо даними вихідну таблицю ( приводимо фрагмент таблиці):
Рисунок 6.9
б) використовуючи перемикач модулів, переходимо в модуль Множинна регресія.
Вибираємо залежні (dependent -У) і незалежні (independent X1, X2) змінні (variables). Після натискання кнопки ОК результати виводяться у виді таблиці
Regression Summary for Dependent Variable: Y (yyy.sta) |
||||||
R= ,78210169 RІ= ,61168305 Adjusted RІ= ,56599870 |
||||||
F(2,17)=13,389 p<,00032 Std.Error of estimate: 7,3732 |
||||||
St. Err. |
St. Err. |
|||||
BETA |
of BETA |
B |
of B |
t(17) |
p-level |
|
Своб.член |
10,986 |
12,145 |
0,905 |
0,378 |
||
X1 |
0,454 |
0,163 |
23,471 |
8,412 |
2,790 |
0,013 |
X2 |
-0,490 |
0,163 |
-0,018 |
0,006 |
-3,007 |
0,008 |
Тут R=0,782 – кореляційне відношення; RI=0,612 – коефіцієнт детермінації; F(2,17)=13,389 – спостережуване значення критерію Фішера; p<0,00032 - значимість помилки першого роду, при якій гіпотезу про адекватність отриманої моделі потрібно відкинути. Мала імовірність говорить про те, що модель адекватна.
Параметри моделі містяться в стовпці В. Вони збігаються зі знайденими раніше. У наступних стовпцях розміщені СКВ цих параметрів; їхні t-статистики і рівні ймовірностей помилок (p-level). Якщо вибрати значущість a=0,1 , то коефіцієнти регресії при Х1 і Х2 визнаються значущими, вільний член рівняння регресії визнається незначущим. Отже потрібно вибрати іншу специфікацію моделі, можливо, без вільного члена.
У цьому розділі надані задачі, зв'язані з перевіркою статистичних гіпотез, які пропонується розв’язувати самостійно.
Варіант № 1
Передбачається, що застосування нової технології в розробці пластових родовищ приведе до збільшення якості вугілля. Результати контролю з якості добутого вугілля двома бригадами, що працюють в аналогічних умовах, але використовують різні технології, приведені нижче. Виміри велися за відсотком засмічення вугілля, видобутого однією бригадою за зміну за старою технологією (ознака Х1) і другою бригадою за новою технологію (ознака Х2).
Х1(у %): 20; 12; 11; 12; 20; 18; 10 Х2 (у %): 10; 13; 21; 7; 15; 9; 9;13
Чи підтверджують ці результати припущення про ефективність застосування нової технології? Прийняти a = 0,05 .
Варіант № 2
Вивчають зв’язок між стажем роботи и кваліфікацією робітника. Кваліфікацію робітника вимірювали як кількісну ознаку за підсумком виконання плану.
Стаж роботи |
Відмітка за підсумком виконання плану |
|
Виконують план |
Не виконують план |
|
Менше 5 років |
100 |
60 |
Не менше 5 років |
200 |
70 |
Всього |
300 |
140 |
Чи можна вважати при рівні значущості помилки першого роду 0,01, що стаж роботи не впливає на кваліфікацію робітника?
Варіант № 3
Порівнюють реальну пропускну здатність за добу (Ас) по транспортуванню вантажів двох штреків I і II. Отримано наступні результати:
Штрек I : вибіркова середня Ас = 3000 т; S= 20 т ; n = 20
Штрек II : вибіркова середня Ас = 3450 т; S = 25 т ; n = 18
Який із двох штреків має більшу реальну пропускну здатність ?
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.