Учебно-справочное руководство по статистическим расчетам в изучении курса "Математическая статистика", страница 20

Модуль содержит обширный набор непараметрических критериев согласия, в частности, критерий Колмогорова-Смирнова; ранговые критерии Манна-Уитни, Вилкоксона и многие другие.

Модуль позволяет подобрать к исходным данным подходящий закон распределения (13 наиболее известных видов). 

·  Multiply Regression –  Модуль Множественная регрессия

В этом модуле строятся зависимости между многомерными переменными;  проверяется  адекватность моделей; оцениваются  и строятся остатки, исследуются мобели на наличие автокорреляции.

·  Nonlinear Estimation – Модуль Нелинейное оценивание

Этот модуль незаменим, если пользователю требуется составить нелинейное уравнение регрессии, проверить его на адекватность, рассчитать тесноту связи зависимого и независимых факторов.

Перечислим остальные модули:

·  Time series / Forecasting – Модуль Анализ временных рядов и прогнозирование

·  Cluster Analysis – Модуль Кластерный анализ

·  Process Analysis – –Модуль Анализ процессов

·  Canonical Analysis – Модуль Канонический анализ

·  Discriminant Function Analysis – Модуль  Дискриминантный анализ

·  Factor Analysis –Модуль Факторный анализ

·  ANOVA/MANOVA –  Модуль дисперсионного анализа

·  Classification Trees – Модуль Классификационное дерево

·  Data Management – Модуль Управление данными

·  Quality Control –Модуль Контроль качества

Более подробная информация  о работе с данными в среде  STATISTICA содержится в [3 ]

         Для примера возьмем задачу о нахождении уравнения множественной регрессии, которая решалась нами средствами пакета Mathcad   в пункте 5.8 и в среде Excel в пункте 6.1.

а) Заполняем данными исходную таблицу ( приводим фрагмент таблицы):

б) Используя переключатель модулей, переходим в модуль  Множественная регрессия.

Выбираем зависимые (dependent -У)  и независимые (independent X1, X2)    переменные (variables). После нажатия кнопки ОК результаты можно вывести в виде таблицы

Regression Summary for Dependent Variable: Y (yyy.sta)

R= ,78210169 RІ= ,61168305 Adjusted RІ= ,56599870

F(2,17)=13,389 p<,00032 Std.Error of estimate: 7,3732

St. Err.

St. Err.

BETA

of BETA

B

of B

t(17)

p-level

Своб.член

10,986

12,145

0,905

0,378

X1

0,454

0,163

23,471

8,412

2,790

0,013

X2

-0,490

0,163

-0,018

0,006

-3,007

0,008

 Здесь R=0,782 – корреляционное отношение; RI=0,612 – коэффициент детерминации; F(2,17)=13,389 – наблюдаемое значение критерия Фишера; p<0,00032 – значимость ошибки первого рода, при которой гипотезу об адекватности полученной модели нужно отвергнуть. Малая вероятность говорит о том, что модель адекватная.

Параметры модели содержатся в столбце В. Они совпадают с найденными ранее. В следующих столбцах помещены СКО этих параметров; их  t-статистики и уровни вероятностей ошибок. Если выбрать значимость a=0,1 ,  то коэффициенты регрессии при Хи Х2 признаются значимыми, свободный член уравнения регрессии признается незначимым. Это значит, что нужно выбрать другую спецификацию модели, возможно без свободного члена.

7  Задачи для самостоятельного решения

В этом разделе представлены задачи, связанные с проверкой статистических гипотез. Читателю предлагается решить их самостоятельно.

Вариант № 1

Предполагается, что применение новой технологии в разработке пластовых месторождений  приведет к увеличению качества угля. Результаты контроля по качеству  угля, добытого двумя бригадами, работающими в аналогичных условиях, но использующими разные технологии, приведены ниже. Замеры велись по проценту засорения угля, вырабатываемого одной бригадой за смену по старой технологии (признак Х1) и новой технологии (признак Х2).

Х1(в %): 20; 12; 11; 12; 20; 18; 10      Х2 (в %): 10; 13; 21; 7; 15; 9; 9;13

Подтверждают ли эти результаты предположение об эффективности применения новой технологии?  Принять a = 0,05 .

Вариант № 2

Изучают связь между стажем работы  и  квалификацией работника. Последнюю измеряли качественно по итогам выполнения плана рабочим.  Результаты  приведены ниже:

Стаж работы

Отметка о выполнении плана

Выполняет

Не выполняет

Менее 5 лет

100

60

Не менее  5 лет

200

100

Всего

300

160

Можно ли при уровне значимости 0,05 считать, что стаж не влияет на квалификацию рабочего?

Вариант № 3

Сравнивают  реальную пропускную способность  (Ас) за сутки по транспортированию грузов двух штреков I  и  II. Получены следующие результаты:

Штрек I :   выборочная средняя Ас  = 3000 т;   S= 20 т ; n = 7

Штрек II :   выборочная средняя Ас  = 3450 т;    S = 25 т ; n = 10

Какой из двух штреков имеет большую реальную пропускную способность ?

Принять a = 0,1.

Вариант № 4

Определяют сопротивление угля резанию по двум методикам М1  и  М2.

Проведены эксперименты по двум методикам и получены следующие результаты (сопротивление измерялось в  кгс/см).

Методика М1 :   = 210 кгс/см ;  S =  5 кгс/см; n = 10

Методика М2 :     = 230 кгс/см ;  S = 8 кгс/см; n = 15

Какая из двух методик дает меньший разброс по измеряемому показателю?

Принять a = 0,05.

Вариант № 5

При измерении производительности двух агрегатов получены следующие результаты ( в кг вещества за час работы)

Хв

Дв

n

Агрегат  А

14,3

0,36

9

Агрегат  Б

13,4

0,52

13

Можно ли считать, что производительности агрегатов А  и  Б одинаковы, в предположении, что выборки получены из нормально распределенных генеральных совокупностей? Принять a = 0,1.

Вариант № 6