Аналіз даних: Навчальний посібник (Розділи: Предмет курсу. Основні задачі. Випадкові величини. Нормальний розподіл і основні розподіли, пов'язані з ним), страница 2

Такі моделі застосовують при економічних, медико-біологічних, сільськогосподарських дослідженнях, а також для опису технологічних процесів у машинобудуванні та ін.

Математична статистика – розділ математики, у якому вивчаються методи збирання, систематизації й оброблення результатів спостережень масових випадкових явищ для виявлення існуючих закономірностей.

Математична статистика тісно пов'язана з теорією ймовірностей. Обидві ці математичні дисципліни вивчають масові випадкові явища. Сполучною ланкою між ними є граничні теореми теорії ймовірностей. При цьому теорія ймовірностей виводить із математичної моделі властивості реального процесу, а математична статистика встановлює властивості математичної моделі, виходячи з даних спостережень (говорять "із статистичних даних").

Предметом математичної статистики є вивчення випадкових величин (або випадкових подій, процесів) за результатами спостережень. Отримані у результаті спостереження (випробувань, експерименту) дані спочатку треба певним чином обробити: упорядкувати, представити у зручному для розгляду й аналізу вигляді. Це перше завдання. Потім, це вже друге завдання, оцінити хоча б приблизно характеристики, що нас цікавлять, із спостережуваної випадкової величини. Наприклад, дати оцінку невідомої ймовірності події, оцінку невідомої функції розподілу, оцінку математичного очікування, дисперсії випадкової величини, оцінку параметрів розподілу, вид якого невідомий, та ін.

Результати дослідження статистичних даних методами математичної статистики використовують для прийняття рішень (у завданнях планування, керування, прогнозування й організації виробництва, при контролі якості продукції, при виборі оптимального часу налагодження або заміни діючої апаратури та ін., тобто для наукових і практичних висновків.

Говорять, що "математична статистика –  це теорія прийняття рішень в умовах невизначеності".

1.2 Типи розв'язуваних задач

1 Визначення інтервальних оцінок невідомих параметрів. Знаходимо інтервал, в який попадає значення досліджуваного показника із заданою точністю (ймовірністю).

2 Перевірка статистичних гіпотез:

а) стосовно параметрів розподілу;

б) стосовно закону розподілу;

в) про вплив фактора (факторів) або їхньої сукупності на ознаку;

г) про відповідність експериментальних даних побудованій моделі.

3 Виявлення закономірностей (досліджуємо залежність одних змінних від інших):

 a) перевірка наявності зв'язків між змінними

-  кореляційний аналіз застосовується у тих випадках, коли змінні мають числову природу;

-  дисперсійний аналіз використовують, якщо залежна змінна числова, а змінні, що впливають, мають нечислову природу;

-  аналіз таблиць використовується, якщо змінні, що впливають, мають числову природу, а залежна змінна показує кількість спостережень (або відсоток від загальної кількості), для яких ознака наявна або відсутня;

б) опис емпіричних залежностей.

Регресійний аналіз дозволяє за експериментальними даними побудувати математичну модель

,

де Y - залежна  змінна;

 х12,..хn   – незалежні  змінні;

e  – випадкове збурювання.

4 Класифікація, тобто  одержання  відповіді  на  одне  з  питань:

а) до якої групи належить об'єкт;

б) чи належить об'єкт до даної групи;

в) які зв’язки між об'єктами.

Кластерний аналіз дозволяє упорядкувати об'єкти за однорідними групами.

Дискримінантнийаналіз дозволяє вивчати розбіжності між двома або більше групами об'єктів.

1.3 Шкали вимірювання

Обробити математичними методами можна тільки те, що піддається вимірюванню. Вимірювання – присвоєння чисел предметам або подіям, що базується на деякій системі правил.

Залежно від операцій, які можна виконувати над вимірюваними величинами (=, ≠, <, >, +, -, *, /), існують такі типи шкал вимірювання:

а) шкала класифікації. Припустимі операції  =, ≠. Нумерація або найменування служать для ідентифікації об'єкта (номер будинку, номер методики та ін.);