Аналіз даних: Навчальний посібник (Розділи: Предмет курсу. Основні задачі. Випадкові величини. Нормальний розподіл і основні розподіли, пов'язані з ним)

Страницы работы

Содержание работы

Вступ

Моделювання та дослідження систем, як правило, потребують експериментальної роботи. З одного боку, експеримент дозволяє перевірити модель і, якщо треба, уточнити її. З іншого боку, модель підказує, який саме експеримент треба проводити, тобто дає інформацію для організації експерименту.

Основним математичним апаратом оброблення та аналізу результатів експерименту є математична та прикладна статистика.

За останні 60 років виникла велика та дуже розгалужена ймовірнісна математика, що має як специфічні розділи та теорії, так і розділи та теорії, «паралельні» відповідним розділам та теоріям звичайної детермінованої математики. Все це дає змогу створювати різноманітні математичні моделі явищ та об'єктів за умов ймовірнісної випадковості та випадкових збурень.

Навчальний посібник містить теоретичні відомості, базові поняття, які дозволяють правильно та ефективно застосовувати статистичні методи для обробки та аналізу даних. Опис кожного методу супроводжується прикладами з різних сфер життєдіяльності, таких, як економіка, медицина, сільське господарство та ін.

Особливо треба підкреслити, що в посібнику детально наведені можливості використання сучасного програмного забезпечення ПЕОМ для аналізу даних.  Розглянуті можливості використання статистичних функцій та „Пакету аналізу” у МS Excel для статистичного аналізу даних та їх практичне застосування.

У кінці кожного розділу  наведені запитання і завдання, що дозволяють перевірити якість засвоєння матеріалу.

Перший розділ посібника присвячений загальним питанням: предмет та основні задачі курсу «Аналіз даних», математичне моделювання, шкали вимірювання та їх зв'язок із застосовуваними методами.

У другому розділі розглянуті базові визначення та поняття теорії ймовірності, такі, як  дискретні та неперервні випадкові величини, закони розподілу та їх числові характеристики.

Третій розділ присвячений нормальному розподілу випадкової величини та пов’язаних з ним розподілам Пірсона, Стьюдента, Фішера, а також наведені функції Excel, що дозволяють проводити обчислення без використання відповідних таблиць.

У четвертому розділі розглянуті питання, пов’язані з вибірковим методом, визначенням статистичних оцінок, розв’язуванням задач математичної статистики за допомогою табличного процесора Excel.

П’ятий розділ містить матеріал, що дозволяє проводити статистичну перевірку статистичних гіпотез.

У шостому розділі розглянуто питання  перевірки  наявності зв'язку між змінними, кореляційний та багатовимірний кореляційний аналіз.

Сьомий розділ посібника присвячений парному та множинному регресійному аналізу:

-  вибір вигляду функції;

-  метод найменших квадратів для оцінки параметрів функції регресії;

-  оцінка якості та адекватності  моделі;

-  функції Excel для побудови регресійних залежностей.

Восьмий розділ містить  основні визначення та принципи застосування дисперсійного  аналізу.

У дев’ятому розділі розглянуто питання  використання рангового аналізу.

Даний посібник розроблений на основі книг [1], [2] з використанням інших зазначених джерел.

Навчальний посібник призначений для студентів спеціальностей „Інформатика” та „Прикладна математика”, а також може бути корисним для аспірантів та  дослідників, що використовують статистичні методи для оброблення та аналізу даних.


1 ПРЕДМЕТ КУРСУ. ОСНОВНІ ЗАДАЧІ

1.1 Математична модель. Види  моделей

Працюючи в різних галузях науки і техніки, доводиться вивчати причинно-наслідкові зв'язки між явищами і процесами. Оскільки явища і процеси пов'язані між собою, знаходження залежностей і взаємозв'язків між ними шляхом побудови математичних моделей і подальшого їхнього кількісного опису дозволяє глибше зрозуміти існуючі закономірності. Побудова математичної моделі базується на  аналізі даних.

Розрізняють детерміноване і стохастичне моделювання.

Детерміновані моделі описують строгу залежність показників від факторів, що на них впливають. Ця залежність є повною і визначеною, тобто така модель являє собою формулу, підставивши в яку значення факторів одержимо конкретне значення узагальнюючого показника, що аналізується, тобто кожному вхідному набору параметрів відповідає однозначно визначений набір вихідних параметрів. Випадковими відхиленнями при цьому нехтують, відносячи їх на рахунок помилок спостережень і вимірів. Прикладом детермінованої моделі може бути закон Ома. Типовими прикладами таких залежностей можуть служити закони класичної механіки.

Стохастичні моделі описують закономірності, обумовлені одночасною дією на об'єкт багатьох факторів, що  проявляються чітко тільки при масових спостереженнях.

Стохастичні моделі – описують залежність, що носить ймовірнісний характер. Вона проявляється взагалі та в середньому, лише при великій кількості спостережень і може не виконуватись в кожному конкретному випадку.

Закономірності, що виявляються при масових спостереженнях, називаються статистичними. Статистичні закономірності також причинно-обумовлені, тільки причин може бути безліч, вони взаємозв’язані, діють у різних напрямках та можуть мати випадковий характер.

Похожие материалы

Информация о работе

Предмет:
Анализ данных
Тип:
Учебные пособия
Размер файла:
2 Mb
Скачали:
0