Аналіз даних: Навчальний посібник (Розділи: Предмет курсу. Основні задачі. Випадкові величини. Нормальний розподіл і основні розподіли, пов'язані з ним), страница 12

4.3.2 Графічне зображення статистичного розподілу

Статистичний розподіл зображується графічно у вигляді так званих полігона та гістограми. Полігон, як правило, служить для зображення дискретного статистичного ряду.

 Полігоном частот називають ламану, відрізки якої з'єднують точки з координатами (x1,n1), (х2,п2),..., (xk,nk); полігоном частостей – точки з координатами з координатами (x11*), (х22*),..., (xkk*). Полігон частостей є статистичним аналогом многотокутника розподілу.

Для неперервної розподіленої ознаки можна побудувати полігон частот, взявши середини інтервалів як значення х12,... ,хк.  Найчастіше використовується так звана гістограма.

Гістограмою частот (частостей) називають східчасту фігуру, що складається із прямокутників, основою яких служать часткові інтервали довжини h, а висоти дорівнюють відношенню ni /h – щільності частоти (або рi* /h –щільності частості).

Вважається, що інтервалів повинно бути 12-15, при цьому в інтервал повинно попадати не менше 5-6 реалізацій, кількість випробувань n>300.

За виглядом гістограми можна визначити вигляд розподілу.

4.3.3 Побудова гістограми

Можнапобудувати гістограму за допомогою функції, що наявна в пакеті Анализ данных. Для цього спочатку необхідно відсортувати варіаційний ряд за зростанням.

Потім введіть набір граничних значень, які визначають границі відрізка (кишені). Ці значення повинні бути введені у зростаючому порядку із кроком  h, а також  xmin<x1, xn<xmax.

Наприклад:

Х

Кишеня

2.24

2

3.05

4

3.87

6

4

8

5.09

6.78

7.01

Потім у меню послідовно вибирається Сервис – Анализ данных. У вікні, що з'явилося, вибираємопункт Гистограмма:

Після цього з'являється вікно, у якому необхідно задати вихідні дані для побудови гістограми:

Параметри діалогового вікна Гистограмма мають таке призначення:

Вхідний інтервалу цьому вікні необхідно задати посилання на діапазон комірок, у яких знаходяться вхідні дані. Вхідні дані повинні являти собою перелік значень, а не частот!

Інтервал кишень (необов'язковий) – введіть у поле діапазон комірок, що містить набір граничних значень, тобто визначають границі відрізків (кишені).

У Microsoft Excel обчислюється число влучень даних між поточним початком відрізка і сусіднім більшим за значенням, якщо такий є. При цьому включаються значення на нижній границі відрізка і не включаються значення на верхній границі.

Якщо діапазон кишень не був введений, то набір відрізків, рівномірно розподілених між мінімальним і максимальним значеннями даних, буде створений автоматично.

Міткиставиться відмітка, якщо перший рядок або перший стовпець вхідного інтервалу містить заголовки. Якщо такі відсутні, назви для даних вихідного діапазону створюються автоматично.

Вихідний діапазонвводиться посилання на лівий верхній кут вихідного діапазону. Розмір останнього буде визначений автоматично, і на екран буде виведене повідомлення у разі можливого накладення вихідного діапазону на вхідні дані.

Новий робочий листвстановлюється перемикач, щоб відкрити новий лист у книзі і вставити результати аналізу, починаючи з комірки А1.

Нова робоча книгащоб відкрити нову робочу книгу і вставити результати аналізу в комірку А1, на першому  листі в цій книзі встановлюється перемикач.

Парето (відсортована діаграма) – при виборі цієї можливості дані представляються в порядку спадання частоти. У математичній системі така форма гістограми не використовується.

Інтегральний відсотокрозраховуються значення і будується графік накопиченої частоти.

Виведення графікавстановлюється прапорець для автоматичного створення вбудованої діаграми.

Приклад побудови гістограми в Excel.

4.4 Статистичні оцінки параметрів розподілу