Графическое представление группированных данных

Страницы работы

Содержание работы

Тема 5. Вопрос 1

Начальный этап первичной обработки данных связан с поиском максимального , минимального  значений выборки  и размаха варьирования. Для определения размаха необходимо расположить единицы выборки в возрастающем, или убывающем порядке.

Следующий этап первичной обработки заключается в группировке данных и их графическом представлении.

При группировке промежуток разбивают на m интервалов и подсчитывают число выборочных значений , где j = 1,2,...,m, которые попали в j-й интервал. Как правило, число интервалов m = 6...20.  Для определения оптимального числа групп можно использовать формулу Стерджесса , где  - общее число единиц выборки.

Величина интервала группировки   рассчитывается по формуле . Ширина интервалов для всего ряда должна быть одинаковой; .

За середину первого интервала  может быть принято значение , равное ; за середину последнего интервала значение , равное  . Тогда размах варьирования определяется по формуле

 (1)

Каждое отдельное значение  должно быть однозначно отнесено к определенному интервалу. Каждое значение , попадающее на границу интервалов  и , что бывает сравнительно редко, должно быть причислено к интервалу по принятому правилу. Такие значения рекомендуют причислять к интервалам одним из трех способов:

1.  Принять равным 1 и причислить к нижнему интервалу;

2.  Принять равным 1 и причислить к верхнему интервалу;

3.  Принять равным 1/2 и причислить значение 1/2 к нижнему интервалу, значение 1/2  к верхнему интервалу .

Наиболее наглядной формой графического представления группировки является гистограмма распределения относительных частот, которая представляет собой график решетчатой функции

, (2), где

 - относительная частота попаданий;

- интервал группировки.

Другая форма графического представления группированных данных - полигон частот, который изображается в виде графика - ломаной линии, с абсциссами , определяемыми серединами интервалов группировки  и ординатами, равными частотам попадания наблюдений в интервалы группировки - , или относительным частотам  .

Полигон накопленных частот (кумулятивная кривая) - график ломаной линии, с абсциссами , определяемыми серединами интервалов группировки , и ординатами, равными сумме накопленных частот , или сумме относительных накопленных частот

Похожие материалы

Информация о работе