Начальный этап
первичной обработки данных связан с поиском максимального , минимального
значений выборки
и размаха варьирования
. Для определения размаха необходимо
расположить единицы выборки в возрастающем, или убывающем порядке.
Следующий этап первичной обработки заключается в группировке данных и их графическом представлении.
При группировке промежуток разбивают на m
интервалов и подсчитывают число выборочных значений
,
где j = 1,2,...,m, которые попали в j-й интервал. Как
правило, число интервалов m = 6...20. Для определения оптимального
числа групп можно использовать формулу Стерджесса
,
где
- общее число единиц выборки.
Величина интервала группировки рассчитывается по
формуле
. Ширина интервалов для всего ряда
должна быть одинаковой;
.
За середину первого интервала может быть
принято значение
, равное
; за середину последнего интервала
значение
, равное
.
Тогда размах варьирования определяется по формуле
(1)
Каждое отдельное
значение должно быть однозначно отнесено к
определенному интервалу. Каждое значение
,
попадающее на границу интервалов
и
, что бывает сравнительно редко,
должно быть причислено к интервалу по принятому правилу. Такие значения
рекомендуют причислять к интервалам одним из трех способов:
1.
Принять равным 1 и причислить к нижнему интервалу;
2.
Принять равным 1 и причислить к верхнему интервалу;
3.
Принять равным 1/2 и причислить значение 1/2 к нижнему интервалу, значение 1/2 к верхнему интервалу
.
Наиболее наглядной формой графического представления группировки является гистограмма распределения относительных частот, которая представляет собой график решетчатой функции
,
(2), где
-
относительная частота попаданий;
-
- интервал группировки.
Другая форма
графического представления группированных данных - полигон частот, который
изображается в виде графика - ломаной линии, с абсциссами , определяемыми серединами интервалов
группировки
и ординатами, равными частотам
попадания наблюдений в интервалы группировки -
,
или относительным частотам
.
Полигон накопленных частот (кумулятивная
кривая) - график ломаной линии, с абсциссами ,
определяемыми серединами интервалов группировки
,
и ординатами, равными сумме накопленных частот
,
или сумме относительных накопленных частот
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.