Начальный этап первичной обработки данных связан с поиском максимального , минимального значений выборки и размаха варьирования. Для определения размаха необходимо расположить единицы выборки в возрастающем, или убывающем порядке.
Следующий этап первичной обработки заключается в группировке данных и их графическом представлении.
При группировке промежуток разбивают на m интервалов и подсчитывают число выборочных значений , где j = 1,2,...,m, которые попали в j-й интервал. Как правило, число интервалов m = 6...20. Для определения оптимального числа групп можно использовать формулу Стерджесса , где - общее число единиц выборки.
Величина интервала группировки рассчитывается по формуле . Ширина интервалов для всего ряда должна быть одинаковой; .
За середину первого интервала может быть принято значение , равное ; за середину последнего интервала значение , равное . Тогда размах варьирования определяется по формуле
(1)
Каждое отдельное значение должно быть однозначно отнесено к определенному интервалу. Каждое значение , попадающее на границу интервалов и , что бывает сравнительно редко, должно быть причислено к интервалу по принятому правилу. Такие значения рекомендуют причислять к интервалам одним из трех способов:
1. Принять равным 1 и причислить к нижнему интервалу;
2. Принять равным 1 и причислить к верхнему интервалу;
3. Принять равным 1/2 и причислить значение 1/2 к нижнему интервалу, значение 1/2 к верхнему интервалу .
Наиболее наглядной формой графического представления группировки является гистограмма распределения относительных частот, которая представляет собой график решетчатой функции
, (2), где
- относительная частота попаданий;
- - интервал группировки.
Другая форма графического представления группированных данных - полигон частот, который изображается в виде графика - ломаной линии, с абсциссами , определяемыми серединами интервалов группировки и ординатами, равными частотам попадания наблюдений в интервалы группировки - , или относительным частотам .
Полигон накопленных частот (кумулятивная кривая) - график ломаной линии, с абсциссами , определяемыми серединами интервалов группировки , и ординатами, равными сумме накопленных частот , или сумме относительных накопленных частот
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.