Первичная обработка статистических данных. Практическое пособие, страница 13

Пример 1.11 Построим гистограмму частот статистического ряда из примера 1.7 о возрасте пациентов поликлиники.

 y

 

Рисунок 1.10 – Гистограмма частот данных

о возрасте пациентов поликлиники

Иногда более полезным может оказаться другой вид гистограммы, которая называется гистограммой относительных частот статистического ряда. Чтобы её получить, на каждом интервале статистического ряда строится прямоугольник, площадь которого равна относительной частоте этого интервала. Из формулы площади прямоугольника легко получается выражение для его высоты:

 , i = 1, 2, …, k ,

где  – относительная частота i-го  интервала, а  –  это длина i-го интервала.

При изображении гистограммы удобно выбирать такой масштаб, в котором длина интервалов   равна 1. Тогда высоты прямоугольников равны соответствующим относительным частотам: hi = , i = 1,2, …, k.Это упрощает построение гистограммы.          В дальнейшем будем считать, что длина каждого интервала равна 1.

Пример 1.12  Построим гистограмму относительных частот статистического ряда из примера 1.7.

 y

 
 


x

Рисунок 1.11 – Гистограмма относительных частот данных

о возрасте пациентов поликлиники

Подчеркнем, что форма гистограммы существенно определяется статистическим рядом. Но любой статистический ряд является обобщением определенной выборки значений некоторой случайной величины. Следовательно, форма гистограммы определенным образом характеризует не только статистическое распределение выборки, но и распределение исследуемой случайной величины. Напомним, что в теории вероятностей закон распределения непрерывной случайной величины X определяется формулой плотности распределения вероятностей, обозначаемой через .

Отметим важное свойство гистограммы.

Высота прямоугольника каждого интервала гистограммы относительных частот является приближенным значением плотности распределения вероятностей исследуемой случайной величины на этом интервале:

.

Таким образом, верхнюю ступенчатую границу гистограммы можно считать статистическим аналогом кривой плотности распределения непрерывной случайной величины. Гистограмма на каждом интервале показывает средние плотности распределения вероятностей. Если середины верхних оснований прямоугольников гистограммы соединить прямолинейными отрезками, то получится полигон распределения частот. Очевидно, что при увеличении числа испытаний и при уменьшении длины интервалов ступенчатая ломаная, ограничивающая гистограмму сверху, будет более соответствовать кривой плотности распределения. Итак, если мы сгладим верхнюю ступенчатую ломаную гистограммы плавной кривой, то получим наглядное представление о кривой плотности распределения вероятностей исследуемой случайной величины. Таким образом гистограмма является удобным способом представления сгруппированных данных.

Пример 1.13 Построим гистограмму  относительных частот статистического ряда по данным примера 1.8 о высотах городских зданий и покажем приближенный график плотности распределения вероятностей.

x

 

y

 

Рисунок 1.12 – Гистограмма относительных частот данных

высот зданий города

Сформулируем ещё одно свойство гистограммы, тесно связанное с предыдущим.

Площадь гистограммы относительных частот, построенной на интервалах единичной длины, равна 1.

Итак, гистограмма и полигон частот дают возможность реально увидеть в общих чертах закономерности распределения исследуемой генеральной совокупности. Заметим, что полигон частот имеет большее преимущество  при сравнении двух разных распределений. В любом случае на первоначальном этапе графические формы представления статистических данных являются важным рабочим методом статистики.

1.8 Эмпирическая функция распределения