Оценка распределений. Двухмерное и одномерное распределение, страница 4

Оставшиеся колонки заполним (на примере гистограммы компонента х, для гистограммы компоненты y – аналогично) по следующим правилам:

·  - границы интервалов разбиения «облака наблюдений» по оси х;

·  =+- значение варианты (центр интервала (,));

·  nj – абсолютная частота попадания в интервал варианты ;

·  n – объём выборки;

·  wj= nj/n – относительная частота попадания в интервал варианты;

·  =wj/hx – средняя плотность вероятности в интервале варианты ;

·   - кумулятивная (интегральная) функция распределения, является наростающей суммой wj, а её значения относятся к  правой границе интервала варианты .

Представим гистограммы, заданные табл. II.5, в виде столбиковой диаграммы (,), (,), как показано на рис. II.3. Высота столбика пропорциональна средней плотности вероятности попадания xi (или yk) в интервал варианты  (или ).

Оценим графически средние значения ,  и среднеквадратические отклонения  и  из следующих соображений (рис. II.3):

1.  - это абсцисса «центра тяжести» площади гистограммы;

2.(- ,+) – симметричный интервал, над которым лежит примерно 70% площади гистограммы.

Занесём графические оценки в табл. II.8.

Гистограмма одномерных распределений компонент

«Фоновый» массив, n=75

компонента х

компонента y

Рис.II.3

Вывод: ежедневная средняя выручка с 26 по 100 день по гистограмме составляет 15 тыс.руб.в среднем 5 тыс.руб., а ежедневные средние издержки предприятия на ед. продукции за этот период составили 19.5 руб. в среднем 5 руб.

Построим кумулятивные кривые и  «фонового» массива, учитывая, что значения  и  отвечают правой границе интервала разбиения (рис. II.4).

Кумулятивные функции распределения вероятностей

«Фоновый» массив, n=75

Рис. II.4

Оценим по кумулятам средние значения  и , среднеквадратические отклонения  и  «фонового» массива:

»(x0.85-x0.15)/2,                            »(x0.85-x0.15)/2, где x0.85,  x0.15 – 85%-ная и 15% - ная квантили.

Для «фонового» массива по графику кумуляты х (рис. II.4) имеем следующие оценки:                         x0.85»19; x0.15»10;                »(19-10)/2=4.5;                                         »(19+10)/2=14.5.

По графику кумуляты y (рис. II.4):             y0.85»24;               y0.15»15;               »(24-15)/2=4.5;           »(24+15)/2=19.5 .

Вывод: ежедневная средняя выручка с 26 по 100 день по кумулятивной кривой составляет 14.5 тыс.руб.в среднем 4.5 тыс.руб., а ежедневные средние издержки предприятия на ед. продукции за этот период составили 19.5 руб. в среднем 4.5 руб.

Занесём оценки в табл. II.8.

2.2. Интегральные функции распределения малых выборок

Хорошо проявить форму распределения можно и на «малой» ( n = 20-30 ), и даже «очень малой» ( n = 10-15 ) выборке. Однако техника обработки данных «малой» выборки несколько иная.

«Большие» выборки сначала группируются по интервалам, затем вычисляют частоты попадания значений в интервалы и строят гистограмму. Кумулятивная функция распределения насчитывается последней.

В случае «малых» выборок – наоборот, сначала строится кумулята частот, которая затем сглаживается. Гистограмма получается на её основе. Повышенная устойчивость гистограммы достигается именно за счёт сглаживания кумуляты частот.

«Аномальные» серии А и В

Построим кумулятивную функцию для «аномальной» серии А ( i = 1-11 ).

1. Наносим наблюдения xi, i=1-11 (табл. А) на абсциссу х.

2. Нумеруем нанесённые точки слева направо (одновременно подсчитываем их число n; в серии А n=11).

3. По ординате  над точкой 1 откладываем »0.091, над точкой 2 откладываем »0.182 и т.д. Каждой точке соответствует увеличение ординаты на , в последней 11– ой точке ==1.

4. Соединяем полученные точки и получаем «ломаное» приближение кумуляты (интегральной функции распределения).

5. Сгладим ломанную по медианам треугольников ( можно и на глаз ) – точно так же, как сглаживали протокол наблюдений (прил. 1).

Проводя аналогичные действия, построим кумулятивные функции  и  для «аномальной» серии В (рис.II.5). Оценим по кумулятам средние значения  и , среднеквадратические отклонения  и  «аномальных» серий А и В, данные занесём в табл. II.8.