Оставшиеся колонки заполним (на примере гистограммы компонента х, для гистограммы компоненты y – аналогично) по следующим правилам:
· - границы интервалов разбиения «облака наблюдений» по оси х;
· =+- значение варианты (центр интервала (,));
· nj – абсолютная частота попадания в интервал варианты ;
· n – объём выборки;
· wj= nj/n – относительная частота попадания в интервал варианты;
· =wj/hx – средняя плотность вероятности в интервале варианты ;
· - кумулятивная (интегральная) функция распределения, является наростающей суммой wj, а её значения относятся к правой границе интервала варианты .
Представим гистограммы, заданные табл. II.5, в виде столбиковой диаграммы (,), (,), как показано на рис. II.3. Высота столбика пропорциональна средней плотности вероятности попадания xi (или yk) в интервал варианты (или ).
Оценим графически средние значения , и среднеквадратические отклонения и из следующих соображений (рис. II.3):
1. - это абсцисса «центра тяжести» площади гистограммы;
2.(- ,+) – симметричный интервал, над которым лежит примерно 70% площади гистограммы.
Занесём графические оценки в табл. II.8.
Гистограмма одномерных распределений компонент
«Фоновый» массив, n=75
компонента х |
компонента y |
Рис.II.3
Вывод: ежедневная средняя выручка с 26 по 100 день по гистограмме составляет 15 тыс.руб.в среднем 5 тыс.руб., а ежедневные средние издержки предприятия на ед. продукции за этот период составили 19.5 руб. в среднем 5 руб.
Построим кумулятивные кривые и «фонового» массива, учитывая, что значения и отвечают правой границе интервала разбиения (рис. II.4).
Кумулятивные функции распределения вероятностей
«Фоновый» массив, n=75
Рис. II.4
Оценим по кумулятам средние значения и , среднеквадратические отклонения и «фонового» массива:
»(x0.85-x0.15)/2, »(x0.85-x0.15)/2, где x0.85, x0.15 – 85%-ная и 15% - ная квантили.
Для «фонового» массива по графику кумуляты х (рис. II.4) имеем следующие оценки: x0.85»19; x0.15»10; »(19-10)/2=4.5; »(19+10)/2=14.5.
По графику кумуляты y (рис. II.4): y0.85»24; y0.15»15; »(24-15)/2=4.5; »(24+15)/2=19.5 .
Вывод: ежедневная средняя выручка с 26 по 100 день по кумулятивной кривой составляет 14.5 тыс.руб.в среднем 4.5 тыс.руб., а ежедневные средние издержки предприятия на ед. продукции за этот период составили 19.5 руб. в среднем 4.5 руб.
Занесём оценки в табл. II.8.
Хорошо проявить форму распределения можно и на «малой» ( n = 20-30 ), и даже «очень малой» ( n = 10-15 ) выборке. Однако техника обработки данных «малой» выборки несколько иная.
«Большие» выборки сначала группируются по интервалам, затем вычисляют частоты попадания значений в интервалы и строят гистограмму. Кумулятивная функция распределения насчитывается последней.
В случае «малых» выборок – наоборот, сначала строится кумулята частот, которая затем сглаживается. Гистограмма получается на её основе. Повышенная устойчивость гистограммы достигается именно за счёт сглаживания кумуляты частот.
«Аномальные» серии А и В
Построим кумулятивную функцию для «аномальной» серии А ( i = 1-11 ).
1. Наносим наблюдения xi, i=1-11 (табл. А) на абсциссу х.
2. Нумеруем нанесённые точки слева направо (одновременно подсчитываем их число n; в серии А n=11).
3. По ординате над точкой 1 откладываем »0.091, над точкой 2 откладываем »0.182 и т.д. Каждой точке соответствует увеличение ординаты на , в последней 11– ой точке ==1.
4. Соединяем полученные точки и получаем «ломаное» приближение кумуляты (интегральной функции распределения).
5. Сгладим ломанную по медианам треугольников ( можно и на глаз ) – точно так же, как сглаживали протокол наблюдений (прил. 1).
Проводя аналогичные действия, построим кумулятивные функции и для «аномальной» серии В (рис.II.5). Оценим по кумулятам средние значения и , среднеквадратические отклонения и «аномальных» серий А и В, данные занесём в табл. II.8.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.