Оставшиеся колонки заполним (на примере гистограммы компонента х, для гистограммы компоненты y – аналогично) по следующим правилам:
·
- границы интервалов разбиения «облака наблюдений» по
оси х;
·
=
+
- значение варианты (центр
интервала (
,
));
·
nj –
абсолютная частота попадания в интервал варианты ;
· n – объём выборки;
·
wj= nj/n – относительная частота попадания в интервал варианты;
·
=wj/hx – средняя плотность вероятности в интервале варианты
;
·
-
кумулятивная (интегральная) функция распределения, является наростающей суммой wj,
а её значения относятся к
правой
границе интервала варианты
.
Представим гистограммы, заданные табл. II.5, в виде
столбиковой диаграммы (,
), (
,
), как
показано на рис. II.3. Высота столбика пропорциональна средней плотности
вероятности попадания xi (или yk) в интервал
варианты
(или
).
Оценим графически средние значения ,
и среднеквадратические
отклонения
и
из
следующих соображений (рис. II.3):
1. - это абсцисса «центра
тяжести» площади гистограммы;
2.(-
,
+
)
– симметричный интервал, над которым лежит примерно 70% площади гистограммы.
Занесём графические оценки в табл. II.8.
Гистограмма одномерных распределений компонент
«Фоновый» массив, n=75
компонента х |
компонента y |
Рис.II.3
Вывод:
ежедневная средняя выручка с 26 по 100 день по гистограмме
составляет 15 тыс.руб.в среднем 5
тыс.руб., а ежедневные средние издержки предприятия на ед. продукции за этот
период составили 19.5 руб.
в среднем 5
руб.
Построим кумулятивные кривые и
«фонового» массива, учитывая, что
значения
и
отвечают
правой границе интервала разбиения (рис. II.4).
Кумулятивные функции распределения вероятностей
«Фоновый» массив, n=75
|
|
Рис. II.4
Оценим по кумулятам средние значения и
, среднеквадратические
отклонения
и
«фонового»
массива:
»(x0.85-x0.15)/2,
»(x0.85-x0.15)/2, где x0.85, x0.15 – 85%-ная
и 15% - ная квантили.
Для «фонового» массива по графику кумуляты х
(рис. II.4) имеем следующие оценки: x0.85»19; x0.15»10; »(19-10)/2=4.5;
»(19+10)/2=14.5.
По графику кумуляты y (рис. II.4): y0.85»24; y0.15»15; »(24-15)/2=4.5;
»(24+15)/2=19.5 .
Вывод:
ежедневная средняя выручка с 26 по 100 день по кумулятивной
кривой составляет 14.5 тыс.руб.в
среднем 4.5 тыс.руб., а ежедневные средние издержки предприятия на ед.
продукции за этот период составили 19.5 руб.
в
среднем 4.5 руб.
Занесём оценки в табл. II.8.
Хорошо проявить форму распределения можно и на «малой» ( n = 20-30 ), и даже «очень малой» ( n = 10-15 ) выборке. Однако техника обработки данных «малой» выборки несколько иная.
«Большие» выборки сначала группируются по интервалам, затем вычисляют частоты попадания значений в интервалы и строят гистограмму. Кумулятивная функция распределения насчитывается последней.
В случае «малых» выборок – наоборот, сначала строится кумулята частот, которая затем сглаживается. Гистограмма получается на её основе. Повышенная устойчивость гистограммы достигается именно за счёт сглаживания кумуляты частот.
«Аномальные» серии А и В
Построим кумулятивную функцию для
«аномальной» серии А ( i = 1-11 ).
1. Наносим наблюдения xi, i=1-11 (табл. А) на абсциссу х.
2. Нумеруем нанесённые точки слева направо (одновременно подсчитываем их число n; в серии А n=11).
3. По ординате над
точкой 1 откладываем
»0.091, над точкой 2 откладываем
»0.182 и т.д. Каждой точке соответствует увеличение
ординаты на
, в последней 11– ой точке
=
=1.
4. Соединяем полученные точки и получаем «ломаное» приближение кумуляты (интегральной функции распределения).
5. Сгладим ломанную по медианам треугольников ( можно и на глаз ) – точно так же, как сглаживали протокол наблюдений (прил. 1).
Проводя аналогичные действия, построим кумулятивные функции и
для «аномальной»
серии В (рис.II.5). Оценим по кумулятам средние значения
и
,
среднеквадратические отклонения
и
«аномальных» серий
А и В, данные занесём в табл. II.8.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.