Исследование Законов распределения. Статистики Колиогорова, страница 3

Пусть X = (X1, ,.., Хn)выборка объема n из распределения L(x) и x = (x1, ..., xn) — наблюдавшееся значение X. Каждой реализации х выборки X можно поставить в соответствие упорядоченную последовательность [4]

x(1)<=x(2)<=…<=x(n)                                                         (1.1)

где   x(1)=min(x1,  ...,xn),  x(2)второе   по   величине значение среди x1,…, xnи т. д., x(n) = max(x1,…, xn).

Обозначим через X(k) случайную величину, которая для каждой реализации х выборки X принимает значение x(k), k = 1, ..., n. Так по выборке X определяют новую последовательность случайных величин Х(1), ..., Х(n), называемых порядковыми статистиками выборки [4]; при этом Х(k]—k-я порядковая статистика, а X(1), и X(n) — экстремальные значения выборки. Из определения порядковых статистик следует, что они удовлетворяют неравенствам

X(1)<=X(2)<=…<=X(n)                                          (1.2)

Эту последовательность  называют вариационным рядом выборки.

Симметричные относительно концов элементы последовательности Х(m) и      Х(n-m+1) иногда называют соответственно m-м наименьшим и m-м наибольшим значениями выборки (m=1, 2, ...); при m= 1 получаем экстремальные значения выборки. Итак, вариационный ряд— это расположенные в порядке возрастания их величин элементы выборки. Отметим, что для заданной реализации x = (x1, ..., xn) выборки  X = (X1, ,.., Хn) реализацией последовательности (1.2) является последовательность (1.1).

1.3. Эмпирическая функция распределения

Определим для каждого действительного х случайную величину mn(х), равную числу элементов выборки Х = (Х1 ..., Xn) [5], значения которых не превосходят х, т. е.

mn(х)= |{j:Xj<=x}|

где через |А| обозначено число элементов конечного множества А, и положим Fn(x)= mn(х)/n. Функция Fn(x) называется эмпирической функцией распределения (соответствующей выборке X) [5]. Функцию распределения F{x) наблюдаемой случайной величины x в этом случае называют иногда теоретической функцией распределения.

По своему определению эмпирическая функция распределения — случайная функция: для каждого х Î R значение Fn (х) — случайная величина, реализациями которой являются числа 0, 1/n, 2/n, ..., {n — 1)/n, n/n = 1, и при этом

P (Fn(x) = k/n) = P (mn(х)=k).

Но  из  определения  mn(х) следует,   что L (mn(х)) = Bi (n, р), где р = Р (x<=х) = F (х). Поэтому

P (Fn(x) = k/n) = Cnk Fk(x)(1-F(x))n-k,   k = 0, 1, ..., n.

Итак, эмпирическая функция распределения (как и вариационный ряд)— некоторая сводная характеристика выборки. Для каждой реализации х выборки X функция Fn(x) однозначно определена и обладает всеми свойствами функции распределения: изменяется от 0 до 1, не убывает к непрерывна справа. При этом она кусочно-постоянна и возрастает только в точках последовательности (1.1). Если все компоненты вектора х различны (в последовательности (1.1) все неравенства строгие), то функция Fn(x) задается [5], очевидно, соотношениями

                                  

0    при x<x(1),

Fn(x) =       k/n при x(k) ≤ x ≤  x(k+1),

1 при x ≥ x(n),

т. е. в этом случае величина всех скачков равна 1 /n. В общем случае эмпирическую функцию распределения можно записать в виде

Fn(x) = 1/n                   (1.3)

где   е(х) — функция   единичного   скачка  [6] (функция   Хевисайда):                     

 при  x<0,  при  x>=0.

В представлении   (1.3) хорошо видна зависимость Fn(x) от выборки X.

Эмпирическая функция распределения играет фундаментальную роль в математической статистике. Важнейшее её свойство состоит в том, что при увеличении числа испытаний над случайной величиной x происходит сближение этой функций с теоретической.

Таким образом, если объем, выборки большой, то значение эмпирической функции распределения в каждой точке х может служить приближенным значением (оценкой) теоретической функции распределения в этой точке. Функцию Fn(x) часто называют в этом случае статистическим аналогом для F (х).

1.4.  Проверка гипотез о виде распределения