Начальным выборочным моментом k-го порядка называется среднее арифметическое k-х степеней вариант выборки, т.е.
Центральным выборочным моментом k-го порядка называется среднее арифметическое k-х степеней отклонения вариант выборки от выборочного среднего, т.е.
.
Эти выборочные моменты являются точечными оценками соответствующих теоретических моментов случайной величины m.
Если Fm(x) = F(x; q1, q2, ... , qr) зависит от r параметров, то естественно потребовать, чтобы моменты k-го порядка случайной величины mсовпадали с выборочными моментами этого же порядка, т.е.
mk = , k = или = k = .
В частности, если m – непрерывная случайная величина и fm(x) = f(x; q) , то
,
отсюда формально находим .
Пример 3.5. По данным случайной выборки найти точечную оценку для параметра l показательного распределения.
.
Решение.q = l, , .
Пример 3.6. Найти точечные оценки для границ a и bравномерного распределения на отрезке [a, b].
Решение. Записываем равенства теоретических и выборочных начальных моментов двух первых порядков
.
,
,
, b = 2 – a, a2 + 2a – a2 + (2 – a)2 = 3,
a2 + 2a – a2 + 4 – 4a + a2 = 3, a2 – 2a + 4 – 3= 0,
,
b1,2 = 2 – () = ,
так как по определению плотности равномерного распределения a < b, получаем
; = .
3.3.2. Метод наибольшего правдоподобия
Пусть – дискретная случайная величина, заданная законом распределения:
|
t1 |
t2 |
. . . |
|
, . |
Р |
p1 |
p2 |
. . . |
|
Рассмотрим функцию вида L = L(x1, x2, . . . xn; q) = P(x1; q)P(x2; q)×...×P(xn; q), которая называется функцией правдоподобия. Здесь P(xi; q) = P(m = xi).
Функция правдоподобия представляет собой вероятность получения (реализации) выборки. А так как выборка уже имеется, т.е. реализована, то значение этой функции должно быть равно 1. Но в силу случайного характера, как правило, эта функция отлична от 1, но должна быть, по крайней мере, максимальной. Записав необходимое условие существования экстремума (max), получаем уравнение:
, (3.2)
которое называется уравнением правдоподобия.
Решение этого уравнения – называется оценкой наибольшего правдоподобия.
Если закон распределения зависит не от одного, а от r параметров, рассуждая аналогично, получим систему уравнений (необходимое условие существования экстремума функции нескольких переменных).
, k=. (3.3)
Функция L является произведением nфункций, а n , как правило, очень велико. Поэтому левые части уравнений (3.2) и (3.3), как правило, будут вычисляться очень сложно. Поэтому часто рассматривается логарифмическая функция правдоподобия
= lnL=
теперь это уже сумма слагаемых, производная которой вычисляется значительно проще.
В силу монотонности логарифмической функции, точки экстремума функцийLи будут совпадать. Поэтому (3.2) ; а (3.4) 0 , k = .
Пример 3.7. По имеющейся случайной выборке , xi Î N{0} найти оценку наибольшего правдоподобия для параметра l случайной величины m, распределённой по закону Пуассона: .
Решение. Строим функцию правдоподобия:
; .
Обозначим , тогда
L = c, ,
(3.3) , отсюда .
Если - непрерывная случайная величина, то в этом случае функция правдоподобия определяется из равенства:
L(x1, ..., xn; q)D x1 . . . D xn = f(x1; q)Dx1 . . . f(xn; q)Dxn ,
в правой части которого вероятность того, что многомерная случайная величина = (x1, ..., xn) примет значение из параллелепипеда со сторонами: Dx1, Dx2, ..., Dxn. Из этого равенства находим L = f(x1; q) ... f(xn; q) , т.е. функция правдоподобия пропорциональна вероятности реализации выборки, значит и для непрерывной случайной величины справедливы ранее записанные уравнения (3.2), (3.3).
Пример 3.8. Найти оценки наибольшего правдоподобия m, s нормального распределения.
Решение. Пусть q1 = m, q2 = s, .
,
,
.
,
, m = , ,
, .
Таким образом, , .
Оценки наибольшего правдоподобия всегда являются состоятельными и эффективными.
3.4. Проверка статистических гипотез
3.4.1. Основные понятия
Любое предположение, основанное на результатах анализа случайной выборки относительно теоретической функции распределения, называется статистической гипотезой (или гипотезой).
Например, в схеме Бернулли:
1) вероятность появления события А в отдельном испытании равна 0,4,
2) вероятность появления события А в отдельном испытании р> 0,7,
3) вероятность появления события А в отдельном испытании 0,3 < p < 0,4
или в общем случае;
4) случайная величина m распределена по нормальному закону с параметрами: m = 0, s = 1,
5) при нормальном законе распределения D(m) = s2£ M2(m),
6) случайная величина m распределена по показательному закону,
7) случайная величина распределена по показательному закону, параметр которого 1£ l£ 2.
Основная задача – по результатам случайной выборки определить: справедлива или несправедлива выдвинутая гипотеза.
С любой гипотезой можно рассматривать непересекающуюся гипотезу. Одна из них называется основной гипотезой – H0, вторая – конкурирующей или альтернативной – H1.
Это разделение условно. Обычно в качестве основной гипотезы принимается та, которая несёт больше информации о теоретической функции распределения.
Все гипотезы разделяются на простые и сложные.
Гипотезаназывается простой, если она полностью определяет теоретическую функцию распределения (в примере это гипотезы 1 и 4), все остальные гипотезы называются сложными.
Каждая из гипотез выделяет некоторый класс функций распределения.
Обозначим эти множества: F0 и F1, тогда:
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.