§13. Задача о долях
В медицине очень часто приходится иметь дело с качественными признаками, то есть такими показателями объектов, которые описываются словами. Например, среди объектов наблюдения врача сколько-то лиц мужского или женского пола или самочувствие в группе прооперированных больных описывается как «хорошее», «удовлетворительное», «неудовлетворительное».
Рассмотрим такой пример. Пусть среди группы больных в 60 человек, прооперированных по поводу язвы желудка старым способом оказалось 15 человек с осложнениями. А в группе из 40 человек, прооперированных новым способом с осложнениями оказалось 5 человек. Тогда доля тех, кто имеет осложнения в первой группе, составляет 15/60=1/4 , или 25%, а во второй группе - 5/40=1/8 или 12,5%
А поскольку мы вычисляем доли по формуле, являющейся статистическим определением вероятности, то и обозначим долю той же буквой, что и вероятность, но только с индексом - рd, чтобы отличать дальше долю от доверительной вероятности Р. Итак формула для доли рd:
pd=.
Найденные доли, вычисленные по выборке, является аналогом среднего арифметического. А насколько эти числа достоверны для генеральной совокупности? Выборочная доля рв является точечной оценкой доли в генеральной совокупности, которую обозначим как ргс
Тогда ошибка в измерении разности долей будет находиться по формуле:
=.
Используя уже известную нам логику, сравним различие в долях с ошибкой в нахождении этой разности. В результате чего получим критерий
.
Определение погрешности вычисления доли – это по сути задача интервального оценивания доли в генеральной совокупности ргс по доле, найденной по выборке.
Для СКО средних значений доли (стандартной ошибки) имеется формула, которую мы приводим без доказательства.
=,
Тогда ошибка в измерении доли:
.
Замечание: в теории математической статистики все формулы для работы с долями выводятся при условии наличия достаточно большой выборки. А из этого вытекают два следствия:
1. При определении доли выборка по крайней мере не должна быть меньше 30 объектов;
2. При работе с долями для параметра t значения нужно брать только из таблицы значений функции Лапласа или по таблице Стьюдента на строке ∞.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.