Статистический вывод: введение, страница 2

Вас может интересовать описание генеральной совокупности (т.е. всех возможных случаев) на основании описательных характеристик выборки или сравнение характеристик двух или более выборок – в любом случае вы должны располагать механизмом, позволяющим отличать истинное положение дел (истинные значения характеристик генеральной совокупности) от случайных ошибок, или ошибок выборки[1].

Этот механизм, центральный для понимания большинства процедур статистического анализа, называется теорией статистического вывода. Это самая сложная часть курса. Здесь важно не только понимать общий принцип производства суждений о генеральных совокупностях, но и хорошо знать терминологию. Возможно, вам придется возвращаться к материалам этой темы неоднократно.

В дидактических целях мы разделили материал на несколько частей. Первая посвящена выборочному распределению – теоретическому механизму, связывающему эмпирически полученную выборку с генеральной совокупностью. Используемая здесь терминология часто вызывает у студентов затруднения, поэтому чтение должно быть внимательным и неторопливым. Вместо заучивания формул или формулировок теорем советуем поиграть со статистическими иллюстрациями, ссылки на которые приводятся в учебных материалах. Суть состоит в том, что мы находим точечные оценки параметров  и оцениваем вероятность того, что эти оценки практически совпадут с параметрами.

Во второй части рассматривается общая процедура проверки статистических гипотез. В других темах курса эта процедура будет слегка модифицироваться под конкретную задачу, но принцип останется тем же. Мы рассмотрим два способа проверки статистических гипотез: проверку статистической значимости и построение доверительных интервалов. Большинство исследователей, занятых решением прикладных задач, предпочитают первый способ, более подготовленные аналитики – второй. Мы также дадим общее представление об ошибках статистического вывода.

Еще один текст, взятый из Дж. Хили, посвящен доверительным интервалам. Этот способ описания статистик и проверки гипотез особенно популярен среди квалифицированных аналитиков. Он позволяет избегать бинарных статистических выводов и обозначить диапазон, в который с указанной вероятностью попадет искомый параметр генеральной совокупности. Традиционно язык доверительных интервалов вызывает сложности у начинающих исследователей. Следующий пример может прояснить различия между точечным и интервальным оцениванием. Согласно первому способу, мы (на основании метеорологических данных) прогнозируем, что температура воздуха в Минске завтра (12 апреля) составит 6º С. Во втором случае мы скажем, что температура составит 5-7º С с доверительной вероятностью 0,95 или 3-9º С с доверительной вероятностью 0,99. (Наверняка мы можем сказать лишь то, что какая-то температура будет). В этом же файле можно найти обсуждение свойств точечных оценок параметров.

(Возможно, чуть позже появится документ, в котором будут более подробно обсуждены ошибки статистического вывода и способы управления ими. Причина выделения этого материала в самостоятельный раздел состоит в том, что здесь много путаницы, вызванной тем, что теория статистического вывода развивалась статистиками, принадлежащими к двум разным школам. В нашем изложении особое внимание будет уделено мощности статистических процедур. По нашим наблюдением, отечественные прикладные исследователи успешно работают и прекрасно себя чувствуют, игнорируя оценку мощности. Однако анализ мощности статистических процедур является непременным требованием при подготовке публикаций в западных научных журналах или заявок в западные научные фонды. Кроме того, во многих случаях анализ мощности позволяет сэкономить силы и средства на этапе сбора эмпирических данных. Мы не считаем материал третьей части обязательным, но настоятельно советуем с ним познакомиться.)

Практического задания по этой теме не предусмотрено. Вы можете присылать вопросы, касающиеся практического освоения статистической программы, в консультационном режиме. Теоретическое задание включает несколько контрольных вопросов на знание терминологии и общих принципов статистического вывода.



[1] В теории статистического вывода предполагается, что выборка сконструирована по случайному принципу, или, как предпочитают говорить статистики, является вероятностной. Основной принцип вероятностной выборки состоит в том, что каждый объект генеральной совокупности имеет одинаковую вероятность попасть в выборку. Выводы, основанные на невероятностных (неслучайных) выборках, чаще всего бывают ошибочными, смещенными. Принципы построения вероятностных или почти вероятностных выборок подробно описаны в учебниках по прикладной социологии и здесь не обсуждаются.