Процедуры оценивания. Смещение и эффективность. Процедуры интервального оценивания выборочных средних, страница 11

В США опросы стали большим бизнесом, и множество различных агентств пы­таются прогнозировать результаты выборов. Не вдаваясь в сравнение всех этих опросов, мы изучим только результаты опросов, которые проводила Gallup Organization (Институт Гэллопа)4. Использование результатов из единственного источника имеет несколько преимуществ. Во-первых, мы можем быть уверены в том, что сбор дан-

4 Полный список заархивированных результатов опросов, которые проводила GallupOrganizationпредставлен на сайте www.gallup.com/poll/releases.


214    Часть II. Статистические выводы

ных в течение длительного времени проводился последовательным образом. Во-вто­рых, Gallup Organization является независимой организацией, т.е. она не связана ни с какой политической партией, и имеет длительную историю сбора данных нацио­нальных опросов.

В таблице 7.4 представлены результаты 17 опросов, проведенных Gallup с февра­ля 2000 года и до дня выборов. В крайних правых столбцах указаны значения про­центного показателя респондентов выборки, которые на момент проведения опро­са сказали, что они намерены голосовать за Буша или за Гора. Эти значения представляют собой точечные оценки параметров генеральной совокупности (дей­ствительного процента избирателей, составляющих национальный электорат, под­держивающего Буша или Гора в данный момент времени). Обратите внимание на то, что в целях упрощения восприятия информации таблица 7.4 показывает результаты в виде процентных показателей. Действительные оценки были основаны на выбо­рочных пропорциях.

В таблице показаны три различных этапа выборов. Первый и самый продолжи­тельный этап имел место в первые дни кампании, когда Буш и Гор выдвинули свои кандидатуры от соответствующих партий. С февраля до начала августа Буш шел впе­реди, хотя иногда он обгонял своего соперника лишь на несколько пунктов. Вторая фаза началась в конце лета после Республиканской и Демократической нацио­нальных конвенций. В этот короткий период, имевший место с середины августа до середины сентября, преимущество перешло к Гору. Во время последнего этапа, с середины сентября до дня выборов, Буш вновь занял лидирующее, однако в очень незначительной степени, положение. Как мы видели в главе 2, графики являются более эффективным средством сообщения результатов, чем таблицы. На рис. 7.6 представлены данные из таблицы 7.4 и видны все три этапа соперничества между кандидатами.

Рис. 7.6. Опросы Gallup, февраль — ноябрь 2000 года

Доверительныеинтервалы

Точечные оценки, представленные в таблице 7.4 и на рис. 7.6, вряд ли точно рав­ны истинным значениям соответствующих параметров. Как мы уже видели, дове­рительные интервалы более надежны, потому что в них, для того чтобы оценить зна-


Глава 7. Процедурыоценивания     215

чения параметра генеральной совокупности, используются диапазоны значений, а не единичные точки. В таблице 7.5 представлены 95%-ные доверительные интерва­лы для каждого кандидата в течение избирательной кампании. Еще раз заметьте, что результаты выражены в виде процентных показателей, а не в виде пропорций.

Давайте проанализируем информацию, представленную в этой таблице, шаг за шагом. В левом столбце у нас представлены даты опросов, затем идет размер выборки (N) для каждого опроса. В последующих столбцах указаны 95%-ные доверительные интервалы для каждого кандидата, и, наконец, ширина интервальных оценок. На­пример, опрос, завершившийся 27 февраля показал, что 43% выборки намеревались голосовать за Гора. Заменив процентные показатели пропорциями, и подставив в формулу 7.3 соответствующие значения, мы получим доверительный интервал сле­дующего вида:

0,43 ±0,031.

После перевода выражения обратно в проценты, интервал будет иметь следую­щий вид:

43% ±3,1%.

Этот интервал простирается от 39,9 до 46,1%, а его ширина равна 6,2%.

Таблица 7.5 подтверждает очень важную мысль относительно оценивания: при увеличении размера выборки сужается ширина интервала (см. также таблицу 7.3). Например, некоторые опросы были основаны на сравнительно небольших выбор­ках, состоящих из приблизительно 500—600 вероятных избирателей. В таких случа­ях интервалы имели ширину 8,8%. В контрасте с этим последние два опроса, про­водившиеся в ноябре, были основаны на выборках гораздо большего размера, и, как следствие, интервалы имели ширину 4%, т.е. более чем в два раза уже, чем для вы­борок меньшего размера. Также обратите внимание и на то, что хотя ноябрьские вы­борки почти в четыре раза больше, чем выборки меньшего размера, соответствую­щие им интервалы лишь в два раза уже. Помните, что между шириной интервала и размером выборки не существует постоянной или линейной зависимости (см. раз­дел 7.6).