В США опросы стали большим бизнесом, и множество различных агентств пытаются прогнозировать результаты выборов. Не вдаваясь в сравнение всех этих опросов, мы изучим только результаты опросов, которые проводила Gallup Organization (Институт Гэллопа)4. Использование результатов из единственного источника имеет несколько преимуществ. Во-первых, мы можем быть уверены в том, что сбор дан-
4 Полный список заархивированных результатов опросов, которые проводила GallupOrganizationпредставлен на сайте www.gallup.com/poll/releases.
214 Часть II. Статистические выводы
ных в течение длительного времени проводился последовательным образом. Во-вторых, Gallup Organization является независимой организацией, т.е. она не связана ни с какой политической партией, и имеет длительную историю сбора данных национальных опросов.
В таблице 7.4 представлены результаты 17 опросов, проведенных Gallup с февраля 2000 года и до дня выборов. В крайних правых столбцах указаны значения процентного показателя респондентов выборки, которые на момент проведения опроса сказали, что они намерены голосовать за Буша или за Гора. Эти значения представляют собой точечные оценки параметров генеральной совокупности (действительного процента избирателей, составляющих национальный электорат, поддерживающего Буша или Гора в данный момент времени). Обратите внимание на то, что в целях упрощения восприятия информации таблица 7.4 показывает результаты в виде процентных показателей. Действительные оценки были основаны на выборочных пропорциях.
В таблице показаны три различных этапа выборов. Первый и самый продолжительный этап имел место в первые дни кампании, когда Буш и Гор выдвинули свои кандидатуры от соответствующих партий. С февраля до начала августа Буш шел впереди, хотя иногда он обгонял своего соперника лишь на несколько пунктов. Вторая фаза началась в конце лета после Республиканской и Демократической национальных конвенций. В этот короткий период, имевший место с середины августа до середины сентября, преимущество перешло к Гору. Во время последнего этапа, с середины сентября до дня выборов, Буш вновь занял лидирующее, однако в очень незначительной степени, положение. Как мы видели в главе 2, графики являются более эффективным средством сообщения результатов, чем таблицы. На рис. 7.6 представлены данные из таблицы 7.4 и видны все три этапа соперничества между кандидатами.
Рис. 7.6. Опросы Gallup, февраль — ноябрь 2000 года
Доверительныеинтервалы
Точечные оценки, представленные в таблице 7.4 и на рис. 7.6, вряд ли точно равны истинным значениям соответствующих параметров. Как мы уже видели, доверительные интервалы более надежны, потому что в них, для того чтобы оценить зна-
Глава 7. Процедурыоценивания 215
чения параметра генеральной совокупности, используются диапазоны значений, а не единичные точки. В таблице 7.5 представлены 95%-ные доверительные интервалы для каждого кандидата в течение избирательной кампании. Еще раз заметьте, что результаты выражены в виде процентных показателей, а не в виде пропорций.
Давайте проанализируем информацию, представленную в этой таблице, шаг за шагом. В левом столбце у нас представлены даты опросов, затем идет размер выборки (N) для каждого опроса. В последующих столбцах указаны 95%-ные доверительные интервалы для каждого кандидата, и, наконец, ширина интервальных оценок. Например, опрос, завершившийся 27 февраля показал, что 43% выборки намеревались голосовать за Гора. Заменив процентные показатели пропорциями, и подставив в формулу 7.3 соответствующие значения, мы получим доверительный интервал следующего вида:
0,43 ±0,031.
После перевода выражения обратно в проценты, интервал будет иметь следующий вид:
43% ±3,1%.
Этот интервал простирается от 39,9 до 46,1%, а его ширина равна 6,2%.
Таблица 7.5 подтверждает очень важную мысль относительно оценивания: при увеличении размера выборки сужается ширина интервала (см. также таблицу 7.3). Например, некоторые опросы были основаны на сравнительно небольших выборках, состоящих из приблизительно 500—600 вероятных избирателей. В таких случаях интервалы имели ширину 8,8%. В контрасте с этим последние два опроса, проводившиеся в ноябре, были основаны на выборках гораздо большего размера, и, как следствие, интервалы имели ширину 4%, т.е. более чем в два раза уже, чем для выборок меньшего размера. Также обратите внимание и на то, что хотя ноябрьские выборки почти в четыре раза больше, чем выборки меньшего размера, соответствующие им интервалы лишь в два раза уже. Помните, что между шириной интервала и размером выборки не существует постоянной или линейной зависимости (см. раздел 7.6).
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.