Одной из наиболее важных и широко используемых баз данных такого рода является Общенациональное социологическое обследование (General Social Survey, GSS). Практически каждый год, начиная с 1972, Национальный совет исследований общественного мнения (National Opinion Research Council) проводит опрос в общенациональной выборке американцев, в котором затрагивается широкий спектр вопросов. Так как многие вопросы задаются из года в год, GSS предлагает последовательную запись настроений американцев и мнений по поводу широкого спектра тем. Каждый год добавляются и исследуются новые актуальные темы, и, таким образом, множество доступной информации продолжает расширяться. Как и прочие общенациональные выборки, выборка GSS формируется в соответствии со сложным вероятностным планом, схожим с кластерной выборкой (см. главу 6). Размер выборки варьируется от 1400 до более 3000, и оценки, основанные на таких больших выборках, будут иметь точность в пределах ±3% (см. таблицу 7.4 и раздел 7.6). Компьютерные упражнения, приведенные в этой книге, основаны на общенациональном социологическом обследовании 1998 года, и эта база данных более подробно объясняется в приложении Е.
7.6. Управлениеширинойинтервальныхоценок
Шириной доверительного интервала как для выборочных средних, так и для выборочных пропорций, можно частично управлять, изменяя значения двух элементов управления. Во-первых, можно повысить или понизить доверительный уровень, и во-вторых, можно расширить или сузить интервал путем формирования выборок различного размера. Исследователь самостоятельно определяет степень риска допущения ошибки (т.е. риска того, что интервальная оценка не будет включать значе-
Глава 7. Процедуры оценивания 209
ние для генеральной совокупности), которую он хочет принять. Точное значение доверительного уровня (уровня альфа) частично будет зависеть от цели исследования. Например, если проводится проверка потенциально вредных лекарств, будет нормально, если исследователь потребует, чтобы степень доверия была очень высокой (99,99% или даже 99,999%). С другой стороны, если построение интервалов имеет целью обнародование определенных предположений, тогда можно допустить, чтобы доверительные уровни были намного ниже (например 90%).
Связь между шириной интервала и доверительным уровнем заключается в том, что ширина интервала увеличивается по мере того, как растет доверительный уровень. Это должно быть интуитивно понятным. Более широкие интервалы имеют больше шансов включить значение для генеральной совокупности. Поэтому им можно больше доверять.
Чтобы проиллюстрировать эту связь, давайте вернемся к примеру с оценкой среднего дохода группы людей. В этой задаче мы работали с выборкой, состоящей из 500 жителей, и средний доход для данной выборки составил $35000 со стандартным отклонением $200. Мы построили 95%-ный доверительный интервал и обнаружили, что он имеет следующий вид: $35000 ± 17,55.
Если бы мы построили 90%-ный доверительный интервал для этих данных (т.е. снизили бы доверительный уровень), стандартизованное значение в формуле уменьшилось бы до ±1,65, и интервал был бы более узким:
д.и. = 35,000 ±(1,65)(8,95); д.и. = 35,000 ±14,77.
С другой стороны, если бы мы построили 99%-ный доверительный интервал, стандартизованное значение в формуле выросло бы до ±2,58, и интервал был бы шире:
д.и. = 35,000 + (2,58)(8,95); д.и. = 35,000 ±23,09.
Таблица 7.2. Интервальные оценки для четырех доверительных уровней (X = $35000, s=$200, N=500).
Альфа |
Доверительныйуровень |
Интервал |
Ширинаинтервала |
0,10 |
90% |
$35000 ± 14,77 |
$29,54 |
0,05 |
95% |
$35000 + 17,55 |
$35,10 |
0,01 |
99% |
$35000 ± 23,09 |
$46,18 |
0,001 |
99,9% |
$35000 ± 29,45 |
$58,90 |
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.