Изменчивость: изучение разнообразия. Стандартное отклонение: традиционный выбор. Размах: быстрая и поверхностная оценка, страница 4

В случае нормального распределения следует ожидать, что примерно 95% всех данных окажутся в пределах двух величин стандартного отклонения от среднего значения. Этот факт будет иметь боль­шое значение при рассмотрении статистических выводов, поскольку допустимые погрешности оценок часто ограничиваются величиной 5%.

И, наконец, мы вправе предположить, что почти все данные (99,7%) будут находиться в пределах трех величин стандартного отклонения от среднего значения. При этом только 0,3% всех значений набора данных оказываются от среднего на большем удалении. На рисунке можно видеть, что график нор­мального распределения на расстояниях порядка трех стандартных отклонений от среднего опускается почти до нуля.

В картах контроля, которые широко ис­пользуют для контроля качества продукции, пределы часто устанавливаются та­ким образом, чтобы в качестве заслуживающей внимания проблемы выступали именно те результаты наблюдений, которые отстоят от среднего на расстоянии, большем чем три стандартных отклонения.

В случае идеального нормального распределения в точности 95% всех данных попадают в об­ласть вблизи среднего значения в пределах 1,96 стандартного отклонения. Поскольку величина 1,96 достаточно близка к значению 2, мы используем описание "две величины стандартного отклонения" в качестве удобного и хорошего приближения.

Что же происходит в том случае, если набор данных не подчиняется нормаль­ному распределению? В таком случае описанные выше проценты применять нельзя. К сожалению, поскольку существует множество скошенных (или других, отли­чающихся от нормального) распределений, нельзя указать единое правило опреде­ления таких процентов для произвольного распределения.

Существует, однако, ограничение, которое называется правилом Чебышева. В соответствии с этим правилом, по меньшей мере 1 - 1/а2 значений попадает в промежуток, лежащий в преде­лах а стандартных отклонений от среднего значения. Например, при а = 2 по меньшей мере 75% данных (это значение рассчитывается как 1 - 1/а2) должно находиться не далее, чем на расстоянии удвоенного стандартного отклонения от среднего, даже если распределение не яв­ляется нормальным (сравните с величиной для нормального распределения, составляющей примерно 95%). Если а = 3, по меньшей мере 88,9% данных будет находиться в пределах ут­роенного стандартного отклонения от среднего значения.

Пример. Контрольные карты

Кар­та контроля содержит результаты отдельных измерений, средние значения (которые, как можно видеть, проходят через центр данных) и контрольные границы (которые устанавливаются выше и ниже среднего значения на расстоянии трех стандартных от­клонений). На рисунке показан пример карты контроля качества.

Показаны линии нижней и верхней контрольных границ, среднее значение, которое проходит через центр данных. Система находится под контролем, и есть только случайные отклонения от среднего, поскольку в отклонениях нет четких тенденций и результатов измерений, которые выходят за пре­делы контрольных границ. Карты контроля качества помогают выявить проблему. Дальнейшее исследование и исправление ситуации зависит от менеджера.

Стандартное отклонение выборки и генеральной совокупности

Существуют два различных (однако связанных между собой) вида стандарт­ного отклонения: стандартное отклонение выборки (для выборки, сделанной из большей генеральной совокупности, обозначается буквой S) и стандартное от­клонение генеральной совокупности (для всей генеральной совокупности, обо­значается буквой s — малая греческая буква "сигма").

Названия этих величин отражают правила их использования. В случае рабо­ты с выборкой данных, взятых случайным образом из большей генеральной со­вокупности, используется стандартное отклонение выборки. Если же изучается вся генеральная совокупность, следует использовать стандартное отклонение ге­неральной совокупности (часто также используют термины "выборочное стан­дартное отклонение" и "генеральное стандартное отклонение" соответственно).