Изменчивость: изучение разнообразия. Стандартное отклонение: традиционный выбор. Размах: быстрая и поверхностная оценка, страница 8

5.4. Результаты прибавления константы или изменения шкалы

Если ситуация изменяется определенным систематическим образом, то необ­ходимость в пересчете таких характеристик, как типичные значения (среднее значение, медиана, мода), перцентили или меры изменчивости (стандартное от­клонение, размах, коэффициент вариации) не возникает. Существует несколько основных правил быстрого вычисления соответствующих показателей для изме­нившейся ситуации.

Если к каждому значению данных прибавляется фиксированная величина, для получения соответствующих характеристик полученного таким образом но­вого набора данных эту же величину необходимо прибавить к среднему, медиа­не, моде и перцентилям исходного набора данных. Так, например, прибавление нового сбора в $5 к счетам, равным $38, $93, $25 и $89, означает, что эти счета окажутся равными $43, $98, $30 и $94. Средняя величина счета выросла ровно на $5, с $61,25 до $66,25. Вместо того чтобы рассчитывать среднее значение для новых счетов, можно просто прибавить $5 к найденному ранее среднему значе­нию. Это правило применимо и для других типичных значений. Так, например, медиана в данном случае возрастает на $5, с $63,50 до $68,50. Однако стан­дартное отклонение и размах остаются прежними, поскольку сдвиг значений со­храняет между ними прежние расстояния. Коэффициент вариации изменяется, но его можно легко рассчитать, исходя из стандартного отклонения и среднего значения нового набора.

Если каждое значение данных умножается на фиксированное число, для полу­чения среднего, медианы, моды, перцентилей, стандартного отклонения и размаха нового набора данных соответствующие показатели исходного набора необходимо умножить на это же число. Коэффициент вариации остается без изменений. Здесь предполагается, что постоянный множитель больше нуля. В случае отрицательного множителя для вычисления стандартного отклонения и размаха необходимо использовать его абсолютное значение.

Если все входящие в набор данных величины умножаются на множитель cи к ним прибавляется величина d, приведенные выше правила действуют совмест­но: величина Xпревращается в cХ + d. Новое среднее значение при этом оказы­вается равным с * (старое среднее) + d. Аналогичные изменения претерпевают медиана, мода и перцентили. Новое стандартное отклонение равно |с| * (старое стандартное отклонение). Аналогичным образом корректируется и размах (обра­тите внимание на то, что величина прибавляемого значения dв этом случае не оказывает никакого влияния). Стандартное отклонение умножается на абсолютную величину множителя, так что оно оста­ется положительным. Например, при с = -3 стандартное отклонение умножается на 3.

Новый коэффициент вариации легко можно вы­числить на основе новых значений среднего и стандартного отклонения.

Резюме

Изменчивость (которую также называют разнообразием, неопределенностью, рассеянием, разбросом и вариацией) представляет собой меру различия отдель­ных значений набора данных между собой. В то время как величины, характе­ризующие центр (такие как среднее значение, медиана, мода) указывают типич­ную для набора данных величину значений, изменчивость показывает, насколько близко к этому центру обычно располагаются отдельные значения набора дан­ных. Если все величины данных одинаковы, изменчивость равна нулю. Чем больше разброс величин, тем больше изменчивость.

Стандартное отклонение, которое обычно используют в качестве характери­стики изменчивости, отражает типичное расстояние между средним значением и отдельными значениями набора данных. Стандартное отклонение показывает степень случайности в расположении отдельных значений относительно их об­щего среднего. Отклонения - это расстояния между каждым из значений и средним значением набора данных. Положительные отклонения соответствуют значениям, превышающим среднее, а отрицательные отклонения — значениям, меньшим среднего. Усреднение этих отклонений всегда дает результат, равный нулю. Стандартное отклонение показывает типичную величину таких отклоне­ний (знак "минус" при этом не учитывается) и представляет собой число, изме­ряемое в тех же единицах, что и исходные данные (например, в долларах, в ми­лях на один галлон или в килограммах).