Изменчивость: изучение разнообразия. Стандартное отклонение: традиционный выбор. Размах: быстрая и поверхностная оценка, страница 6

С другой стороны, в силу чувствительности к предельным значениям размах оказывается не слишком полезным в качестве такой статистической меры раз­броса, которая характеризует набор данных в целом. Размах не отражает типичную изменчивость данных, а скорее фокусируется всего лишь на двух значени­ях. Стандартное отклонение более чувствительно ко всем данным, благодаря че­му эта величина дает более четкое представление об общей картине. Размах все­гда больше, чем стандартное отклонение.

Пример. Заработная плата персонала

Рассмотрим заработную плату наемных работников технического отдела фирмы, производящей товары потребительской электроники. Cамый высокооплачиваемый работник получает в год $44500 (должность руководителя технического отдела), а самый низкооплачиваемый — $16500 (молодой перспективный сотрудник, который еще не закончил образование). Размах составляет $28000 (44500 - 16500). Эта величина показывает различие в долларовом выражении между наиболее и наименее оплачиваемыми сотрудниками.

Обратите внимание, что размах рассчитывается исходя из двух предельных значений: максимальной и минимальной зарплаты. Величина размаха не отражает типичную вариацию зарплаты в отделе, для этого необходимо использовать стандартное отклонение.

Для более полного анализа можно указать, что средняя зарплата в отделе составляет $27950 и стандартное отклонение (которое лучше характеризует типичную изменчивость зарплаты) равно $8581. Это стандартное отклонение выборки. При этом инженеры фирмы рассматриваются как выборка из большого множества всех инженеров, выполняющих аналогичную работу.

5.3. Коэффициент вариации: мера относительной изменчивости

Коэффициент вариации, который определяется как результат деления стан­дартного отклонения на среднее значение, представляет собой относительную меру изменчивости и выражается в процентах или долях среднего значения. Та­кой подход особенно полезен в том случае, когда набор данных не содержит от­рицательных значений. Формула для вычисления коэффициента вариации имеет следующий вид:

Коэффициент вариации = Стандартное отклонение / Среднее

Обратите внимание на то, что стандартное отклонение стоит в числителе. Та­ким образом, результат деления характеризует изменчивость.

Так, например, если в среднем покупатель тратит в супермаркете $35,26, а стандартное отклонение составляет $14,08, то коэффициент вариации равен 14,08 / 35,26 = 0,399, или 39,9%. Это означает, что обычно суммы, которые по­купатель тратит при посещении супермаркета, отличаются от среднего значения примерно на 39,9%. В абсолютном выражении это типичное отличие от среднего размера затрат равно $14,08 (стандартное отклонение), что составляет 39,9% (коэффициент вариации) от среднего.

Коэффициент вариации - безразмерная величина. Это просто число, доля или процент. При вычислении коэффициента вариации размерность исчезает в результате деления стандартного отклонения на среднее значение. Коэффициент вариации полезен в тех случаях, когда важна не абсолютная величина отличий значений данных, но их относительная изменчивость.

Используя коэффициент вариации, можно сравнить вариацию объемов про­даж для крупной и малой фирмы "с поправкой на размер фирмы". Обычно у фирмы, оборот которой составляет сотни миллионов долларов, различия в объе­мах продаж также довольно велики — например, они могут достигать десятков миллионов долларов. Для другой фирмы, объем продаж которой исчисляется миллионами долларов, различия могут составлять сотни тысяч. Однако в каж­дом из этих двух случаев вариация составляет порядка 10% среднего значения общего объема продаж. Для большей фирмы абсолютное значение вариации окажется больше (большее стандартное отклонение), однако относительная, или учитывающая объем, величина вариации (коэффициент вариации) оказывается одинаковой для обеих фирм. Следует также отметить, что коэффициент вариации может превысить 100% даже в том случае, если все значения положительны. Это, в частности, может быть в случае сильно скошенного распределения или при наличии значений, сильно отличающихся от среднего. Такой результат означает, что в изучаемой ситуации наблюдается оченьсильная вариация по отношению к величине сред­него значения.