Чтобы вычислить стандартное отклонение, необходимо выполнить следующее.
1. Найти отклонения, вычитая из каждого значения набора данных среднее.
2. Возвести полученные величины отклонений в квадрат, сложить их и разделить полученную сумму на n- 1. Полученный результат называется дисперсией.
3. Извлечь квадратный корень. Полученное значение и есть стандартное отклонение.
При работе с данными обо всей генеральной совокупности необходимо использовать стандартное отклонение генеральной совокупности (обозначается буквой s). В том случае, если необходимо сделать обобщение и перейти от имеющегося набора данных к некоторому большему множеству (реальному или гипотетическому), используется стандартное отклонение выборки (обозначается буквой S). При возникновении сомнений в том, какую их этих величин применить, нужно использовать стандартное отклонение выборки.
При вычислении стандартного отклонения выборки делят на n- 1, поскольку отклонения вычисляют на основе неопределенного среднего значения выборки, а не на основе точного среднего значения генеральной совокупности.
Дисперсия — это квадрат стандартного отклонения. Эта величина несет ту же информацию, что и стандартное отклонение. Однако интерпретация дисперсии затруднена тем, что единицы измерения дисперсии представляют собой квадрат единиц измерения исходных данных (например, доллар в квадрате, квадратные мили на один галлон в квадрате или килограммы в квадрате, независимо от содержательного смысла таких единиц). В связи с этим в качестве характеристики изменчивости чаще используют стандартное отклонение.
Если данные имеют нормальное распределение, стандартное отклонение равно приблизительно половине длины отрезка числовой прямой, который содержит две трети всех значений набора данных. Это означает, что приблизительно две трети всех значений находятся на расстоянии не более одной величины стандартного отклонения от среднего (выше или ниже среднего). Приблизительно 95% всех значений находятся на расстоянии не более двух величин стандартного отклонения от среднего, а около 99,7% значений лежат в пределах трех стандартных отклонений от среднего. Однако не следует ожидать справедливости этих утверждений для других (отличающихся от нормального) распределений.
Размах равен разности между максимальным и минимальным значениями набора данных. Эта величина характеризует протяженность, или ширину, набора данных. Размах используют как для описания данных, так и для поиска проблем в данных (в частности, для поиска ошибок при записи значений). Как статистическая характеристика размах имеет тот недостаток, что он акцентирует внимание только на экстремальных значениях и не учитывает типичные значения. Для большинства целей статистического анализа в качестве меры изменчивости более полезно использовать стандартное отклонение.
Коэффициент вариации равен частному от деления стандартного отклонения на среднее значение и характеризует относительную изменчивость данных, выраженную в долях или процентах от среднего. Коэффициент вариации — безразмерная величина. Он может быть полезен при сравнении изменчивости наборов данных, представленных в различных единицах измерения.
Прибавление фиксированного числа ко всем значениям набора данных приводит к увеличению среднего, медианы, перцентилей и моды на такое же число; стандартное отклонение и размах при этом не изменяются. При умножении каждого из значений набора данных на фиксированное число все характеристики — среднее, медиана, перцентили, мода, стандартное отклонение и размах - умножаются на это же число, а коэффициент вариации не изменяется. Стандартное отклонение и размах умножаются на абсолютное значение этого числа и таким образом остаются положительными.
При умножении каждого из значений данных на некоторое число и прибавлении другого фиксированного числа два описанных выше правила действуют совместно. Коэффициент вариации можно легко определить после того, как с применением этих правил вычисляется среднее и стандартное отклонения.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.