Обобщающие показатели: интерпретация типических значений и перцентилей, страница 6

Медиана имеет ранг (1 + n)/2.

С учетом всех возможных особых случаев медиана для списка из п   элемен­тов вычисляется таким образом.

1. Расположите элементы данных в порядке возрастания (или уменьшения - это не имеет значения).

2. Определите среднее значение полученного ряда. Возможны два варианта:

а) Если п— нечетное число, то медианой будет среднее значение данных, которое имеет номер (1 + n)/2, если отсчитывать от любого из двух кон­цов упорядоченного списка. Например, медиана списка 15, 27, 14, 18, 21 из п = 5 значений равняется:

медиана (15, 27, 14, 18, 21) = медиана (14, 15, 18, 21, 27) = 18.

Следует отметить, что медиана, 18, это третье по порядку значение в упо­рядоченном списке, что соответствует формуле, поскольку (1 + n)/2 = (1 + 5)/2 = 3.

В качестве примера порядковых данных рассмотрим список рейтингов об­лигаций ААА, А, В, АА, А. Для этого списка медиана будет вычисляться следующим образом:

медиана (ААА, А, В, АА, А) = медиана (В, А, А, АА, ААА) = А.

б)  Если п  - четное число, то ряд имеет не одно, а два средних значения. Эти значения расположены на расстоянии   (1 + n)/2   от каждого из двух концов упорядоченного списка данных.

в)  Если набор данных количественный (т.е. состоит из чисел), то медианой является среднее этих двух значений,  расположенных в середине ряда. Например, медиана списка 15, 27, 14, 18 из n  = 4 чисел вычисляется сле­дующим образом:

медиана (15, 27, 14, 18) = медиана (14, 15, 18, 27) = (15 + 18)/2 = 16,5.

В этом случае по формуле (1 + n)/2 имеем: (1 + 4)/2 = 2,5; что говорит о необходимости пройти в упорядоченном списке половину пути между вто­рым и третьим числом, усреднив эти два числа.

г)  Если набор данных является порядковым (т.е. содержит упорядоченные категории) и если два расположенных в середине ряда значения представ­ляют одну и ту же категорию, то эта категория является медианой. Если эти два значения представляют различные категории, то обе эти категории будут медианами. Например, для списка рейтингов облигаций А, В, АА, А медиана будет равна:

медиана (А, В, АА, А) = медиана (В, А, А, АА) = А,

поскольку оба расположенных посередине значения равны А.

В другом примере для списка рейтингов облигаций А, ААА, В, АА, ААА, В медиана будет вычисляться следующим образом:

медиана (А, ААА, В, АА, ААА, В) = медиана (В, В, А, АА, ААА, ААА) = А и АА.

Это лучшее, что можно сделать в данной ситуации, так как для порядко­вых данных нельзя вычислить среднее двух значений.

Чем отличается медиана от среднего? Если набор данных распределен нор­мально, то значения медианы и среднего близки между собой, поскольку нормальное распределение симметрично и имеет четко выраженную сред­нюю точку. Однако даже при нормальном распределении (здесь речь идет о "практически нормальном" распределении, а не о теоретически нормальном распределении)среднее и медиана несколько отличаются друг от друга, поскольку каждая из этих величин определяется по-своему и, кро­ме того, в реальных данных почти всегда присутствует некоторая случай­ность. Если набор данных не подчиняется нормальному распределению, то медиана и среднее могут сильно различаться, потому что у асимметричного распределения нет четко выраженной центральной точки. Обычно среднее по отношению к медиане сдвинуто в направлении более длинного хвоста или в направлении выброса, поскольку среднее реально учитывает значения таких экстремальных наблюдений, в то время как для медианы важно лишь, по какую сторону от нее лежит то или иное значение.

Пример. Стадии сборки компьютерных системных блоков

Рассмотрим процесс производства компьютеров, состоящий из следующих стадий.

Производство материнской платы.

Установка разъемов на материнскую плату.

Установка в разъемы электронных микросхем.

Тестирование собранной материнской платы.

Установка собранной материнской платы в системный блок компьютера.

Тестирование собранного системного блока.

Если у вас имеется набор данных, в котором для каждого системного блока указано, на какой из произ­водственных стадий изготовления он находится, то такой одномерный набор порядковых данных может иметь следующий вид: