Гистограммы: взгляд на распределение данных, страница 5

В табл. 3.4.1 содержатся данные об активах коммерческих банков из списка Fortune 1000. Эти данные представляют хороший пример сильно несимметричного (сильно скошенного) распределения.

Таблица 3.4.1. Активы коммерческих банков из Fortune 1000

Банк

Активы, млрд. дол.

Chase Manhattan Corp.

366

Citicorp

311

NationsBank Corp.

265

J. P. Morgan & Co

262

Bank America Corp.

260

First Union Corp.

157

Bankers Trust New York Corp.

140

Bank One Corp.

116

First Chicago NBD Corp.

114

Wells Fargo & Co.

97

Norwest Corp.

89

Fleet Financial Group

86

PNC Bank Corp.

75

Key Corp

74

U.S. Bancorp

71

Bank Boston Corp.

69

Wachovia Corp.

65

Bank of New York Co.

60

Sun Trust Banks

58

Republic New York Corp.

56

National City Corp.

55

Core States Financial Corp.

48

Barnett Banks

47

Mellon Bank Corp.

45

State Street Corp.

38

Comerica

36

South Trust Corp.

31

Summit Bancorp

30

Mercantile Bancorp.

30

BB&TCorp.

29

Huntington Bancshares

27

Northern Trust Corp.

25

Crestar Financial Corp.

23

Regions Financial

23

Fifth Third Bancorp

21

MBNA

21

First of America Bank Corp.

21

Firstar Corp.

20

Marshall & llsley Corp.

19

Popular

19

Amsouth Ranters Corp.

18

First Security Corp.

17

Pacific Century Financial

15

First Tennessee National Corp.

14

First Empire State Corp.

14

Old Kent Financial Corp.

14

Compass Bancshares

13

Synovus Financial Corp.

9

First National of Nebraska

7

Providian financial

4

На рисунке приведена гистограмма этого набора данных.

Из-за асимметрии распределение данных нельзя отнести к нормальному. Очень высокий столбик слева на гистограмме представляет большинство из этих банков, которые имеют активы менее 50 миллиардов долларов. Несколько столбиков, расположенных правее, представляют от­носительно небольшое число более крупных банков. Очень небольшой столбик справа на гистограмме представляет один банк — Chase Manhattan Corp., который имеет активы 366 миллиардов долларов.

Проблема с асимметрией

Одна из проблем, связанных с асимметрией данных, состоит в том, что мно­гие из наиболее распространенных статистических методов (о которых вы узнае­те в следующих главах) требуют, чтобы данные были, по крайней мере, прибли­зительно нормально распределенными. Если эти методы применяют к несиммет­ричным данным, то полученный результат может быть неточным или просто неверным. И даже если результаты получаются в основном корректными, будет определенная потеря эффективности анализа, поскольку не обеспечивается наи­лучшее использование всей информации, содержащейся в наборе данных.

Выход с помощью преобразования

Один из способов справиться с проблемой асимметрии заключается в исполь­зовании такого преобразования,которое переводит несимметричное распределе­ние в более симметричное. Преобразование заключается в замене каждого зна­чения набора данных другим числом (например, логарифмом этого значения) с целью упростить статистический анализ.