Методы повышения эффективности процессов добычи и транспорта газа, страница 33

Далее расчет проводился с использованием двух наиболее информативных признаков — Ci/C5H-b и Cs+b. Как видно из табл. III.7, при выборке 10 месторождений каждого класса этот метод дает 100%-ную сходимость.

Та

блица III.7

Число месторожде-

Число месторождений,

Месторождения, выдержавшие

Число месторождений,

Месторождения, выдержавшие

ний, взятых

выдержавших

экзамен по классу

выдержавших

экзамен по классу

на обучение

экзамен из 29 (класс А)

А, %

экзамен из 30 (класс В)

В. %

4

20

68,96

30

100

6

28

■   96,5

30

100

8

28

96,5

30

100

10

100,0

30

100

12

29

100,0

30

100

14

29

100,0

30

100

16

29

100,0

30

100

18

29

100,0

30

100

20

29

100,0

30

100

Метод главных компонент

Главные компоненты — это линейные комбинации исходных из­мерений, дисперсии которых обладают особыми свойствами [23]. Пусть имеем совокупность реализации двух образов А и В. Общую дисперсию о2об можно представить в виде суммы двух

составляющих — дисперсии центров тяжестей образов относи­тельно общего центра тяжести оА и  усредненной  собственной

дисперсии образа olo6A. Чем больше дисперсии центров тяжести образов ал и а|, тем лучше в среднем разделимость образов, и

чем больше усредненная собственная дисперсия, тем хуже раз­делимость образов. Каждую из указанных дисперсий можно вычислить, зная всю совокупность признаков, характеризующих данный образ.

Задача классификации образов заключается в максимизации дисперсии центров тяжести или минимизации усредненной соб­ственной дисперсии. Для нахождения линейных комбинаций величин, обладающих максимальными дисперсиями, применяет­ся метод главных компонент. Главные компоненты являются характеристическими векторами ковариационной матрицы, а ее характеристические корни — дисперсиями главных   компонент.

.64


Сумма дисперсий главных компонент равна сумме дисперсий исходных величин. Таким образом, задача анализа с помощью главных компонент состоит в оценке характеристических векто­ров |3 и характеристических корней Я ковариационной матрицы.

Геометрически нахождение вектора главных компонент сво­дится к переходу к новой ортогональной системе координат, об­ладающей характерными свойствами, а именно: соответствующее новое положение осей координат последовательно определяет максимальную дисперсию исходных параметров при постоянстве суммы дисперсий 2Хг~^о2.об .

Так как признаки, характеризующие выбранные месторожде­ния, имеют различные размерности, то необходимо пронормиро­вать исходные данные. Нормировка проводилась   по   формуле

v          №Xi (хтах
XtB= —------- —

^       i~ -"-mill

где xia— нормированное значение признака; Xi — текущее значение того же признака; Хт&х, #тш — соответственно макси­мальное и минимальное значения признака совместно для клас­сов А и В.

Расчет по методу главных компонент был проведен по 59 месторождениям (см. табл. III.I, III.2) с использованием восьми признаков (без содержания N2).

На основе этих данных строим ковариационную матрицу S, диагональные элементы которой являются дисперсиями, т. е. суммой квадратов отклонений от средних значений, внедиаго-нальные — ковариациями, т. е. суммой взаимных произведений отклонений от среднего, деленных на (N—1), где ./V — число месторождений. След ковариационной матрицы, равный сумме

дисперсий исходных величин, составляет 2а* об =1,817.

1

Для нахождения нормированной линейной комбинации, име­ющей максимальную дисперсию, используем метод определения собственных значений или корней, а также метод собственных векторов матрицы, изложенный в [46].