Далее расчет проводился с использованием двух наиболее информативных признаков — Ci/C5H-b и Cs+b. Как видно из табл. III.7, при выборке 10 месторождений каждого класса этот метод дает 100%-ную сходимость.
Та |
блица III.7 |
|||
Число месторожде- |
Число месторождений, |
Месторождения, выдержавшие |
Число месторождений, |
Месторождения, выдержавшие |
ний, взятых |
выдержавших |
экзамен по классу |
выдержавших |
экзамен по классу |
на обучение |
экзамен из 29 (класс А) |
А, % |
экзамен из 30 (класс В) |
В. % |
4 |
20 |
68,96 |
30 |
100 |
6 |
28 |
■ 96,5 |
30 |
100 |
8 |
28 |
96,5 |
30 |
100 |
10 |
2Э |
100,0 |
30 |
100 |
12 |
29 |
100,0 |
30 |
100 |
14 |
29 |
100,0 |
30 |
100 |
16 |
29 |
100,0 |
30 |
100 |
18 |
29 |
100,0 |
30 |
100 |
20 |
29 |
100,0 |
30 |
100 |
Метод главных компонент
Главные компоненты — это линейные комбинации исходных измерений, дисперсии которых обладают особыми свойствами [23]. Пусть имеем совокупность реализации двух образов А и В. Общую дисперсию о2об можно представить в виде суммы двух
составляющих — дисперсии центров тяжестей образов относительно общего центра тяжести оА и усредненной собственной
дисперсии образа olo6A. Чем больше дисперсии центров тяжести образов ал и а|, тем лучше в среднем разделимость образов, и
чем больше усредненная собственная дисперсия, тем хуже разделимость образов. Каждую из указанных дисперсий можно вычислить, зная всю совокупность признаков, характеризующих данный образ.
Задача классификации образов заключается в максимизации дисперсии центров тяжести или минимизации усредненной собственной дисперсии. Для нахождения линейных комбинаций величин, обладающих максимальными дисперсиями, применяется метод главных компонент. Главные компоненты являются характеристическими векторами ковариационной матрицы, а ее характеристические корни — дисперсиями главных компонент.
.64
Сумма дисперсий главных компонент равна сумме дисперсий исходных величин. Таким образом, задача анализа с помощью главных компонент состоит в оценке характеристических векторов |3 и характеристических корней Я ковариационной матрицы.
Геометрически нахождение вектора главных компонент сводится к переходу к новой ортогональной системе координат, обладающей характерными свойствами, а именно: соответствующее новое положение осей координат последовательно определяет максимальную дисперсию исходных параметров при постоянстве суммы дисперсий 2Хг~^о2.об .
Так как признаки, характеризующие выбранные месторождения, имеют различные размерности, то необходимо пронормировать исходные данные. Нормировка проводилась по формуле
v №Xi — (хтах —
XtB=
—------- —
^ i~ -"-mill
где xia— нормированное значение признака; Xi — текущее значение того же признака; Хт&х, #тш — соответственно максимальное и минимальное значения признака совместно для классов А и В.
Расчет по методу главных компонент был проведен по 59 месторождениям (см. табл. III.I, III.2) с использованием восьми признаков (без содержания N2).
На основе этих данных строим ковариационную матрицу S, диагональные элементы которой являются дисперсиями, т. е. суммой квадратов отклонений от средних значений, внедиаго-нальные — ковариациями, т. е. суммой взаимных произведений отклонений от среднего, деленных на (N—1), где ./V — число месторождений. След ковариационной матрицы, равный сумме
дисперсий исходных величин, составляет 2а* об =1,817.
1
Для нахождения нормированной линейной комбинации, имеющей максимальную дисперсию, используем метод определения собственных значений или корней, а также метод собственных векторов матрицы, изложенный в [46].
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.