Принципы построения земной поверхности. Физические принципы построения изображения. Классификация по типам приемникам чувствительным к определенным зонам эл\м излучения, страница 19

01.11.2011 года

2

При математическом подходе к анализу данных следует выделить основные этапы анализа:

1) исследования структуры объекта или явления и обнаружения однородных образований, которыми могут быть объекты или классы объектов

2) классификация объектов или признаков

3) снижения размерности пространства признаков

4) построение моделей объектов или явлений

5) статистически вероятностная интерпретация свойств объектов или явлений

При этом на первых этапах проводится качественный анализ, заключающийся в выделении групп признаков. На последующих этапах оценивается связь и они подразделяются на объясняющие и объясняемые.

3

Данные представленные в таблице являются 2-х мерными. Это обусловлено тем, что по столбцам задают одни показатели, а по стракам другими. На практике при анализе реальных явлений исследователь часто сталкивается с многомерностью их описания. Методы многомерного анализа являются эффективным количественным инструментам исследования данных описываемых большим числом параметров. К ним относятся: кластерный анализ, распознавание образов, факторный анализ. Кластерный анализ применяют при многомерном анализе классификации. Факторный – при исследовании связи. Подход с использованием кластерного анализа называют численной таксономией или численной классификацией. Главное назначений кластерного анализа разбиение исходного множества на однородные в соответствие с заданными признаками группы. Это достигается решением задач классификации данных выявлении их структур в исходном множестве. В результате кластерного анализа достаточно большой объем исходной информации может быть сжат и представлен компактно и наглядно. Кластерный анализ применим к совокупности временных рядов, характеризующих развитие процессов или явлений. Например, эрозии почвы или заболачиваемости. Кластерный анализ можно использовать циклически. В задачах прогнозирования перспективно сочетание кластерного анализа с другими количественными методами. Недостатком является то, что состав и количество кластеров зависят от выбираемых критериев разбиения. При сведении информации к более компактными виду возникают искажения. Аналогично при проведении классификаций объекта. В кластерном анализе предполагается:

1) выбранные характеристики допускают желаемое разбиение на кластеры.

2) единицы измерений и масштаб выбраны правильно.

Выбор масштаба единиц измерений играет большую роль, поскольку влияет на вычислительную погрешность и на конечный результат обработки. Полученные результаты подвергаются уравниванию.

4

Основная задача кластерного анализа разными методами, которых много. Чаще применяются следующие:

1) метод полных связей. Суть в том, что 2 объекта принадлежащих к одной и той же группы т.е кластеру имеются коэффициент сходства, который меньше некоторого порогового значения. Это означает, что расстояние между 2 точками или объектами не должно превышать также некоторого порогового значения. Это расстояния определяет максимально допустимый диаметр под множество образующего кластер.

2) метод максимального локального расстояния. В нем каждый объект рассматривается как одноточечный кластер. Объекты группируются по правилу: 2 кластера объединяются если максимальное расстояние между точками одного кластера и точками другого минимально, т.е наличие порогового значения которое является критерием объединения

3) метод Ворда. В нем в качестве целевой функции применяют внутри групповую сумму квадратов отклонения, которая представляют собой сумму квадратов расстояния между каждой точкой или объектом и средней по кластеру содержащий этот объект. На каждом шарк объединяются такие 2 кластера которые приводят к минимальному увеличения целевой функции, т.е внутригрупповой суммы квадратов. Он направлен на объединения близкорасположенных кластеров.

4) центройдный метод. Он заключается в нахождении центройда для группы объекта. Сущность в том, что центры объединения 2 кластеров близки друг к другу и характеристики второго кластера практически игнорируются.