Анализ и трансформация данных для решения задачи. В соответствии с целевой установкой и выбранной моделью должен быть произведен анализ исходных данных для уточнения списка и преобразования минерагенических факторов и поисковых признаков. Основных итогом анализа, проводимого на этом этапе, является формирование окончательного варианта исходной для решения задачи цифровой модели (матрицы) данных.
Минерагенические факторы должны быть проанализированы с целью обнаружения тесных взаимосвязей между характеристиками их роли в процессе рудообразования или локализации оруденения. Среди дублирующих необходимо оставить наиболее важные, остальные удалить.
При обнаружении аномальных значений характеристик может быть сделано заключение о том, что соответствующий объект — продуктивный. Удалять такие объекты и соответствующие им факторы не следует. При резком различии роли разных факторов при определении их значимости следует вводить шкалу весов свойств.
Основными функциями этапа являются:
— определение необходимости изменения шкалы и масштаба измерения характеристик;
— выявление и корректировка аномальных (ураганных) значений;
— выявление взаимосвязанных (дублирующих) характеристик;
— анализ заполненности для получения плотной матрицы.
Выбор способа решения задачи осуществляется на основе определения представительности материала обучения, выбора информативной совокупности характеристик и анализа расположения объектов в признаковом пространстве. В результате проведения этого этапа анализа данных осуществляется формальная постановка задачи (например, как задачи распознавания, задачи таксономии или задачи направленного поиска) и выбор способа и алгоритма её решения (т.е. выбор класса решающих правил, например линейных, и конкретного алгоритма, применяемого для получения решения, например алгоритма построения дискриминантной плоскости).
На каждом из этапов система обеспечивает последовательное выполнение функций и анализ текущего состояния задачи с выработкой рекомендаций по коррекции данных, уточнению постановок задач, выбору методов решения и т.д. При этом окончательное решение о трансформации данных, исключении признаков принимает специалист-геолог в процессе работы с системой в интерактивном режиме.
Поскольку границы между формальными задачами размыты, система не рассматривает первоначальный выбор формальной задачи как догму и может изменить ее на какую-либо другую, если для решения поставленной задачи не хватает данных или они недостаточного качества. Например, при недостаточной информации об эталонных объектах, задача разделения заменяется на задачу районирования. Здесь же пользователь может определить некоторые дополнительные параметры, такие как список свойств, задействованных первоначально в решение задачи и шкалы, в которых они измерены, изменить информацию об эталонных объектах и т.д., которые окажут впоследствии влияние на решение задачи.
Решение задачи
Алгоритмическим обеспечением этого этапа является широкий спектр традиционных и оригинальных алгоритмов таксономии, упорядочения и распознавания образов. Выбор алгоритма решения задачи определяется заданным типом формальной задачи, представительностью данных, а также расположением исходных данных в признаковом пространстве. При наличии заданной целевой функции задача может быть решена методами множественного регрессионного анализа. Определение информативного подпространства осуществляется на основе методов факторного анализа или распознавания образов (с точки зрения эталонов двух классов).
Однако система только предлагает человеку свой выбор, а решать, какой именно метод применять и в какой постановке решать задачу, может при желании пользователь.
Анализ и интерпретация результатов
Результаты анализируются с точки зрения их соответствия формальным требованиям. Для подтверждения и конкретизации результатов прогноза может быть получено решение задачи по прямым и косвенным поисковым признакам. Содержательная интерпретация результатов осуществляется геологом-постановщиком, который проводит согласование результатов с целью исследования, сформулированными требованиями к результату, и принимает решение об использовании полученного решения, либо об уточнении модельных представлений и формулировки задачи.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.