значения признаков для i- го объекта, полученных в результате измерений.
Выбор алфавита классов и словаря признаков в данном случае осуществляется заранее на этапе постановки задачи распознавания.
Операция классификации состоит в том, чтобы распределить данные по категориям (или по классам), где под классом понимается совокупность образов, имеющих одни и те же признаки. Один и тот же набор данных может служить источником различных классификаций. Связь между вектором измерений и классом основывается на понятии близости, т.е. расстояния между классами, чем меньше расстояние между классами, тем больше сходства.
Пример кодирования признаков для трех объектов (табл.1). , если i-ый объект обладает k-ым признаком.
Объект |
Вектор |
Признаки |
|||
желтый? |
красный? |
есть семечки? |
есть косточки? |
||
вишня |
|||||
яблоко |
|||||
банан |
Для каждой пары предъявлений надо последовательно установить степень их сходства и различий в следующем виде:
1 |
0 |
|
1 |
a |
h |
0 |
g |
b |
Здесь a - число случаев, когда и обладают одним и тем же общим признаком ;
b - число случаев, когда и не обладают никакими общими признаками
h - число случаев, когда не обладает признаком, присущим .
.
g - число случаев, когда обладает признаком, отсутствующим у .
.
Из рассмотрения величин a, b, h, g следует, что чем больше сходства между и , тем больше должен быть коэффициент a. Функции бинарного расстояния вычисляются различным образом в соответствии с таблицей 2.
№ |
Выражение |
1 |
|
2 |
|
3 |
|
4 |
|
5 |
В зависимости от решаемой задачи надо выбрать наиболее подходящую функцию.
Найдем сходство между и , между и для примера таблицы 1.
1 |
0 |
|
1 |
1 |
2 |
0 |
1 |
0 |
1 |
0 |
|
1 |
1 |
0 |
0 |
2 |
1 |
Следовательно, и более сходны между собой, чем и .
Для разделения объектов на классы эта процедура используется следующим образом:
- выбирается типовой (эталонный представитель класса и все остальные объекты сравниваются с ним);
- выбирается вид функции сходства и ее пороговое значение ;
- проводится распознавание на основе разделяющего правила. Если , то объект принадлежит к классу.
- Составить таблицу признаков для нескольких объектов из выбранной предметной области по форме таблицы 1 (количество объектов 5-7).
- Заполнить значения признаков.
- Выбрать эталонный объект, получить у преподавателя два номера функций сходства для сравнения и провести классификацию исходного множества на классы используя сначала первую, затем вторую функцию.
- Для автоматизации расчетов составить программу на алгоритмическом языке.
- Сделать выводы о том, какая из функций сходства более подходит к конкретному рассматриваемому случаю.
- Оформить и защитить лабораторную работу.
- Изучить теоретическое введение.
- Последовательно выполнить все задания к лабораторной работе.
- Оформить отчет по лабораторной работе.
- Название и цель работы.
- Исходные данные (таблица признаков, выбранные эталонные объекты).
- Используемые расчетные формулы.
- Блок-схема алгоритма решения задачи.
- Результаты (объекты, попавшие и не попавшие в класс с указанием значений промежуточных коэффициентов и значений функции сходства).
- Выводы о влиянии вида функции сходства на полученные результаты.
ЛАБОРАТОРНАЯ РАБОТА № 2
Построение семантической сети с использованием алгоритмического языка
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.