значения признаков для i- го объекта, полученных в результате измерений.
Выбор алфавита классов и словаря признаков в данном случае осуществляется заранее на этапе постановки задачи распознавания.
Операция классификации состоит в том, чтобы распределить данные по категориям (или по классам), где под классом понимается совокупность образов, имеющих одни и те же признаки. Один и тот же набор данных может служить источником различных классификаций. Связь между вектором измерений и классом основывается на понятии близости, т.е. расстояния между классами, чем меньше расстояние между классами, тем больше сходства.
Пример кодирования признаков для трех объектов (табл.1). , если i-ый объект обладает k-ым признаком.
Объект |
Вектор |
Признаки |
|||
желтый? |
красный? |
есть семечки? |
есть косточки? |
||
вишня |
|
|
|
|
|
яблоко |
|
|
|
|
|
банан |
|
|
|
|
|
Для каждой пары предъявлений надо последовательно установить степень их сходства и различий в следующем виде:
|
|
|
1 |
0 |
|
1 |
a |
h |
0 |
g |
b |
Здесь a - число случаев, когда и
обладают одним и тем
же общим признаком
;
b - число случаев, когда и
не обладают никакими
общими признаками
h - число случаев, когда не
обладает признаком, присущим
.
.
g - число случаев, когда обладает
признаком, отсутствующим у
.
.
Из
рассмотрения величин a, b, h, g следует, что чем больше сходства между и
, тем больше должен
быть коэффициент a. Функции бинарного расстояния
вычисляются различным
образом в соответствии с таблицей 2.
№ |
Выражение |
1 |
|
2 |
|
3 |
|
4 |
|
5 |
|
В зависимости от решаемой задачи надо выбрать наиболее подходящую функцию.
Найдем сходство
между и
, между
и
для примера таблицы 1.
|
|
|
1 |
0 |
|
1 |
1 |
2 |
0 |
1 |
0 |
|
|
|
1 |
0 |
|
1 |
1 |
0 |
0 |
2 |
1 |
Следовательно, и
более сходны между
собой, чем
и
.
Для разделения объектов на классы эта процедура используется следующим образом:
-
выбирается типовой (эталонный представитель класса и все остальные
объекты сравниваются с ним);
-
выбирается вид функции сходства и ее пороговое
значение
;
-
проводится распознавание на основе разделяющего
правила. Если , то объект
принадлежит к классу.
- Составить таблицу признаков для нескольких объектов из выбранной предметной области по форме таблицы 1 (количество объектов 5-7).
- Заполнить значения признаков.
- Выбрать эталонный объект, получить у преподавателя два номера функций сходства для сравнения и провести классификацию исходного множества на классы используя сначала первую, затем вторую функцию.
- Для автоматизации расчетов составить программу на алгоритмическом языке.
- Сделать выводы о том, какая из функций сходства более подходит к конкретному рассматриваемому случаю.
- Оформить и защитить лабораторную работу.
- Изучить теоретическое введение.
- Последовательно выполнить все задания к лабораторной работе.
- Оформить отчет по лабораторной работе.
- Название и цель работы.
- Исходные данные (таблица признаков, выбранные эталонные объекты).
- Используемые расчетные формулы.
- Блок-схема алгоритма решения задачи.
- Результаты (объекты, попавшие и не попавшие в класс с указанием значений промежуточных коэффициентов и значений функции сходства).
- Выводы о влиянии вида функции сходства на полученные результаты.
ЛАБОРАТОРНАЯ РАБОТА № 2
Построение семантической сети с использованием алгоритмического языка
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.