В результате изменения весов и порогов сеть перестроится так, что поданная комбинация входов будет распознаваться правильно. Но может оказаться, что другие комбинации уже стали распознаваться неправильно. Поэтому процесс повторяется для всех комбинаций.
Остановка процесса обучения происходит, если пройдено заданное число эпох, или если изменения весов станут меньше некоторого значения.
Для решения задачи, называемой в литературе «задачей исключающего ИЛИ», когда имеется два входа, а результат относится к классу 1 (выход нейронной сети равен 1), если ровно один вход имеет большое значение, и к классу 2 (выход нейронной сети равен 0), если оба входа имеют низкое значение или оба входа имеют высокое значение, одного нейрона недостаточно. Необходимо построить сеть из трех нейронов (рис. Рис. 21).
Здесь появляются узлы, выходы которых являются входами других узлов.
Рис. 21. Нейронная сеть для решения «задачи исключающего ИЛИ»
Обучение происходит почти по такому же принципу, что и обучение сети из единственного нейрона. Если выход равен 1 вместо 0, то следует уменьшить порог выходного нейрона, большие веса входов, веса входов, по которым поступают большие сигналы. Новым является то, что надо также уменьшить и сами большие входные сигналы. Поскольку они являются выходами других нейронов, к последним применяется та же процедура: их вход слишком велик, и требуется его уменьшить. Корректировки распространяются от выхода сети к ее входу, поэтому этот механизм получил название обратного распространения.
Существует целый ряд приемов, позволяющих регулировать процесс обучения с помощью набора параметров. Например, если нейроны имеют логистическую активационную функцию, процесс идет «мягче», замедляясь с приближением к результату. Этим процессом можно управлять, изменяя параметр σ.
Многоуровневые сети позволяют достичь еще большей гибкости функционирования. Например, в трехуровневой сети имеется внутренний, скрытый слой. Он не связан жестко ни с входом, ни с выходом. Это дает возможность адаптации к сложным ситуациям. Пространство входных признаков вначале преобразуется в простые области, которые затем объединяются в более сложные, и уже они привязываются к выходным категориям.
Нейронные сети успешно применяются для распознавания букв. Можно взять матрицу фоточувствительных элементов размером 32х32=1024 точки, соединить ее с 1024 выходами единственного нейрона и «сфотографировать» с ее помощью букву А. Получится, что некоторые элементы выдают малый сигнал (черные точки), а некоторые – большой (белые точки). Далее можно подобрать веса входов (обучить систему) так, чтобы для данной комбинации сигналов выход был равен 1 (распознавание). Но если букву сдвинуть, уменьшить, повернуть или просто нарисовать немного по-другому, белые и черные клетки сместятся, и распознавание будет невозможно. Немного лучше работают сети, использующие радиальные функции, которые фактически учитывают расстояния. Но вероятность ошибок все равно очень велика.
Многоуровневые структуры позволяют производить процесс распознавания поэтапно. Множество комбинаций, соответствующих различным буквам, образует области. Эти области, в свою очередь, имеют границы. Значит, более перспективно вначале выделить границы областей, а затем, на более высоком уровне – сами области. Другим способом является выделение некоторых элементарных подобластей, из которых затем формируются окончательные области.
Наконец, можно выделить какие-то характерные фрагменты изображения и уже на их основе пытаться производить распознавание. Например, на первом уровне распознается, что буква А состоит из пяти отрезков прямых. Далее, на следующем уровне, определяется, что имеется один «угол» () и четыре «примыкания» (). Видно также, что две линии (каждая из боковых) связаны с тремя другими линиями, одна («перекладина») – с двумя другими линиями, две («засечки») – с одной другой линией. Список этих признаков можно продолжить. Наконец, на третьем уровне происходит обобщение полученных признаков. Если наличествуют все перечисленные признаки, то это буква А. Такой способ позволяет осуществлять распознавание достаточно достоверно, причем хорошо распознается даже текст, написанный от руки.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.