○ реализация выбранного эталона поведения.
Однако третья задача реализуется довольно редко и, в общем, не связана непосредственно с нейронной сетью.
Первая компьютерная система с обучением появилась в конце 50-х годов XX века.
Обучение заключается в выборе или настройке параметров, чтобы получить наилучший (например, дающий наименьшее количество ошибок при работе с существующими случаями и им подобными) классификатор на основе имеющихся случаев (рис. Рис. 19, а).
Рис. 19. Построение и использование классификатора
Суть нейронных сетей – моделирование процесса, происходящего в нервной клетке (нейроне). У нейрона имеются несколько входов (синапсы) от рецепторов или других нейронов и выход. Внутри нейрона осуществляется преобразование информации. Следует отметить, что новейшие исследования показали, что процесс нервной деятельности не соответствует этой модели, но успешность ряда практических применений нейронных сетей показывает их полезность, а, следовательно, – право на существование. Поэтому далее будут рассматриваться технические или искусственные нейронные сети.
Входами технических нейронных сетей являются дискретные или непрерывные величины, отражающие параметры ситуации. Примеры таких величин: наличие или отсутствие опытного образца товара (возможные значения 0 или 1), балльная оценка ожидаемой прибыльности (5 – очень высокая, 4 – достаточно высокая, 3 – невысокая, 2 – низкая, 1 – практически нулевая, 0 – отрицательная) или размер необходимых затрат в рублях. Они могут быть либо бинарными, либо измеряться в порядковой, интервальной или относительной шкале [34].
Обучающаяся система работает с некоторой моделью (дерево решений, дискриминантная функция или нейронные сети) и образцами случаев. Имеются системы самообучения «без учителя», но результатом их работы практически являются кластеры – наборы «похожих» случаев. Наиболее эффективны системы самообучения «с учителем», когда для каждого случая известно правильное решение.
Использование готового классификатора представлено на рис. Рис. 19, б. Его задача – отнести новый случай к одному из классов. Если классификатор используется для принятия решений, то его работа заключается в том, чтобы указать, какое именно решение из имеющегося набора следует принять в анализируемой ситуации.
Первичная обработка входов нейрона производится так называемой базисной функцией. Наиболее часто используются две базисные функции:
○ суммирование со взвешиванием (линейная базисная функция):
,
где u – базисная функция, n – количество входов; xj – входные величины, wj – веса входов (эти веса настраиваются в процессе самообучения);
○ векторное суммирование (радиальная базисная функция):
.
После первичной обработки применяется активационная функция, формирующая выходной сигнал. Таким образом, реализуется модель нейрона, представленная на рис. Рис. 20.
Рис. 20. Модель нейрона
В простейшем случае активационная функция линейна:
F(u)=ku ,
где k – коэффициент.
Если и входная, и активационная функция линейны, то получается так называемый линейный перцептрон [41], который фактически является аналогом причинной модели, описанной в п. 3.2. Но линейность накладывает серьезные ограничения [30]. Поэтому для нейронных сетей более полезной является нелинейная активация.
○ Пороговая функция:
.
Этой функцией задается порог срабатывания: если u меньше Θ, то выход равен нулю, если больше – единице. С ростом Θ нейрон становится менее чувствительным и срабатывает при бóльших значениях базовой функции.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.