1. Среднее число ходов, применимых к текущей ситуации.
2. Емкость модели данных предметной области.
3. Сложность задачи.
4. Эффективность порождения.
После проведения серии экспериментов, полученные оценки усредняют. Как правило, для различных задач получаются противоречивые результаты эффективности. В этом случае выделяют общие признаки тех классов задач, для которых новый алгоритм работает эффективнее существующих.
Системы общения на естественном языке (ЕЯ)
Факторы, определяющие актуальность естественно языковых систем:
1. Знания в компьютере представляются в естественно-языковой форме.
2. Простота общения: не требует специальной подготовки.
3. Емкость (лаконичность) ЕЯ-конструкций.
4. Выразительная сила языка.
5. Единообразная форма представления различных по типу знаний.
6. Знаковая или звуковая форма представления информации удобна для компьютера.
7. Отлаженная эволюцией помехозащищенность языка.
8. Отсутствие какой либо более удобной альтернативы.
История развития ЕЯ систем
Общение с ЭВМ на естественном языке – это раздел искусственного интеллекта занимающийся исследованием способов представления знаний человека в ЕЯ форме и о моделировании языковой деятельности человека.
Предмет исследования – модели знаний о языковой деятельности человека.
Общение – это двусторонний процесс передачи с определенными целями и в определенной манере, связанных сведений, выраженных в языке некотором реальном или гипотетическом мире от одного участника общения к другому, при условии понятности этих сведений для участников общения.
Инициатива в общении – это мера близости к предлагаемому сценарию диалога.
Речевой акт – это двусторонний процесс, охватывающие при устном общении говорение-слушание, а при письменном написание – чтение, т.е. распознавании речи(звук или письмо).
Словоформа – конкретное знаковое проявление слова.
Лексема (словарная категория) – совокупность всех знаковых проявлений слова.
Уровни изучения текста:
1. Дискурс (связанный текст).
2. Предложение.
3. Словосочетание.
4. Словоформа.
5. Морфема.
6. Слог.
7. Фонема.
8. Дифференциальный признак.
Семиотические аспекты общения с ЭВМ на
Пресуппозиция – совокупность условий, которые необходимы…
Вопросно-ответные системы
Это системы, предназначенные для ответа на простейшие фактографические запросы, информация о которых находится в какой либо справочной системе. Блок морфологического анализа – это программная подсистема, предназначенная для анализа каждой из словоформ ЕЯ текстов и предложений. На выходе морфологического анализа появляются такие характеристики слова как часть речи, одушевленность, род, падеж, склонение и другие морфологические характеристики. Для морфологического анализа используются системы представления знаний, словарь основ и таблица аффиксов. В словаре основ хранятся основы словоформ, нормализованные слова, соответствующие им понятия и все морфологические характеристики. Таблица аффиксов содержит все возможные части словоформ, т.е. приставки, суффиксы и окончания. Синтаксический анализатор предназначен для анализа синтаксической структуры предложения, выделение словосочетаний, определение зависимостей между словосочетаниями и понимая синтаксической структуры предложения в целом. Для синтаксического анализа используется специализированная БД, хранящая возможные схемы синтаксических структур предложений, их принято называть грамматикой. НА выходе синтаксического анализа появляется синтаксическая структура в форме, либо дерево зависимостей, либо системосоставляющих, либо структурных схем словосочетаний. Семантический анализатор занимается анализом смысла предложения или всего текста. В своей работе он использует базу знаний (понятийную), например семантическую сеть. На выходе этого блока появляется запрос во внутреннем представлении на специальном формальном языке, называемого языком семантического представления (язык записи смысла). Для вопросно-ответных систем этот блок (семантической интерпретации) занимается построением запроса (SQL) к справочной БД. На выходе этого блока появляется ответ в форме фрагментов семантического представления и конкретных данных ответа. Следующие три блока (семантический синтез, синтаксический синтез и морфологический синтез) являются симметричными соответствующим блокам анализа и занимаются построением соответствующего этапа выходного предложения, выдаваемого в качестве ответа вопросно-ответной системе.
Системы общения с БД
Это системы, имеющие на входе запрос пользователя повышенной сложности, а на выходе запрос к БД на языке соответствующей СУБД. Нормализация и фрагментация – это блок предварительной обработки запросов исключающий из текста неинформативные или сток слова, перемещающий фрагменты текста в соответствии со схемами проективности и заменяющий сложные обороты на более простые эквивалентные им. Для нормализации и фрагментации используются структурные правила сборки запросов. Лексический и семантический анализ аналогичен соответствующим блоком вопросно-ответным систем. Блок сопоставления со схемой БД предназначен для выбора правильных названий информационных полей БД, используемых в генерации выходных запросов.
Диалоговые системы решения задач
Блоки анализатор и генератор полностью эквивалентны блокам вопросно-ответных систем: морфологическому, синтаксическому и семантическому анализаторам и генераторам. Блок целей несет функции прагматического анализатора и предназначен для распознавания смысла решаемой задачи ИРЗ. Блок вывода соответствует самому ИРЗ.
Системы обработки текстов
Блоки анализатора и генератора аналогичны предыдущим схемам. Блок индексатор используется для статистического вычисления ключевых терминов текста, модель пользователя с соответствующей БД пользователя хранит информационные потребности пользователей, а блок дискурсных стратегий предназначен для преобразований различных схем записей информационных документов. Современной системой используется для автоматической классификации электронных информационных ресурсов (интернет).www.akinator.com.
Системы машинного перевода
Общая схема общения
Системы машинного перевода предназначены для перевода с одного ЕЯ на другой, полного или частичного.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.