Сфера використання комп’ютерної лінгвістики
Природна мова зустрічається в двох формах: усна мова, тобто, як акустичній феномен, і писемна мова чи друкований текст. З певного віку люди без проблем використовують обидві форми мови в повсякденному житті. Для комп’ютера усна і писемна мова являється повністю різними даними: суцільний акустичний сигнал, який інколи переривається паузами не містить розділових елементів письмової мови, а саме, розділових знаків й інтервалів між словами. Спробувавши відобразити це графічно/письмово, вийшло б щось подібне: «sosprechnwirnganzntach». Виходячи з цього, можна сказати, що письмова форма висловлення певного мовця відрізняться від особливостей його вимови, бо ці особливості наскільки індивідуальні, що усна мова, як і відбитки пальців може бути засобом ідентифікації особи, так як вона є характерною особливістю людини. На основі цих відмінностей розвинулися два напрямки комп’ютерної лінгвістики, які нажаль до цього часу функціонували окремо: перша досліджує усну мову як фізичній звуковій сигнал за інженерно-науковим методом; друга, більш лінгвістично орієнтована, перед усім займається написаними текстами. Тим часом, проводились спроби поєднати це розділення, наприклад масштабний проект VERBMOBIL, який підтримувало федеральне міністерство науки і техніки, займався перекладом усної розмовної мови з німецької і японської на англійську мову.
В подальшому ми працюємо в основному з тим напрямком лінгвістики, що виражається в письмовій формі, тому що комп’ютерна лінгвістика в Дуйсбурзі займається питаннями письмової взаємодії.
Машинний переклад
Важлива галузь, в якій передбачаються значимі результати досліджень на практиці, це галузь машинного перекладу. Завданням галузі не являється переклад вірша Гете на китайську мову, її завдання полягає в автоматичному перекладі з однієї мові на багато інших так званих «текстів для користувачів» (Інструкції до комп’ютерів, інструкції по експлуатації, синоптичні прогнози). За цим завданням стоять значні економічні інтереси, тому що важливий елемент експортної політики заклечається в текстах, які впроваджуються через технічні продукти, від наручник годинників до комп’ютерних програм. Тому не дивно, що в системи перекладу Японія чи Європейське Товариство інвестують величезні грошові суми. Європейське Товариство з 1982 року фінансує проект EUROTRA, що одного дня має забезпечить перекладацьку роботу з дев’яти мов Товариства, чи щонайменше забезпечить перекладом поширені галузі. Питання, що обговорювалось в останньому абзаці, скільки «світових знать» потребує така система ще актуальне. Чи треба знати особливості ірландського молочного господарства та ірландського клімату, щоб уможливити переклад нового регулювання ірландського брутто експорту? Спосіб діяльності системи перекладу можна занотувати таким чином: спочатку проводиться аналіз тексту оригіналу, і виявляться наскільки представлення його значення виконано за допомогою формальної мови. Це представлення адаптується під характерні особливості мови перекладу, і таким чином продукується цілий текст мовою перекладу. Дуже простим прикладом такої адаптації/перевтілення може бути положення атрибутивних прикметників, які в німецькій мові знаходяться перед іменником, в французькій після (''das rote Haus'' vs. ‘‘la maison rouge‘‘). Важчим вже є переклад німецької композити на мову, в якій не існує такої будови слів. Чи з’явиться одного дня система перекладу, яка повністю автоматично й доволі якісно буде виконувати свою роботу, це питання відноситься до області спекуляції. Системи, що сьогодні представленні на ринку, потребують ручних налаштувань й людської обробки перекладу.
Природномовні системи діалогів
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.