Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
vopros1-5.docx
Скачиваний:
37
Добавлен:
24.09.2019
Размер:
44.41 Кб
Скачать

Компьютерная лингвистика, ее разделы и направления. Структура кл. Кл и аот

Компьютерная лингвистика - направление в прикладной лингвистике, ориентированное на использование компьютерных инструментов – программ, компьютерных технологий организации и обработки данных – для моделирования функционирования языка в тех или иных условиях, ситуациях, проблемных сферах и т.д., а также вся сфера применения компьютерных моделей языка в лингвистике и смежных дисциплинах. Собственно, только в последнем случае и идет речь о прикладной лингвистике в строгом смысле, поскольку компьютерное моделирование языка может рассматриваться и как сфера приложения информатики и теории программирования к решению задач науки о языке. На практике, однако, к компьютерной лингвистике относят практически все, что связано с использованием компьютеров в языкознании.

Компьютерная лингвистика/математическая или вычислительная лингвистика – направление искусственного интеллекта, которое ставит своей целью использование математических моделей для описания естественных языков.

Направления компьютерной лингвистики:

  • Обработка естественного языка (natural language processing; синтаксический, морфологический, семантический анализы текста). Сюда включают также:

  1. Корпусная лингвистика, создание и использование электронных корпусов текстов

  2. Создание электронных словарей, тезаурусов, онтологий. Например, Lingvo. Словари используют, например, для автоматического перевода, проверки орфографии.

  3. Автоматический перевод текстов. Среди русских переводчиков популярным является Промт. Среди бесплатных известен переводчик Google Translate

  4. Автоматическое извлечение фактов из текста (извлечение информации) (fact extraction, text mining)

  5. Автореферирование (automatic text summarization). Эта функция включена например в Майкрософт Ворд.

  6. Построение систем управления знаниями.

  7. Создание вопросно-ответных систем (question answering systems).

  • Оптическое распознавание символов (OCR). Например, программа FineReader

  • Автоматическое распознавание речи (ASR).

  • Автоматический синтез речи

Разделы компьютерной лингвистики:

  • Машинный перевод

  • Корпусная лингвистика

  • Информационно-поисковые системы

  • Автоматические обучающие системы

  • Диалоговые системы (определение компьютерной системы, при которой оператор может общаться с компьютером, работающим по программе. Программа помогает оператору, когда ему необходима информация, и останавливается, пока не выдаст информацию. Диалоговые компьютерные системы называются также conversational systems)

  • Вопросно-ответная система

  • Генерация текста (компьютерная программа, способная генерировать последовательности символов, внешне похожие на текст, но при этом, как правило, лишённые смысла)

  • Синтез и распознавание речи

  • Компьютерная лексикография (создание автоматических словарей, лингвистических баз данных и разработка программ поддержки лексикографических работ)

  • Онтология (это попытка всеобъемлющей и детальной формализации некоторой области знаний с помощьюконцептуальной схемы)

  • Гипертекст и интернет

  • Интерлингвистика (это часть лингвистики, занимающаяся различными аспектами международного общения; возможностями его оптимизации; международными искусственными языками, в том числе эсперанто)

Компьютерная лингвистика рассматривает все задачи в теоретическом аспекте, а АОТ – раздел искусственного интеллекта, информатики и прикладной математики.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]