- •Компьютерная лингвистика, ее разделы и направления. Структура кл. Кл и аот
- •Автоматическое аннотирование и реферирование текстов. Формулировка задачи автоматического реферирования и аннотирования
- •Технология машинного обучения как основа современной лингвистической технологии. Технология автоматического извлечения данных и ее разновидности
- •Структура системы распознавания речевого сигнала. Лингвистическое обеспечение системы распознавания речи
- •Синтез речи. Лингвистическое обеспечение систем синтеза речи
Компьютерная лингвистика, ее разделы и направления. Структура кл. Кл и аот
Компьютерная лингвистика - направление в прикладной лингвистике, ориентированное на использование компьютерных инструментов – программ, компьютерных технологий организации и обработки данных – для моделирования функционирования языка в тех или иных условиях, ситуациях, проблемных сферах и т.д., а также вся сфера применения компьютерных моделей языка в лингвистике и смежных дисциплинах. Собственно, только в последнем случае и идет речь о прикладной лингвистике в строгом смысле, поскольку компьютерное моделирование языка может рассматриваться и как сфера приложения информатики и теории программирования к решению задач науки о языке. На практике, однако, к компьютерной лингвистике относят практически все, что связано с использованием компьютеров в языкознании.
Компьютерная лингвистика/математическая или вычислительная лингвистика – направление искусственного интеллекта, которое ставит своей целью использование математических моделей для описания естественных языков.
Направления компьютерной лингвистики:
Обработка естественного языка (natural language processing; синтаксический, морфологический, семантический анализы текста). Сюда включают также:
Корпусная лингвистика, создание и использование электронных корпусов текстов
Создание электронных словарей, тезаурусов, онтологий. Например, Lingvo. Словари используют, например, для автоматического перевода, проверки орфографии.
Автоматический перевод текстов. Среди русских переводчиков популярным является Промт. Среди бесплатных известен переводчик Google Translate
Автоматическое извлечение фактов из текста (извлечение информации) (fact extraction, text mining)
Автореферирование (automatic text summarization). Эта функция включена например в Майкрософт Ворд.
Построение систем управления знаниями.
Создание вопросно-ответных систем (question answering systems).
Оптическое распознавание символов (OCR). Например, программа FineReader
Автоматическое распознавание речи (ASR).
Автоматический синтез речи
Разделы компьютерной лингвистики:
Машинный перевод
Корпусная лингвистика
Информационно-поисковые системы
Автоматические обучающие системы
Диалоговые системы (определение компьютерной системы, при которой оператор может общаться с компьютером, работающим по программе. Программа помогает оператору, когда ему необходима информация, и останавливается, пока не выдаст информацию. Диалоговые компьютерные системы называются также conversational systems)
Вопросно-ответная система
Генерация текста (компьютерная программа, способная генерировать последовательности символов, внешне похожие на текст, но при этом, как правило, лишённые смысла)
Синтез и распознавание речи
Компьютерная лексикография (создание автоматических словарей, лингвистических баз данных и разработка программ поддержки лексикографических работ)
Онтология (это попытка всеобъемлющей и детальной формализации некоторой области знаний с помощьюконцептуальной схемы)
Гипертекст и интернет
Интерлингвистика (это часть лингвистики, занимающаяся различными аспектами международного общения; возможностями его оптимизации; международными искусственными языками, в том числе эсперанто)
Компьютерная лингвистика рассматривает все задачи в теоретическом аспекте, а АОТ – раздел искусственного интеллекта, информатики и прикладной математики.