 
        
        - •Компьютерная лингвистика, ее разделы и направления. Структура кл. Кл и аот
- •Автоматическое аннотирование и реферирование текстов. Формулировка задачи автоматического реферирования и аннотирования
- •Технология машинного обучения как основа современной лингвистической технологии. Технология автоматического извлечения данных и ее разновидности
- •Структура системы распознавания речевого сигнала. Лингвистическое обеспечение системы распознавания речи
- •Синтез речи. Лингвистическое обеспечение систем синтеза речи
Компьютерная лингвистика, ее разделы и направления. Структура кл. Кл и аот
Компьютерная лингвистика - направление в прикладной лингвистике, ориентированное на использование компьютерных инструментов – программ, компьютерных технологий организации и обработки данных – для моделирования функционирования языка в тех или иных условиях, ситуациях, проблемных сферах и т.д., а также вся сфера применения компьютерных моделей языка в лингвистике и смежных дисциплинах. Собственно, только в последнем случае и идет речь о прикладной лингвистике в строгом смысле, поскольку компьютерное моделирование языка может рассматриваться и как сфера приложения информатики и теории программирования к решению задач науки о языке. На практике, однако, к компьютерной лингвистике относят практически все, что связано с использованием компьютеров в языкознании.
Компьютерная лингвистика/математическая или вычислительная лингвистика – направление искусственного интеллекта, которое ставит своей целью использование математических моделей для описания естественных языков.
Направления компьютерной лингвистики:
- Обработка естественного языка (natural language processing; синтаксический, морфологический, семантический анализы текста). Сюда включают также: 
- Корпусная лингвистика, создание и использование электронных корпусов текстов 
- Создание электронных словарей, тезаурусов, онтологий. Например, Lingvo. Словари используют, например, для автоматического перевода, проверки орфографии. 
- Автоматический перевод текстов. Среди русских переводчиков популярным является Промт. Среди бесплатных известен переводчик Google Translate 
- Автоматическое извлечение фактов из текста (извлечение информации) (fact extraction, text mining) 
- Автореферирование (automatic text summarization). Эта функция включена например в Майкрософт Ворд. 
- Построение систем управления знаниями. 
- Создание вопросно-ответных систем (question answering systems). 
- Оптическое распознавание символов (OCR). Например, программа FineReader 
- Автоматическое распознавание речи (ASR). 
- Автоматический синтез речи 
Разделы компьютерной лингвистики:
- Машинный перевод 
- Корпусная лингвистика 
- Информационно-поисковые системы 
- Автоматические обучающие системы 
- Диалоговые системы (определение компьютерной системы, при которой оператор может общаться с компьютером, работающим по программе. Программа помогает оператору, когда ему необходима информация, и останавливается, пока не выдаст информацию. Диалоговые компьютерные системы называются также conversational systems) 
- Вопросно-ответная система 
- Генерация текста (компьютерная программа, способная генерировать последовательности символов, внешне похожие на текст, но при этом, как правило, лишённые смысла) 
- Синтез и распознавание речи 
- Компьютерная лексикография (создание автоматических словарей, лингвистических баз данных и разработка программ поддержки лексикографических работ) 
- Онтология (это попытка всеобъемлющей и детальной формализации некоторой области знаний с помощьюконцептуальной схемы) 
- Гипертекст и интернет 
- Интерлингвистика (это часть лингвистики, занимающаяся различными аспектами международного общения; возможностями его оптимизации; международными искусственными языками, в том числе эсперанто) 
Компьютерная лингвистика рассматривает все задачи в теоретическом аспекте, а АОТ – раздел искусственного интеллекта, информатики и прикладной математики.
