- •Автоматический синтез звучащей речи
- •Программное обеспечение с поддержкой синтеза речи
- •Автоматическое аннотирование и реферирование текста
- •14. Назовите и дайте краткую характеристику этапам автоматического анализа текста
- •Назовите и дайте краткую характеристику этапам автоматического синтеза текста
- •Корпусная лингвистика: определение, классификация корпусов
- •Компьютерная лексикография: определение и задачи. Отличие электронных словарей от «бумажных». Структура словарной статьи
- •Компьютерная лексикография: определение и задачи. Классификация словарей. Разновидности лингвистических словарей
- •Машинный перевод: основные принципы
Компьютерная лексикография: определение и задачи. Отличие электронных словарей от «бумажных». Структура словарной статьи
Раздел прикладной лингвистики, нацеленный на создание словарей, лингвистических баз данных, разработку программ поддержки лексикографических работ.
Задачи:
Определение структуры словаря и зон словарной статьи
Разработка принципов составления различных видов словарей.
Основное отличие электронных словарей от бумажных – гипертекстуальность и мультимедийность.
Структура словарной статьи:
Лексический вход (вокабула, лемма, слово)
Зона грамматической информации (часть речи, род, число и др)
Зона стилистических помет (обиходное, необиходное, стилизованное и т.д.)
Зона значения (в этой зоне описываются все содержательные сходства и различия между синонимами)
Зона фразеологизмов
Зона этимологии (о происхождении слова, может не быть вкл. в словарную статью)
Зона примеров и источников примеров (может вкл. в словарную статью).
Компьютерная лексикография: определение и задачи. Классификация словарей. Разновидности лингвистических словарей
Раздел прикладной лингвистики, нацеленный на создание словарей, лингвистических баз данных, разработку программ поддержки лексикографических работ.
Задачи:
1. Определение структуры словаря и зон словарной статьи
2. Разработка принципов составления различных видов словарей.
Типы словарей:
Лингвистические
Энциклопедические
Промежуточные (лингво-страноведческие и терминологические)
Разновидности лингвистических словарей:
Толковые словари (фразеологический, иностранных слов)
Словари-тезаурусы (структура словаря по темам)
Двуязычные словари
Ассоциативные словари (информация располагается по смысловым ассоциациям)
Исторические и этимологические словари (история происхождения слов)
Словари языковых форм (орфографический, орфоэпический, словообразовательный и т.д.)
Словари речевого употребления (словарь трудностей)
Ономастиконы (ономастика - наука, изучающая имена собственные всех типов и их происхождение. Антропонимические словари, содержащие личные имена и фамилии. Топонимические словари, или словари географических названий)
Нетрадиционные (авторские словари, словарь эпитетов, поэтических метафор и т.д.)
Машинный перевод: основные принципы
МАШИННЫЙ ПЕРЕВОД, выполняемое на компьютере действие по преобразованию текста на одном естественном языке в эквивалентный по содержанию текст на другом языке, а также результат такого действия. Современный машинный, или автоматический перевод осуществляется с помощью человека: пред-редактора, который тем или иным образом предварительно обрабатывает подлежащий переводу текст, интер-редактора, который участвует в процессе перевода, или пост-редактора, который исправляет ошибки и недочеты в переведенном машиной тексте.
В практике переводческой деятельности и в информационной технологии различаются два основных подхода к машинному переводу. С одной стороны, результаты машинного перевода могут быть использованы для поверхностного ознакомления с содержанием документа на незнакомом языке. В этом случае он не требует тщательного редактирования. Другой подход предполагает использование машинного перевода вместо обычного «человеческого». Это предполагает тщательное редактирование и настройку системы перевода на определенную предметную область. Здесь играют роль полнота словаря, эффективность способов разрешения лексической многозначности, нахождения переводных соответствий и алгоритмов синтеза.
Переводчик тратит 20% времени на перевод, 40% - на поиск незнакомых слов и 40% - на оформление.
Компьютер тратит 95% непосредственно на перевод и 5% на пополнение словаря. Количественные характеристики свидетельствуют о преимуществе машинного перевода. Однако качество такого перевода значительно уступает сделанному человеком.
Первая демонстрация машинного перевода состоялась в 1954 года в США, затем и ССС. Система была примитивной (словарь в 250 слов, грамматика из 6 правил, перевод лишь простых фраз). Однако уже в 70-х, 80-х началось широкое использование систем машинного перевода.
Говоря о проблемах машинного перевода надо отметить, что какие бы пары языков не использовались в таких языках нет полного семантического равенства: как правило соответствует несколько слов переводного языка. Т.е. лингвистически точный перевод невозможен. Можно сказать, что процесс перевода текстов имеет творческий характер. Нужно отметить, что перевод – задача, которая до стх пор не имеет однозначного алгоритма решения, что создает трудности в ходе построения алгоритмов машинного перевода.