Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
экзамен ИТЛ вторая половина.docx
Скачиваний:
40
Добавлен:
17.04.2015
Размер:
34.35 Кб
Скачать
    1. Компьютерная лексикография: определение и задачи. Отличие электронных словарей от «бумажных». Структура словарной статьи

Раздел прикладной лингвистики, нацеленный на создание словарей, лингвистических баз данных, разработку программ поддержки лексикографических работ.

Задачи:

  1. Определение структуры словаря и зон словарной статьи

  2. Разработка принципов составления различных видов словарей.

Основное отличие электронных словарей от бумажных – гипертекстуальность и мультимедийность.

Структура словарной статьи:

  1. Лексический вход (вокабула, лемма, слово)

  2. Зона грамматической информации (часть речи, род, число и др)

  3. Зона стилистических помет (обиходное, необиходное, стилизованное и т.д.)

  4. Зона значения (в этой зоне описываются все содержательные сходства и различия между синонимами)

  5. Зона фразеологизмов

  6. Зона этимологии (о происхождении слова, может не быть вкл. в словарную статью)

  7. Зона примеров и источников примеров (может вкл. в словарную статью).

    1. Компьютерная лексикография: определение и задачи. Классификация словарей. Разновидности лингвистических словарей

Раздел прикладной лингвистики, нацеленный на создание словарей, лингвистических баз данных, разработку программ поддержки лексикографических работ.

Задачи:

1. Определение структуры словаря и зон словарной статьи

2. Разработка принципов составления различных видов словарей.

Типы словарей:

  1. Лингвистические

  2. Энциклопедические

  3. Промежуточные (лингво-страноведческие и терминологические)

Разновидности лингвистических словарей:

  1. Толковые словари (фразеологический, иностранных слов)

  2. Словари-тезаурусы (структура словаря по темам)

  3. Двуязычные словари

  4. Ассоциативные словари (информация располагается по смысловым ассоциациям)

  5. Исторические и этимологические словари (история происхождения слов)

  6. Словари языковых форм (орфографический, орфоэпический, словообразовательный и т.д.)

  7. Словари речевого употребления (словарь трудностей)

  8. Ономастиконы (ономастика - наука, изучающая имена собственные всех типов и их происхождение. Антропонимические словари, содержащие личные имена и фамилии. Топонимические словари, или словари географических названий)

  9. Нетрадиционные (авторские словари, словарь эпитетов, поэтических метафор и т.д.)

    1. Машинный перевод: основные принципы

МАШИННЫЙ ПЕРЕВОД, выполняемое на компьютере действие по преобразованию текста на одном естественном языке в эквивалентный по содержанию текст на другом языке, а также результат такого действия. Современный машинный, или автоматический перевод осуществляется с помощью человека: пред-редактора, который тем или иным образом предварительно обрабатывает подлежащий переводу текст, интер-редактора, который участвует в процессе перевода, или пост-редактора, который исправляет ошибки и недочеты в переведенном машиной тексте.

В практике переводческой деятельности и в информационной технологии различаются два основных подхода к машинному переводу. С одной стороны, результаты машинного перевода могут быть использованы для поверхностного ознакомления с содержанием документа на незнакомом языке. В этом случае он не требует тщательного редактирования. Другой подход предполагает использование машинного перевода вместо обычного «человеческого». Это предполагает тщательное редактирование и настройку системы перевода на определенную предметную область. Здесь играют роль полнота словаря, эффективность способов разрешения лексической многозначности, нахождения переводных соответствий и алгоритмов синтеза.

Переводчик тратит 20% времени на перевод, 40% - на поиск незнакомых слов и 40% - на оформление.

Компьютер тратит 95% непосредственно на перевод и 5% на пополнение словаря. Количественные характеристики свидетельствуют о преимуществе машинного перевода. Однако качество такого перевода значительно уступает сделанному человеком.

Первая демонстрация машинного перевода состоялась в 1954 года в США, затем и ССС. Система была примитивной (словарь в 250 слов, грамматика из 6 правил, перевод лишь простых фраз). Однако уже в 70-х, 80-х началось широкое использование систем машинного перевода.

Говоря о проблемах машинного перевода надо отметить, что какие бы пары языков не использовались в таких языках нет полного семантического равенства: как правило соответствует несколько слов переводного языка. Т.е. лингвистически точный перевод невозможен. Можно сказать, что процесс перевода текстов имеет творческий характер. Нужно отметить, что перевод – задача, которая до стх пор не имеет однозначного алгоритма решения, что создает трудности в ходе построения алгоритмов машинного перевода.