Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Сборник работ конкурса Лобачевского.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
24.49 Mб
Скачать

Проблемы машинного перевода с татарского языка на русский и с русского языка на татарский (на примере программы «divar»)

Цель научно-исследовательской работы – проанализировать работу машинного переводчика “Divar”[1], а именно ошибки в процессе перевода с татарского языка на русский и с русского на татарский.

Программа машинного перевода “Divar” переводит тексты на основе морфологического и синтаксического анализа предложений.

Мы проанализировали ошибки данного машинного переводчика и осуществили их классификацию. В результате анализа были выделены следующие категории ошибок:

I. Ошибки, связанные с недостаточным количеством слов в базовом словаре программы:

1) омонимов и многозначных слов:Кара (фигыль) – монда кара, аңа кара, миңа кара.” – Перевод –Черный (дело) – этому черный, аңа черный, миңа смотри.”

При переводе омонимов и многозначных слов данный машинный переводчик в большинстве случаев выдает лишь одно (основное) значение. Но при наличии контекста программа также может выдавать и другие значения слов. Следовательно, для правильной работы переводчика необходимо указывать определенные контексты различных значений омонимов и многозначных слов.

2) Синонимов:Матур кыз – Красивая девушка”,” Күркәм кыз – Индейка девушка”, “Мөлаем кыз – Ласковый накаливайся”.

3) Антонимов:”Шатлык – кайгы (хәсрәт )”- Перевод – “Радость –вставание (горе); “Авыр – җиңел (асат)” – Перевод –Тяжелый–будь побежденным (легкий).

II. Морфологические ошибки:

1) существительных в форме множественного числа: “Каен-каеннар” – Перевод – Береза-каеннар”;

2) прилагательных, образованных при помощи суффиксов “-лы/-ле, -сыз/-сез”: Акыл – акыллы – акылсыз” – Перевод – Разум – умный – без разума”;

Для правильной работы переводчика необходимо добавить в лингвистическую базу программы отдельные значения для некоторых слов с суффиксом “-сыз/-сез”.

3) Числительных

4) Глаголов:

а) условное наклонение: “Барса – Перевод – Если идет”

В данном случае перевод должен осуществляться по формуле: [гл.+ “-са/-сә” = “если” + гл. в буд. вр.], что не всегда соблюдается, как видно из вышестоящих примеров.

б) глаголы будущего времени: “Бул – булыр – булачак”–Перевод–“Будь – будет быть – будет быть”. Данная ошибка ,возможно, связана с тем, что переводчик переводит слова образованные при помощи суффиксов “-ыр/-ер, -ачак/-әчәк, -ячак/-ячәк” по определённой формуле {«будет + что-то делать»}. А к глаголу “быть” данная формула неприменима.

III. Синтаксические ошибки.

Порядок слов в процессе перевода остается таким же, как и в оригинале.

Перевод с русского языка на татарский

В процессе автоматического перевода с русского языка на татарский мы рассмотрели ошибки в словах и предложениях/словосочетаниях отдельно и составили классификацию, которая несколько отличается от предыдущей (т.е. от классификации ошибок в процессе перевода с татарского языка на русский). Это объясняется тем, что специфика языка влияет на то, какие именно моменты становятся проблемными при переводе: