Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
18-22.docx
Скачиваний:
2
Добавлен:
16.09.2019
Размер:
637.48 Кб
Скачать

22.Системы машинного перевода и Интернет. Google Translator

Системы машинного перевода осуществляют автоматизированный перевод текста. Единицами перевода при этом служат слова или словосочетания, причем последние разработки позволяют учитывать морфологию переводимого слова.

См. билет 4

Основные компоненты систем МП:

  • Набор одноязычных и двуязычных переводных словарей

  • Синтаксический анализатор

Базы примеров

Статистический

Метод

Язык-посредник

Трансфер

(3-е поколение)

Использование корпусов

(2-е поколение)

Переводные модели

(1-е поколение)

Прямой перевод

Первое поколение систем МП

(прямой перевод)

Текст на языке оригинала рассматривается, как последовательность слов.

Система полностью основана на словаре.

Второе поколение систем МП.- переводные модели

Системы второго поколения имеют модульную структуру. Модульный подход: анализ, синтез, блок грамматических правил, и словари выделяются в отдельные модули, обновляются независимо

Два типа перевода по переводным моделям:

  • через язык-посредник

  • трансфер

Перевод с языком-посредником:

Модель трансфера.

  1. Конвертация текста на исходном языке (ИЯ) в абстрактное представление ИЯ

  2. Трансформация абстрактного представления ИЯ в представление на языке перевода (ЯП)

  3. Генерация текста на ЯП

Современные направления МП

1) Методики с использованием корпусной лингвистики:

  • Статистический подход

  • Перевод по примерам

2) Гибридные и интерактивные системы МП

Статистический:

Вероятность корректности вычисляется по частоте появления в корпусе. Алгоритм выбирает тот перевод, который признает наиболее вероятным по сочетанию информации переводной модели и информации языковой системы. Сегмент на ИЯ (слово или словосочетание) сопоставляется с соответствующим сегментом на ЯП.

По примерам:

Онлайновый перевод информации в Интернете становится все более популярным. Интернет стремительно превращается из преимущественно англоязычной в многоязычную среду, что вынуждает владельцев Web-сайтов предоставлять информацию на нескольких языках. Наиболее часто к услугам МП прибегают информационные и поисковые сайты, которые стремятся привлечь на свои страницы разноязычных пользователей.

Интересной особенностью Web-сайтов, знакомящих с программами МП, электронными словарями и другими программами лингвистической поддержки, является то, что с работой многих программных продуктов можно познакомиться в интерактивном режиме, используя версию, установленную на сервере и имеющую шлюз для удаленного общения через Web-интерфейс.

Google Переводчик — веб-сервис компании Google, предназначенный для перевода части текста или веб-страницы на другой язык. Поддерживает перевод на 57 языков. Для некоторых языков пользователям предлагаются варианты переводов, например, для технических терминов, которые должны быть в будущем включены в обновления системы перевода.

В отличие от других сервисов перевода, Google, как и Translate.ru использует собственное программное обеспечение. Видимо, используется самообучаемый алгоритм статистического машинного перевода.

Сервис включает в себя также перевод всей веб-страницы и даже одновременный поиск информации с переводом на другой язык. Для веб-дизайнеров сотрудниками компании был разработан скрипт, который позволяет организовать перевод сайта на все доступные языки[2].

Google Переводчик, как и другие инструменты автоматического перевода, имеет свои ограничения. Этот инструмент может помочь читателю понять общий смысл содержания текста на иностранном языке, он не предоставляет точных переводов. Постоянно ведётся работа над качеством перевода, разрабатываются переводы на другие языки[3].

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]