Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Lesson_kom.doc
Скачиваний:
1
Добавлен:
17.11.2019
Размер:
2.97 Mб
Скачать

Электронные словари

При поверхностном знании иностранного языка, системы машинного перевода нужны в гораздо меньшей степени. Часто возникает проблема всего нескольких незнакомых слов, от которых часто зависит смысл всего документа.

Для подобных случаев в Интернете имеются электронные словари, позволяющие найти конкретное слово и перевести его на нужный язык. В российском сегменте Интернета предлагается несколько подобных электронных словарей. Как и в случае с системами перевода, насчитывается всего несколько базовых служб, эксплуатируемых целым рядом сайтов.

Электронные словари российского Интернета рассчитаны на то, что одним из используемых языков является русский. Они представляют собой онлайн-версии популярных словарных программ. В основном используют модули известных словарей Lingvo и Multilex.

Доступ к электронному словарю Lingvo возможен не только на его официальном сайте (http://www.lingvo.ru/), но и через поисковую систему Яндекс (http://slovari.yandex.ru/). Словарь Multilex (http://www.multilex.ru/) представлен в поисковой системе Rambler (http://www.rambler.ru/dict) и в службе @mail.ru (http://multilex.mail.ru/).

Служба словарей Яндекс обеспечивает доступ не только к словарям иностранных языков, но и к толковым словарям, позволяющим выяснить значение определенного слова или термина.

В отличие от систем электронного перевода, для электронных словарей практически нет разницы, какую именно систему использовать, — результат получится один и тот же. Перевод отдельного слова не генерируется системой, а извлекается из базы данных, представляющей собой оцифрованный вариант одного из классических академических словарей.

Поиск переводов в электронном словаре Multilex

Метод поиска переводов или значений слов практически не зависит от того, какой именно словарь используется. Особенностью службы Multilex является наличие дополнительных тематических словарей, позволяющих выяснить значение слова, выступающего в роли термина.

  1. Откройте начальную страницу словарной системы, например http://multilex.mail.ru/.

  2. Выберите вкладку, соответствующую языку перевода.

  3. Установите флажки, соответствующие используемым словарям. Флажок, представляющий направление перевода, подключает все доступные словари.

  4. Введите нужное слово в текстовое поле и нажмите кнопку Перевести. Исходный язык определяется автоматически. На экране появится словарная статья, соответствующая первому из подключенных словарей.

  5. Щелкните на ссылке, относящейся к другому словарю, чтобы увидеть, как это слово представлено в нем. Если ссылка, соответствующая определенному словарю, отсутствует, значит в нем нет нужного слова.

  6. Если изменять набор словарей не требуется, введите иное слово для перевода прямо на странице с предыдущим результатом.

  7. Полученные переводы поместите в отчет.

Определение языка текста

Для перевода текста с одного языка на другой с использованием различных методов необходимо, как минимум, знать, на каком языке написан оригинал. Большинство европейских языков использует латинские буквы, и с первого взгляда определить, на каком языке написан текст, порой затруднительно.

Проблема автоматического определения языка документа менее актуальна, чем собственно перевод документов, тем не менее, в Интернете имеются сайты, позволяющие выяснить, на каком языке написан тот или иной текст. Обычно одного-двух абзацев достаточно для однозначных выводов, а часто определить язык удается уже по десятку слов.

Доступные в Интернете сайты используют разные алгоритмы для идентификации языка текста. Как следствие, гарантировать достоверность полученного результата практически невозможно. Одни из таких сайтов приведены в таблице.

Адрес

Характеристика

http://www.xrce.xerox.com/compelencies/ content-analysis/tools/guesser-ISO-8859-1.en.html

Требует ввода пяти или более слов, может ошибаться на слишком коротких текстах

http://odur.let.rug.nl/~vannoord/TextCat/Demo/textcat.hlmi

Простое средство, реализованное в виде сценария, работающего на сайте. Имеется список всех распознаваемых языков. алгоцитм допускает ошибки

http://www.eidetica.com/services/guesser

На недостаточно длинных текстах иногда предлагаются несколько вариантов языка

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]