Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
3к Спецперевод Лекция 3.doc
Скачиваний:
7
Добавлен:
18.08.2019
Размер:
118.27 Кб
Скачать

2. Интернет в работе переводчика

Димитриос Сабатакакис (Dimitrios Sabatakakis), исполнительный директор компании Systran, утверждает, что сетевые технологии и, в частности, Интернет, упрощают процесс создания специализированных систем перевода. Для того чтобы подготовить словарь из 300 тыс. слов раньше требовалось от трех до четырех лет работы сотрудников, занятых анализом специализированных текстов определенной тематики. Теперь этот срок сократился до 3-4 месяцев за счет того, что для анализа используется электронная документация, циркулирующая во внутренних сетях компаний, деятельность которых сосредоточена в той или иной предметной области.

Еще одно преимущество состоит в том, что в настоящее время большинство крупных компаний обладают «фирменным стилем» оформления документов и собственной терминологией, которая используется не только при подготовке внутренних или общедоступных материалов, но и при оформлении корпоративных web-сайтов или пресс-релизов. При правильной настройке «умная» система в состоянии распознать «принадлежность» документа к той или иной компании, и подготовить более точный и правильный его перевод, по сравнению с «не фирменным» документом. Более того, по словам Д. Сабатакакиса, некоторые компании специально используют стандартизованный язык при подготовке всей документации с той только целью, чтобы упростить и формализовать процесс перевода материалов, удовлетворяющих корпоративным стандартам. В этом случае, например, на всех страницах корпоративного сайта, содержащих документацию справочного или технического характера, можно разместить кнопку, которая будет запускать систему автоматического перевода, обрабатывающую все содержимое страницы целиком. Если при этом «электронный толмач» еще и «обучен работе» с учетом корпоративных стандартов, то качество перевода будет приближаться к тому, что смог бы сделать человек-профессиональный переводчик.

Примером компании, на практике реализовавшей подход «формализованного» перевода является Autodesk, из г.Сан-Рафаэля (штат Калифорния). Более половины своих доходов (около 60%) этот гигант софтверного рынка получает за счет продажи программных продуктов за пределами США. Соответственно, службе поддержки приходится общаться с пользователями из разных стран мира и обходиться одним английским не получается. Поэтому руководство компании пошло по весьма необычному пути: техническая поддержка зарегистрированных пользователей осуществляется путем создания онлайн-базы, в которой содержится более 10 тыс. документов, каждый из которых, в среднем, содержит около 1000 слов. Ежемесячно в «хранилище» поступает несколько сотен новых документов, а неугомонные клиенты ежедневно совершают около полумиллиона обращений к этой куче полезных материалов.

Очевидно, что перевод на несколько языков всех доступных пользователям документов с привлечением профессиональных переводчиков потребовал бы немалых затрат, как с точки зрения времени, так и с точки зрения денег. Вместо этого каждый исходный документ готовится лишь на английском языке, но с соблюдением определенных строго установленных правил. Затем, имеющаяся в распоряжении компании система машинного перевода от Systran, которая специально настроена для перевода формализованных текстов, отвечающих корпоративным стандартам Autodesk, позволяет получать достаточно точные копии исходного документа на французском, немецком, испанском или итальянском языках. В перспективе рассматривается даже возможность перевода документации и на японский язык.

Правда за время, прошедшее с июля 2001 года, когда эта уникальная система была запущена в эксплуатацию, выявились некоторые проблемы. Главная из них состоит в том, что все ключевые слова, по которым осуществляется поиск в базе документов, должны быть заданы на английском языке. Разработчики полагали, что пользователи получат возможность формулировать поисковые запросы на родном языке, а система самостоятельно будет переводить ключевые слова на английский и уже по ним осуществлять поиск в англоязычной базе документов. На практике же оказалось, что «неформализованные» запросы переводятся системой на английский достаточно вольно, и результаты поисков оказываются далеки от тех, на которые мог рассчитывать пользователь, не владеющий английским языком. Autodesk приложила массу усилий на преодоление этой проблемы, но пока что не очень успешно. Несмотря на это, Стив Макклур из IDC называет используемую Autodesk схему организации перевода «поворотным пунктом» в развитии коммерческих систем машинного перевода. По его мнению, организация многоязычных служб технической поддержки пользователей − это именно тот сектор рынка, в котором системы машинного перевода имеют огромные перспективы. Ведь техническая документация сравнительно проста, как правило, не содержит многозначностей, а потому ее перевод легко поддается автоматизации. «Если сотрудничество Autodesk и Systran окажется успешным, то это означает, что перед системами машинного перевода будут открыты двери в области организации многоязычных служб поддержки пользователей», − высказывает свое мнение Стив Макклур. IBM, кстати говоря, тоже поспешила запустить в эксплуатацию нечто подобное.

В интервью, данном журналу Economist (http://www.economist.com/) Д. Сабатакакис признался, что разработчики систем машинного перевода из Systran уже столкнулась с тем, что некоторые транснациональные компании проявили практический интерес к сотрудничеству с Systran в деле создания систем подобных той, что сегодня используется Autodesk. Отбросив ложную скромность, исполнительный директор Systran даже высказал надежду, что подобно тому, как в свое время появление в Америке скоростных шоссе способствовало развитию компании Goodyear, занимающейся производством шин, так и рост сети Интернет окажет самое благотворное влияние на развитие систем машинного перевода. Среди крупных клиентов меняется само отношение к электронным переводчикам. Если раньше системы машинного перевода рассматривались в качестве некоторого обособленного инструмента, которым можно было пользоваться от случая к случаю, а в остальное время «хранить в чулане», то теперь речь идет об интеграции подобных систем непосредственно в процесс документооборота компании.

Сеть Интернет может использоваться в качестве одного из непосредственных элементов системы машинного перевода, который в состоянии значительно улучшить качество работы «электронного толмача». Речь идет о создании так называемой общедоступной «памяти переводчика» (translation memory). Такая «память» представляет собой базу данных, в которой накапливаются все образцы ранее переведенных текстов. Профессиональные переводчики хранят подобную «базу данных» в собственной голове и, сталкиваясь с «типовым» предложением или устойчивым словосочетанием, переводят их, не задумываясь. Наверняка те, кому приходилось заниматься переводами инструкций к бытовой технике, знают, что, например, тексты инструкций к аналогичным изделиям различных производителей (принтерам, видеокамерам, телевизорам и т.д.) в значительной степени похожи между собой. С точки зрения технической реализации системы машинного перевода это означает, что электронный переводчик, обладающей базой типовых фраз, сумеет переводить подобные тексты гораздо успешнее и правильнее, чем аналогичная система, вынужденная каждый раз заново корпеть над каждым отдельным предложения в тексте документа. Поэтому современные «умные» электронные переводчики, ориентированные на применение в конкретной предметной области, сочетают в своей работе поиск по базе «шаблонов» с классическим машинным переводом.

Некоторые компании, занимающиеся разработкой систем машинного перевода, всерьез заговорили о том, что, используя возможности сети Интернет, можно создавать общедоступные базы «типовых фраз», пользоваться которыми смогут системы машинного перевода различных производителей. Причем клиенты таких баз смогут не только выискивать необходимые шаблоны, но и пополнять набор новыми элементами, встреченными в процессе перевода какого-либо текста с тем, чтобы прочие участники системы не тратили лишнего времени на ту же самую работу. Теоретически, такая система позволит многократно увеличить скорость перевода и улучшить его качество.

Однако теория не всегда соответствует практике, и при реализации идеи обнаруживается масса «подводных камней», с которыми могут столкнуться потенциальные пользователи. Первая проблема − качество. Ведь если база будет общедоступной и открытой для пополнения, то нет никакой уверенности в том, что хранящиеся в «коллекции» образцы переводов − правильные. Не меньшую сложность представляет и установление авторских прав на весь накопленный материал. В России к интеллектуальной собственности привыкли относиться как к чему-то «бесплатному» и «ничейному», за рубежом своего не упустят. Представители американской ассоциации машинного перевода опасается, что крупные компании будут препятствовать тому, чтобы какие-то части их документов попадали в общедоступную базу в качестве образцов «правильного перевода». Причина одна − если какая-то компания перевела, скажем, инструкцию к своему продукту на китайский язык, затратив на это немалое время и оплатив труд переводчика, то почему же этими результатами должны пользоваться конкуренты? Наконец, «собрание образцов» может стать бесполезным и по той причине, что для описания аналогичных по техническим характеристикам устройств конкурирующие компании используют различную терминологию лишь для того, чтобы их продукция хоть как-то отличалась от аналогичных товаров, производимых другими фирмами. Может быть, с точки зрения маркетинга это и правильно, а вот для систем машинного перевода − лишняя трудность.

Однако известно, что любую проблему можно преодолеть, например, компания Prolyphic из Сан-Диего выплачивает авторское вознаграждение любому лицу, пополнившему базу образцов, всякий раз, когда кто-то использует внесенный образец для собственного перевода. Кроме того, Prolyphic проверяет вносимые шаблоны на корректность − это должно гарантировать высокое качество перевода при обращении к базе. Наконец, что касается использования «фирменной» терминологии при переводе или информации, защищенной авторским правом, то на этом настаивают лишь очень крупные компании. Более мелким производителям важнее получить качественный перевод документации, затратив на это минимум времени и средств, а потому именно они могут стать основными клиентами общедоступных баз «образцовых переводов».

Джон Хатчинс, эксперт в области истории машинного перевода, полагает, что, вероятнее всего, в ближайшее время увеличится спрос не на универсальные, а на специализированные системы машинного перевода. Такие электронные переводчики, ограниченные рамками конкретной предметной области, смогут удовлетворить запросы клиентов, заинтересованных в получении качественного, быстрого и, главное, недорогого (а лучше и вовсе бесплатного) перевода текстов, относящихся к узкоспециализированным областям человеческой деятельности. Именно в такого рода электронных помощниках заинтересованы, например, научные издания, заботящиеся о том, чтобы появившиеся на их страницах публикации были бы доступны для прочтения специалистам из разных стран мира. Однако снова возникает проблема, с которой уже пришлось столкнуться компании Autodesk: ключевые слова, по которым осуществляется поиск в коллекции статей, должны быть заданы на языке оригинала. Ведь «машинный перевод» поискового запроса с иностранного языка оказывается весьма далек от тех терминов и понятий, которые подразумевал пользователь, набирая фразы на родном ему языке. Между тем, как выяснили ученые из компании IDC, занимающиеся этим вопросом, даже люди, отлично владеющие иностранным языком, при любом удобном случае предпочитают формулировать поисковый запрос на более понятном наречии своей собственной страны.

Рассказ о системах машинного перевода получился бы не полным, если речь в нем не зашла бы о практической стороне дела, а именно о том, где в Интернете можно отыскать реально действующие общедоступные системы машинного перевода. При этом необходимо помнить, что на сегодняшний день эти электронные переводчики в состоянии осуществлять лишь весьма приблизительный перевод, передающий общий смысл иностранного текста, но ведь и это не мало. В конце концов, понятие «хорошего перевода» − весьма относительная категория − представители крупных компаний зачастую остаются недовольны работой даже профессиональных переводчиков лишь потому, что те, по их мнению, не смогли передать «фирменный стиль» или использовали «не ту» терминологию при переводе документации.

1. http://www.translate.ru/ − сервис, предоставляемый компанией PROMT. С помощью этого сайта можно осуществлять перевод специализированных текстов и материалов произвольной тематики, web-страниц целиком (путем указания их сетевого адреса), а также электронной корреспонденции. Кроме того, сервис предлагает уникальную услугу − WAP-переводчик, который может пригодиться тем, кто предпочитает использовать для Интернет-путешествий сотовый телефон. Кроме собственно переводчика на сайте имеется и «перекодировщик кириллицы», который используется в том случае, если электронное послание в результате нескольких перекодировок приобрело нечитаемый вид. «Умный» помощник в состоянии преобразовывать русский текст из кодировок КОИ-8, DOS-866, Macintosh, ISO 8859-5, Quoted Printable и латиницы в Windows-1251 и обратно.

PROMT's online Translator работает с русским, английским, немецким, французским, итальянским и испанским языками. Однако, понимая итальянские и испанские тексты, этот «электронный толмач» не в состоянии выполнять обратного перевода. «Переводчик от PROMT», помимо словаря общей лексики, располагает и специализированными тематическими словарями. Например, что касается английского языка, то здесь доступны: автомобильный и банковский словари, материалы необходимые при ведении деловой переписки и собрание терминов для любителей компьютерных игр, словарь Интернет-понятий, словари по логистике, программному обеспечению, спорту и путешествиям.

2. http://www.ars.ru/socrat/ − «Сократ Сервер» − сервис динамического онлайн-перевода, оригинальная разработка компании Арсеналъ, которая при создании переводчика использовала собственные лингвистические технологии и словари. «Сократ Сервер» поддерживает перевод с русского на английский, немецкий или французский языки и обратно. Предоставляются услуги по переводу текстов, web-страниц и электронной корреспонденции. Специализированных словарей у онлайн-версии «Сократа» пока нет. Однако, судя по оставленным пустыми полям формы, которая размещена на сайте, со временем подобный инструментарий появится. Впрочем, и 56 000 слов и выражений, содержащихся в основном словаре системы, вполне хватает для перевода не слишком сложных текстов.

Услугами системы автоматического перевода «Сократ» можно воспользоваться и на сайте компании Эктако, занимающейся разработкой карманных переводчиков (http://www.perevodov.net/). Тут же представлены и словари, подготовленные специалистами самой компанией. Правда, в отличие от электронного переводчика, разработанного компанией Арсеналъ, способного переводить связанные тексты, собственный продукт компании «Эктако» обладает лишь функциями обычного словаря, предоставляя возможность перевода одиночных слов. Поддерживаемые языки − английский и французский.

3. http://www.lingvo.ru/lingvo/Translate.asp − Lingvo-online − система перевода от компании ABBYY. Онлайн-вариант сервиса предоставляет возможность перевода слова или словосочетания, поиск вариантов написания слова и полнотекстовый поиск слова или словосочетания по словарям Lingvo.

Lingvo-online содержит 9 стандартных словарей, и разработчики обещают, что в дальнейшем этот набор будет расширен. Особенность сайта − перечень словарей, используемых для перевода, определяется пользователем самостоятельно, причем эти настройки сохраняются при выполнении следующей операции или при следующем посещении страницы Lingvo-online.

4. http://babel.altavista.com/translate.dyn − Babel fish − электронный переводчик, построенный на базе программного ядра и словарей, подготовленных специалистами компании Systran. Может переводить тексты или содержимое web-страниц. Распознаваемые языки: английский, французский, немецкий, португальский, итальянский, испанский, русский, китайский, корейский и японский. К сожалению, для большинства языков, в том числе и русского, поддерживается лишь перевод на английский язык, обратный перевод не возможен. Специализированных словарей нет.

5. http://www.freetranslation.com/ − сервис онлайнового перевода, предоставляемый компанией SDL International (http://www.sdlintl.com/). Этот электронный переводчик в состоянии распознавать как тексты произвольного содержания, так и web-страницы целиком, адрес которых указан пользователем. К сожалению, с русским языком система не работает, зато может перевести на английский тексты с испанского, французского, немецкого, итальянского и португальского языков, а при переводе с английского к этому набору добавляется и норвежский язык. Интересно решена проблема ввода символов, отсутствующих в «интернациональном англо-американском наречии», − специальная форма внизу страницы дает возможность вводить разнообразные экзотические знаки, встречающиеся в письменности тех языков, с которыми знакома система. Специализированных словарей нет.

Помимо уже перечисленных сравнительно крупных сервисов онлайнового перевода, существует масса других сайтов, которые предоставляют услуги перевода и могут пригодиться в некоторых более экзотических случаях. Например, переводы с английского на арабский и обратно поможет выполнить web-сервис, предоставляемый французской компанией CIMOS. Адрес web-страницы с соответствующей формой − http://www.cimos.com/TradNet.htm. Интересно, что поддерживаемый французской компанией сервис отличается не только экзотической языковой парой, но и располагает набором специализированных словарей: компьютерным, финансовым, и словарем военной тематики.

С китайским и японским языками работает сервис по адресу http://en.transea.com/translate/browse/0/. Однако прежде чем воспользоваться услугами этого экзотического переводчика, требуется зарегистрироваться на сайте TranSea (http://en.transea.com/user/user/new/).

Наконец, тем, кому не нужен развернутый перевод, и достаточно лишь уточнить значение отдельных слов, можно рекомендовать обратиться к услугам онлайнового англо-русского переводчика, включающего в себя почти 77 тыс. словарных статей (http://www.informika.ru/windows/cgi-bin/dict/engrus.pl), или воспользоваться словарями, доступными посетителям Рамблера (http://www.rambler.ru/dict/) и Яндекса (http://lingvo.yandex.ru/). В последнем случае, при желании, можно даже установить у себя на локальной машине специальный модуль для Internet Explorer, который даст возможность щелчком мыши переводить слова в браузере. При условии, конечно, что компьютер подключен к сети Интернет.

Таким образом, благодаря усилиям разработчиков, на сегодняшний день можно отыскать «электронного переводчика» едва ли ни любой специализации и со знанием самых экзотических языков. Однако переводы, полученные с помощью подобных систем, в большинстве случаев дают возможность судить лишь об общей сути иностранного текста. Тем, кому требуется «серьезный» перевод, придется все-таки прибегать к помощи профессионалов. Или изучать язык самостоятельно…