Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
11-23 (2).docx
Скачиваний:
3
Добавлен:
27.09.2019
Размер:
115 Кб
Скачать

Перспективы машинного перевода

70-х гг. наблюдается устойчивый рост интереса к системам МП. Именно в это время на рынке не как экзотика, а как технологическая реальность по­являются промышленные системы МП. При всех их недостатках они заполнили вполне определенную функциональную нишу в сфере перево­да, которую покинули обычные переводчики. Подавляющее большинство промышленных систем МП идейно устарели: они основываются на те­оретических представлениях 50—60-х гг. Это с одной стороны. С другой стороны, потенциал вспомогательного компьютерного инструментария Для облегчения переводческой деятельности — автоматические словари, специальные редакторы и т. п. — не реализован в полной мере. В этих Двух направлениях должно пойти развитие систем МП. Следует ожи­дать создания систем МП на основе интеллектуальных технологий (СМП)

Сферы использования мп

В службах научно-технической информации различных ведомств и организаций использование систем МП показало высокую эффективность. Требования к качеству перевода оказались до­вольно низкими, что позволило использовать в этой сфере системы МП первого поколения. Вторая сфера применения МП — крупные меж­дународные организации, использующие документы на многих языках. К числу таких организаций относится, например, ООН и официальные структуры Европейского Союза, в которых документы должны появляться практически одновременно на всех языках членов ЕС. Однако требования к качеству перевода здесь довольно высоки и этап постредактирования необходим даже для систем МП с хорошими характеристиками.

Третья большая область использования МП — техническая докумен­тация. Экспорт продукции — особенно высокотехнологичной — требует перевода больших массивов технических описаний и инструкций.

БИЛЕТ 18

С развитием вычислительной техники в конце 70-х годов (появление микрокомпьютеров, развитие сетей, увеличение ресурсов памяти) машинный перевод вошел в эпоху "Ренессанса". При этом несколько сместились акценты: исследователи теперь ставили целью развитие "реалистических" систем МП, предполагавших участие человека на различных стадиях процесса перевода. Системы МП из "врага" и " конкурента" профессионального переводчика превращаются в незаменимого помощника, способствующего экономии времени и человеческих ресурсов.

О возрождении МП в 70-80-е гг. свидетельствуют следующие факты: Комиссия Европейских общин (CEC) покупает англо-французскую версию Systran, а также систему перевода с русского на английский (последняя развивалась после доклада ALPAC и продолжала использоваться ВВС США и НАСА); кроме того, CEC заказывает разработку франко-английской и итальяно-английской версий. В то время благодаря CEC были заложены основы проекта EUROTRA, основанного на разработках групп SUSY и GETA. Одновременно происходит быстрое расширение деятельности по созданию систем МП в Японии (главным образом основанных на технологии interligva, разработанной Уивером в конце 40-х гг.); в США Панамериканская организация здравоохранения (PAHO) заказывает разработку испано-английского направления (система SPANAM); ВВС США финансируют разработку системы МП в Лингвистическом исследовательстком центре при Техасском университете в Остине; группа TAUM в Канаде достигает заметных успехов в разработке своей системы METEO (которая использовалась в основном для перевода метеорологических сводок). Целый ряд проектов, начатых в 70-80-е гг. впоследствии развились в полноценные коммерческие системы.

За период 1978-93 в США на исследования в области МП истрачено 20 миллионов долларов, в Европе — 70 миллионов, в Японии — 200 миллионов.

Одной из новых разработок стала технология TM (translation memory), работающая по принципу накопления: в процессе перевода сохраняется исходный сегмент (предложение) и его перевод, в результате чего образуется лингвистическая база данных; если идентичный или подобный исходному сегмент обнаруживается во вновь переводимом тексте, он отображается вместе с переводом и указанием совпадения в процентах. Затем переводчик принимает решение (редактировать, отклонить или принять перевод), результат которого сохраняется системой. А в конечном итоге "не нужно дважды переводить одно и то же предложение!". В настоящее время разработчиком известной коммерческой системы, основанной на технологии TM, является система TRADOS (основана в 1984 г.).

5. От 90-х к XXI веку

90-е годы принесли с собой бурное развитие рынка ПК (от настольных до карманных) и информационных технологий, широкое использование сети Интернет (которая становится все более интернациональной и многоязыкой). Все это сделало возможным, а главное востребованным, дальнейшее развитие систем МП. Появляются новые технологии, основанные на использовании нейронных сетей, концепции коннекционизма, статистических методах

В настоящее несколько десятков компаний занимаются разработкой коммерческих систем МП, в их числе: Systran, IBM, L&H (Lernout & Hauspie), Language Engineering Corporation, Transparent Language, Nova Incorporated, Trident Software, Atril, Trados, Caterpillar Co., LingoWare, Ata Software, Lingvistica b.v., и др. (подробнее о зарубежных разработчиках МП и их системах см. здесь.

Появилась возможность воспользоваться услугами автоматических переводчиков непосредственно в Сети: www.alphaworks.ibm.com/aw.nsf/html/mt, http://www.freetranslation.com/, http://www.transtlate.ru/, www.logomedia.net/text.asp, www.foreignword.com/Tools/transnow.htm, babelfish.altavista.com/translate.dyn, infinit.reverso.net/traduire.asp, http://www.t-mail.com/.

С начала 1990-х гг. на рынок систем ПК выходят отечественные разработчики.

В июле 1990 года на выставке PC Forum в Москве была представлена первая в России коммерческая система машинного перевода под названием PROMT (PROgrammer’s Machine Translation). В 1991 г. было создано ЗАО "ПРОект МТ", и уже в 1992 г. компания "ПРОМТ" выиграла конкурс NASA на поставку систем МП (ПРОМТ была единственной неамериканской фирмой на этом конкурсе).

В 1992 г. "ПРОМТ" выпускает целое семейство систем под новым названием STYLUS для перевода с английского, немецкого, французского, итальянского и испанского языков на русский и с русского на английский, а в 1993 г. на базе STYLUS создается первая в мире система МП для Windows. В 1994 г. вышла версия STYLUS 2.0 для Windows 3.Х/95/NT, а в 1995-1996 гг. представлено третье поколение систем машинного перевода, полностью 32-разрядных STYLUS 3.0 для Windows 95/NT, одновременно с этим успешно завершена разработка совершенно новых, первых в мире русско-немецкой и русско-французской систем МП.

В 1997 г. подписано соглашение с французской фирмой Softissimo о создании систем перевода с французского языка на немецкий и английский и обратно, а в декабре этого года была выпущена первая в мире система немецко-французского перевода. В этом же году компания "ПРОМТ" компания выпустила систему, реализованную по технологии Гигант — для поддержки нескольких языковых направлений в одной оболочке, а также специальный переводчик для работы в Интернете WebTranSite.

В 1998 г. выпускается целое созвездие программ под новым названием PROMT 98. Через год компания ПРОМТ выпустила два новых продукта: уникальный пакет программ для работы в Интернете - PROMT Internet, и переводчик для корпоративных почтовых систем — PROMT Mail Translator. Для корпоративных клиентов разработаны также специальные серверные решения – корпоративный сервер переводов PROMT Translation Server (PTS) и Интернет-решение PROMT Internet Translation Server (PITS). В 2000 г. "ПРОМТ" обновила всю линию своих программных продуктов, выпустив МП системы нового поколения: PROMT Translation Office 2000, PROMT Internet 2000 и Magic Gooddy 2000.

Перевод в режиме он-лайн при поддержке системы "ПРОМТ" используется на ряде отечественных и зарубежных сайтов: http://www.translate.ru/, infinit.reverso.net/traduire.asp и др.

Компьютерные словари. Словари необходимы для перевода текстов с одного языка на другой. Существуют тысячи словарей для перевода между сотнями языков (англо-русский, немецко-французский и т. д.), причем каждый из них может содержать десятки тысяч слов. В бумажном варианте словарь представляет собой толстую книгу объемом в сотни страниц, в которой поиск нужного слова является достаточно долгим и трудоемким процессом.

Компьютерные словари могут содержать переводы на разные языки сотен тысяч слов и словосочетаний, а также предоставляют пользователю дополнительные возможности. Во-первых, компьютерные словари могут являться многоязычными - давать пользователю возможность выбрать языки и направление перевода (например, англо-русский, испанско-русский и т. д.).

Во-вторых, компьютерные словари могут кроме основного словаря общеупотребительных слов содержать десятки специализированных словарей по областям знаний (техника, медицина, информатика и др.).

В-третьих, компьютерные словари обеспечивают быстрый поиск словарных статей: "быстрый набор", когда в процессе набора слова возникает список похожих слов; доступ к часто используемым словам по закладкам; возможность ввода словосочетаний и др.

В-четвертых, компьютерные словари могут являться мультимедийными, т. е. предоставлять пользователю возможность прослушивания слов в исполнении дикторов, носителей языка.

Одним из наиболее популярных компьютерных словарей является ABBYY Lingva

Память переводов (ПП, англ. translation memory, TM, иногда также называемая «накопитель переводов») — база данных, содержащая набор ранее переведенных сегментов текста.

Одна запись в такой базе данных соответствует сегменту или «единице перевода» (англ. translation unit), за которую обычно принимается одно предложение (реже — часть сложносочинённого предложения, либо абзац). Если единица перевода исходного текста в точности совпадает с единицей перевода, хранящейся в базе (точное соответствие, англ. exact match), она может быть автоматически подставлена в перевод. Новый сегмент может также слегка отличаться от хранящегося в базе (нечёткое соответствие, англ. fuzzy match). Такой сегмент может быть также подставлен в перевод, но переводчик будет должен внести необходимые изменения.

Помимо ускорения процесса перевода повторяющихся фрагментов и изменений, внесенных в уже переведенные тексты (например, новых версий программных продуктов или изменений в законодательстве), системы ПП также обеспечивают единообразие перевода терминологии в одинаковых фрагментах, что особенно важно при техническом переводе. С другой стороны, если переводчик регулярно подставляет в свой перевод точные соответствия, извлеченные из баз переводов, без контроля их использования в новом контексте, качество переведенного текста может ухудшиться.

В каждой конкретной системе ПП данные хранятся в своем собственном формате (текстовый формат в Wordfast, база данных Access в Deja Vu), но существует международный стандарт TMX (англ. Translation Memory eXchange format), который основан на XML и который может генерироваться практически всеми системами ПП. Благодаря этому сделанные переводы можно использовать в разных приложениях, то есть переводчик работающий с OmegaT может использовать ПП, созданную в ТРАДОСе и наоборот.

Большинство систем ПП как минимум поддерживают создание и использование словарей пользователя, создание новых баз данных на основе параллельных текстов (англ. alignment), а также полуавтоматическое извлечение терминологии из оригинальных и параллельных текстов.

В соответствии с обзорами использования систем ПП к наиболее популярным системам относятся[1][2]:

  • ABBYY Aligner

  • Deja Vu

  • OmegaT (бесплатная система, распространяемая по лицензии GNU GPL)

  • SDLX[3]

  • Trados (наиболее популярная программа, долгое время бывшая стандартом ПП)

  • STAR Transit

  • Wordfast (реализована как набор макросов для MS Word, новая версия 2009 года является отдельным приложением)

19. Методы обучения иностранным языкам.

В последнее время появляется все больше различных технологий изучения языков: различные новейшие технические средства, передовые формы и современные методы изучения и преподавания, современный подход к процессу изучения. Инновации позволяют за меньшее время получить большее качественных знаний, а не мучатся над книжками день и ночь. Теперь для овладения языком не нужно тратить годы. Новые методы и подходы в изучении иностранных языков позволяют одновременно изучать несколько языков с меньшими затратами времени и сил.

1. Грамматико-переводной метод – пользовался особой популярностью с 1890-го по 1930-ый годы. В это время студенты языковых классов переводили тома сочинений классических греческих и латинских авторов на свой родной язык. Метод базировался на постоянном использовании множества словарей, разъяснении грамматики на родном языке студента, введении нескольких фраз – примеров и бесконечных упражнений на запоминание языковых конструкций при минимальном использовании языка в речи. Таким образом, хотя некоторые ученики достигали впечатляющих познаний в языке, большинство так и не могло научиться говорить.

2. Когнитивный метод (1940 -1950 гг). Этот метод впервые разграничил 4 основных аспекта языка – чтение, письмо, аудирование и устную речь – причем теперь именно последняя стала считаться целью обучения. Стало обязательным общение на иностранном языке в процессе изучения.

3. Аудио-лингвальный метод (1950 -1960 гг). С развитием аудио технологий этот метод стал особенно популярным: он предполагал прослушивание оригинального языкового материала, исполненного носителем языка, и повторение студентом языковых конструкций. Обязательные атрибуты – аудио магнитофон, наушники, кассеты. Постоянное прослушивание и повторение конструкций за диктором, несомненно, давало определенный эффект, развивая понимание и произношение. Минусом метода являлось недостаточное внимание навыкам общения в естественных, не "запрограммированных" жизненных ситуациях.

4. Прямой метод, развившийся в 1970 году, предполагал использование только иностранного языка при обучении. В основе метода – беседы и обсуждения на "целевом" языке, понимание значений слов из контекста и постепенное расширение словаря. Строго пресекались всякие отсылки к родному языку, чистота и четкость произношения играли очень важную роль. Изучение грамматики при этом носило вторичный характер – она разбиралась лишь по ходу освоения соответствующего разговорного материала.

5. Естественный/ коммуникативный подход (1970 -2000гг). Согласно этому методу, освоение языка проходит 3 стадии: первоначальное понимание речи, ранние попытки воспроизведения речи, дальнейшее постоянное расширение воспроизведения речи, приводящее к освоению всего языкового материала. Другими словами, после периода молчания следует период понимания речи, а затем – говорение на языке. В рамках этого метода все общение происходит на иностранном языке, при этом на начальных порах на ошибках не заостряют внимание. Именно в этот период появляются яркие учебники с разнообразными упражнениями, заметками о культуре страны изучаемого языка, картинками и глянцевыми фотографиями. Основной способ тренировки материала – распределение студентов по маленьким группам или парам для отработки тех или иных языковых аспектов. Обучение по этому методу предполагает постоянное проигрывание жизненных ситуаций, визуализацию и использование воображения. На сегодняшний день этот метод изучения языка наиболее распространен. Однако при выборе метода руководствуйтесь также своими личными особенностями и предпочтениями. Есть множество людей, выучивших язык по аудио курсам, есть и те, кто осваивал язык, читая художественную литературу в оригинале, а кто-то погружается в язык с помощью кино и уже через месяц-другой начинает говорить. У всех этих людей есть только одно общее – все они активно и старательно работали над изучением языка.

20. Дистанционное обучение

Дистанционное обучение как форма образования существует очень давно - практически столько же сколько существует письменность. На самом деле для определения понятия дистанционное образование необходимо вернуться к определению обучения вообще. Если под обучением понимать любое увеличение знаний у человека, то наибольшее количество знаний в современном мире человек получает при помощи дистанционных источников (книг, телевизионных передач и т.п.). При этом даже при очном обучении преподаватель, чаще всего, опирается на литературные данные, а не на результаты собственных экспериментов, т.е. он получает сведения дистанционно. Для того, чтобы избежать путаницы, в теории образования даже используют разграничение источников информации - первичными источниками считаются те, которые получены при непосредственной работе с изучаемыми объектами, а вторичными - все остальные. При таком разграничении обучение при помощи вторичных источников можно отнести к дистанционному.

Более того, если задуматься над процессом обучения с точки зрения особенностей источников информации, то становится понятным, что любое обучение включается в себя цикл использования вторичной информации (будь то учебник, книга или преподаватель, читающий лекцию) и применение этой информации на практике с целью получения первичной информации. В этом случае разграничение между очными и дистанционными формами обучения начинает относиться только к типу носителя информации (человек или что-то иное), но ни как не к содержанию. Иными словами мы можем определить дистанционное обучение как методику преподавания, в которое между преподавателем и обучаемым находится неживой материальный посредник передачи информации.

В чем же преимущества дистанционного обучения? Первое преимущество очевидно - человеку не нужно тратить время на приход (приезд) в обучающий центр и поэтому экономятся средства, затрачиваемые на дорогу. Отсюда следует и второе преимущество - человек не связан жестко с расписанием занятий, он может адекватно планировать свой день - что очень удобно именно в последипломном образовании, где слушатели обычно имеют ограниченный ресурс свободного времени. Третье преимущество не столь очевидно, но не менее важно - человек может обучаться в том темпе, который ему подходит, более детально разбираться с непонятным материалом и выискивать дополнительные источники информации, что повышает качество обучения. И, наконец, более легкие возможности самоконтроля - человек может проверить свои знания, а затем вернуться и пересмотреть те разделы, которые были неважно выучены.

Недостатки дистанционного обучения также достаточно очевидны.

1. отсутствие возможности должного контроля. В аудитории преподаватель всегда может пересчитать студентов по головам и отметить по списку. Он видит, кто чем занимается, кто и как готовится и выступает. Этой возможности он лишен при дистанционном способе образования. Он не видит, достаточно ли времени тратит студент на изучение материала. Впрочем, он вообще не видит, делается ли хоть что-нибудь. Он может поставить перед студентом четкие сроки и проследить за тем, чтобы они были выдержаны. Но ведь при этом он не может проследить, кто именно занимается и сдает экзамены. Возможно, что диплом нужно выдавать не тому, кто регистрировался на курс, а его другу-отличнику.

2. отсутствие должной аттестации. Имеется в виду, конечно, оценка качества получаемых знаний. Заполняя тест на сайте учебного заведения, студент имеет время и возможности для того, чтобы найти нужный материал и ответить на вопросы. С экзаменами, где требуются рассуждения, сложнее. Но ведь оценка знаний должна быть разносторонней, верно? Общую образовательную базу никто не отменял, поэтому знание исторических дат тоже обязательно нужно оценить. А это зачастую невозможно.

3. отсутствие аттестации как таковой. Этим грешат многие курсы повышения квалификации и дополнительных знаний. Все, что они должны сделать, - прислать нужный материал. Будет он проработан, не будет проработан - им до этого нет никакого дела. Чем меньше домашних заданий им присылают - тем меньше работы преподавателям. Плюс от таких курсов в том, что учебные материалы, порой очень и очень грамотные, все равно регулярно присылаются и остаются у студента, который всегда сможет ими воспользоваться в будущем. Да и вообще: если студент относится к таким занятиям серьезно, он не позволит себе расслабиться. Только вот дипломов от таких курсов не дождешься. Вы получите красивый сертификат, причем независимо от того, открыли ли вы учебные тетради хоть раз. Только толку от этого сертификата не будет.

Впрочем, все эти проблемы решаются. Современные технические средства позволяют преподавателю наблюдать за своими студентами в режиме реального времени и видеть, кто и когда "пришел" на лекцию или семинар и чем конкретно в это время занимается. Он может устраивать обсуждения и задавать студенту дополнительные вопросы. Тестирования тоже можно проводить под наблюдением и ответы проверять в режиме "он-лайн". Но это актуально только для серьезных университетов, которые предлагают полноценные программы и государственный диплом. У краткосрочных курсов и правда другая цель - предоставить студенту материал и направить. А он - серьезный и целеустремленный - сам получит от курсов все, что необходимо, и свою пригодность докажет работодателю знаниями, а не сертификатом.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]