Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Тугаринова Настя (7).doc
Скачиваний:
0
Добавлен:
21.11.2018
Размер:
2.71 Mб
Скачать

3. Создание конкорданса

Для создания конкордансов используется программа AntConc. В корпусе дано подробное описание этой программы, а также ссылка для скачивания и тексты для работы с программой.

Рисунок 10. Окно страницы описания программы AntConc на сайте КТПШ

4. Наполнение сервиса

Для того чтобы добавить текст в корпус, сначала нужно выбрать раздел Corpus Builder (конструктор корпуса).

Перед тем как добавить свой текст, нужно заполнить следующие поля:

  • тип текста (эссе, письмо другу, монолог, диалог),

  • уникальный идентификатор (ID),

  • возраст, пол, школа, класс,

  • родной язык, второй язык,

  • дополнительное образование (подготовительные курсы, репетитор, не занимается),

  • уровень владения языком (новичок, начальный, ниже среднего, средний, выше среднего, продвинутый),

  • тема.

И последнее, вставить свой текст в соответствующее поле.

Рисунок 31. Конструктор корпуса

2.3. 2. Учебный многоязычный корпус MeLlange

В проекте по созданию корпуса MeLLANGE (Multilingual eLearning in Language Engineering) проекта приняли участие академические и отраслевые партнеры из Франции, Австрии, Чехии, Германии, Италии, Испании, Швейцарии и Великобритании. Корпус предназначен для создания инновационных учебных материалов для изучающих язык и профессиональных переводчиков.

Помимо разработки и внедрения интерактивных курсов в корпусную лингвистику для переводчиков и памяти перевода, консорциум проекта также разработал обучаемые и профессиональные переводы из четырех типов текстов, принадлежащим к разным сферам деятельности. Эта коллекция переводов называется MeLLANGE Учебный Корпус Переводов (LTC). LTC включает в себя работы стажеров, которые были размечены на ошибки в соответствии с составленной типологией ошибок. Корпус доступен через интерфейс запросов MeLLANGE.

В консорциуме также составлен список соответствующих корпусов для области переводоведения и обучения переводу.

Наконец, есть ряд ресурсов такие, как исходные тексты, корпусы в обработке, а также обработанные форматы, типология ошибок и т.д. которые также доступны в корпусе.

Сам корпус находится на сайте в разделе «интерфейс запросов MeLLANGE».

Первое что нужно сделать в этом разделе – выбрать корпус (MeLLANGE LTC/eCoLoRe TMX). Нас интересует MeLLANGE LTC. Следующий шаг – выбрать необходимый тип информации (лингвистическая информация/студенческие и целевые текстовые метаданные/оба). Нас в первую очередь интересует лингвистическая информация. После того как вы выбрали лингвистический тип информации, слева должны появиться следующие подразделы:

  • тип текста (любой, административный, технический, правовой, журналистский),

  • язык текста,

  • целевой язык,

  • тип ошибки (классификацию ошибок см. в приложении 1).

Рисунок 12. Окно страницы корпуса MeLLANGE

Выбрав по каждому из этих разделов пункты, корпус выдаст результаты.

Рисунок 13. Результат запроса

На рисунке 13 показан пример с результатами запроса. В полученном запросе отображается оригинал текста, целевое предложение(я), полученный текст и альтернативные переводы студентов. В полученных переводах выделена ошибка и с помощью разметки указан ее тип. При наведении курсором на слово, в котором была допущена ошибка, всплывает правильный вариант слова.

Выбрав в разделе «тип информации» пункт «студенческие и целевые текстовые метаданные», ниже появится меню, в котором дается перечень критериев, по которым вы можете отобрать нужные тексты. Во-первых, это детализированная информация об учащихся, такая как первый и второй язык, уровень языка, обучающая программа, профессиональный статус, сколько лет изучает язык и др. Во-вторых, метаданные о целевом тексте, такие как ссылки используемых ресурсов, оцененный перевод, лимит времени, время, потраченное на перевод, использованные программные средства при переводе и др.

Рисунок 4 Окно меню при выборе пункта «студенческие и целевые текстовые метаданные»

Статистику ошибок определенных текстов каких-то определенных студентов, выполненные за определенное время и т.д., можно получить в разделе «тип информации» выбрав пункт «оба». Фрагмент страницы показан на рисунке 17:

Рисунок 5. Окно меню при выборе пункта «оба».

По сравнению с Учебным Корпусом Петербургским Школьников, корпус MeLLANGE не дает пользователям такой возможности как свободного наполнения или синтаксической разметки. Корпус наполняют авторы. Но данный корпус содержит более мощную текстовую базу на разных языках.

Данные примеры учебных онлайн корпусов дают нам представление о том, из чего и как должен строиться корпус, что является обязательным при его создании, а что каждый автор считает менее важным, какие тексты выбирают для исследования и т.д. На основе этих примеров, мы можем говорить о структуре будущего учебного корпуса.