- •«Иркутский государственный лингвистический университет»
- •Инструментальные средства разработки учебного корпуса ошибок по русскому языку
- •Иркутск
- •Глава I Понятие корпусной лингвистики и учебного корпуса….………....4
- •Глава II Аналитический обзор средств разработки учебного корпуса...…15
- •Введение
- •Глава I. Понятие корпусной лингвистики и учебного корпуса
- •1.1. Краткий обзор разработок по созданию корпусов текстов
- •1.2 Учебные корпуса: определение и назначение
- •Глава II. Аналитический обзор средств разработки учебного корпуса
- •2.1. Аналитический обзор программных средств для аннотирования текста
- •2.2. Классификация ошибок
- •2.3 Примеры строения учебных корпусов
- •2.3.1 Корпус Текстов Петербургских Школьников
- •1. Разметка текста на ошибки
- •2. Синтаксическая разметка текста
- •3. Создание конкорданса
- •4. Наполнение сервиса
- •2.3. 2. Учебный многоязычный корпус MeLlange
- •2.4. Общие рекомендации по выбору инструментальных средств для создания корпуса по русскому языку
- •Заключение
- •Библиография
- •Приложение 1
2.2. Классификация ошибок
Учебные корпуса особенно полезны, когда они размечены на ошибки, т.е. когда все ошибки в корпусе аннотированы с помощью стандартизированной системой разметки.
Разметка ошибок очень трудоемкая и занимающая много времени задача. В тоже время, аннотированный корпус обеспечивает бесценными средствами в исследовании изучаемого языка.
Для исследователей ошибки могут многое рассказать о процессах, используемых в изучаемом языке, и подходы учащихся, используемые в этих процессах. Языковым инструкторам ошибки помогают определить степень знаний в данной языковой системе и чему они по-прежнему должны учиться. Наконец, для самих учащихся доступ к помеченным на ошибки данным дает возможность узнать, что ему нужно развивать и совершенствовать.
Для исследования любого учебного корпуса обычно рассматриваются способы классификации ошибок, выбирается методика их кодирования в корпусе для последующей автоматической либо ручной разметки (error tagging), а также методика количественного автоматизированного подсчета ошибок по типам, что позволяет провести их всесторонний лингвистический и лингводидактический анализ. Анализ переводов по кодам ошибок позволяет отследить, какие ошибки являются наиболее частотными у данного студента или группы, оптимизировать курс перевода, корректируя методику преподавания тех или иных аспектов.
Единой классификации для анализа учебных корпусов нет. Это можно увидеть на примерах разных учебных корпусов. Например, арабские лингвисты Дулай, Берт и Крашен предлагают две основные описательные таксономии ошибок:
-
ошибки, основанные на языковых категориях (общие, такие как морфологические, лексические и грамматические и более конкретные, такие как вспомогательные средства, пассивные и предлогов);
-
ошибки с упором на изменение поверхностной структуры (например, опущение или нарушение порядка слов).
В таблицах 1 и 2 представлены примеры фонетических и орфографических ошибок на примере учебного корпуса Лонгман.
Таблица 1. Примеры фонетических ошибок
Фонологическая проблема |
Помеченное слово |
Ошибка |
Установление различий между фонемами в слове |
Worry |
Know |
Прослушивание всех фонем в слове |
Ferry |
No word |
Различение гласных |
Especially |
espicially |
Прослушивание суффиксов |
Staying |
Stay |
Прослушивание гласных |
Another |
Anther |
Сбивающие с толку минимальные пары |
Hill |
Hell |
Различение звонких и глухих согласных |
Cable |
Caple |
Запоминание последовательности слов |
Down |
Up |
Прослушивание согласных |
Tourist |
Toress |
Различение суффиксов |
Attraction |
Attractive |
Прослушивание последнего слога |
Country |
Cont |
Различение согласных фонем |
Ferry |
Thery |
Прослушивание медиального слога |
Transportation |
Transportion |
Таблица 2. Примеры орфографических ошибок
Орфографическая проблема |
Целевое слово |
Ошибка |
Диграф гласного |
Cheapest |
Cheepest |
Непроизносимый гласный |
Relatives |
Relativs |
Двойной согласный |
Middle |
Midle |
Сбивающие с толку омофоны |
Hall |
Whole |
Непроизносимый согласный |
Excellent |
Exlelant |
Порядок написания 2х гласных |
Break |
Braek |
Диграф согласного |
Brought |
Brout |
Порядок написания гласного и согласного |
Use |
Ues |
Формы согласного |
Economical |
Echonomical |
Транскрипционный знак |
Connects |
Conex |
Скрытый согласный |
Question |
Equsion |
Непроизносимый диграф |
Neat |
Neaght |
В приложении 1 представлена классификация ошибок Учебного Переводного Корпуса MeLLANGE. В приложении 2 - классификация ошибок Корпуса Текстов Петербургских Школьников. Например, ошибки связанные с пунктуацией, такие как установка знаков препинаний при вводных фразах, в конце предложения, в придаточных предложениях и т.д. Другой пример, ошибки связанные с употреблением предлогов, прилагательных и других частей речи. На рисунке 6 представлен фрагмент классификации ошибок этого корпуса.
Рисунок 6. Классификация ошибок Корпуса Текстов Петербургских Школьников
Изучив, таким образом, классификацию нескольких корпусов, мы пришли к выводу, что многие авторы корпусов делят ошибки на языковые и содержательные. В группе языковых ошибок можно выделить следующие классы: синтаксические, лексические, морфологические, грамматические, орфографические. В группе содержательных ошибок можно выделить такие классы как порядок слов, тавтология, опущение слова или, наоборот, прибавление ненужного слова и др.