Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
доклад по курсовой.doc
Скачиваний:
2
Добавлен:
23.11.2018
Размер:
86.02 Кб
Скачать

Целью данной курсовой работы является выделение инструментальных средств для создания учебного корпуса ошибок по русскому языку.

Поставленная цель предполагает решение следующих задач:

  • найти и провести анализ отечественных и зарубежных учебных корпусов;

  • исследовать классификации ошибок, на основе которых размечаются тексты для учебных корпусов;

  • показать на конкретных примерах строение учебных корпусов;

  • изучить программные средства, использующиеся для создания учебного корпуса;

  • подготовить рекомендации по разработке учебного корпуса ошибок русского языка.

В связи с появлением крупных лингвистических корпусов, можно выделить основные этапы развития корпусной лингвистики:

  • 1960-е: Брауновский корпус (США), 1 млн. слов;

  • 1970-е: LOB корпус, 1 млн. слов;

  • 1980-е: Машинный Фонд русского языка

  • Уппсальский корпус русского языка, 1 млн. слов;

  • 1990-е: Британский национальный корпус, 100 млн. слов, национальные корпусы (венгерский, итальянский, хорватский, чешский, японский) объёмом 100 млн. слов;

  • Банк английского языка, 600 млн. слов;

  • 2000-е: Corpus of Contemporary American English, 400 млн. слов;

  • Национальный корпус русского языка, 140 млн. слов;

  • Gigaword corpora: английский, арабский, китайский, 2 млрд. слов;

  • Oxford English Corpus, 2 млрд. слов.

1.2 Учебные корпуса: определение и назначение

В связи с развитием технических средств появилась возможность более эффективных лингвистических исследования разного рода на базе корпусной лингвистики. Одним из таких перспективных приложений является разработка учебных корпусов текстов (Learner Corpora), ориентированных на лингводидактический формат и применимых для анализа языка и речи тех, кто изучает иностранный язык.

Под учебным корпусом (Learner Сorpus) понимается электронный корпус текстов группы лиц, изучающих иностранных язык. Основной целью организации учебных корпусов является их анализ на предмет выявления способов и эффективности освоения изучаемого языка (Language Acquisition).

Такого рода корпусы, например, могут быть использованы для лингвистического анализа на предмет выявления лексических или синтаксических ошибок при освоении иностранного языка. Такой подход помогает установить частотность тех или иных типов языковых ошибок, характерные контексты, что необходимо для выработки планов и методических приемов для дальнейшей коррекции в обучении языку.

На сегодняшний день учебные корпусы наиболее распространены в Азии и Европе. Значительных успехов в этой области достигло изучение английского языка. Международный Учебный Корпус Английского языка (The International Corpus of Learner English) является первым и самым известным учебным корпусом.

Не менее известным учебным корпусом английского языка является Кембриджский Учебный корпус (The Cambridge Learner Corpus). Как часть Кембриджского Международного Корпуса, Кембриджский Учебный Корпус это огромная коллекция примеров английского языка, который пополняют изучающие всего мира.

Первым учебным корпусом устной речи стал корпус LINDSEI. Он является разговорной копией ICLE.

Изучив интернет ресурсы, нами была составлена таблица существующих на сегодняшний день учебных корпусов (см. приложение 3). В данную таблицу вошли учебные корпуса следующих языков: английского, немецкого, французского, испанского и итальянского, также были включены многоязычные корпуса. Таблица содержит следующие данные: имя корпуса (ссылка на корпус или сайт с описанием данного корпуса), изучаемый язык, родной язык, типы текстов и жанры, уровень владения языком, количество слов в корпусе, информация об авторах и доступе корпуса (если свободный доступ, то ссылка на корпус). Всего таблица содержит 80 корпусов. На рисунке 1 представлен фрагмент таблицы.

На основе данной таблицы была составлена сводная таблица для сравнения количества двуязычных учебных корпусов (см. приложение 2). В данную таблицу вошли следующие поля: изучаемый язык, родной язык и название корпуса.

Распределение по количеству корпусов для каждого изучаемого языка представлено в виде диаграммы.

Из диаграммы видно что, больше половины учебных корпусов создается для изучения английского языка, т.к. он является международным языком. Все остальные языки изучаются значительно меньше по сравнению с английским в силу не такой большой распространенности. Что же касается русского языка, то нами не найдено ни одного учебного корпуса.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]