Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Учебное пособие 800479

.pdf
Скачиваний:
6
Добавлен:
01.05.2022
Размер:
3.26 Mб
Скачать

Научный журнал «Современные лингвистические и методико-дидактические исследования»

Список анализируемых источников

[1*] Simon F. Horrid Henry’s Wicked Ways. London: Orion Children’s Books. – 2006. – 190 p.

Список использованных словарей

[1**] Onomastic terminology. URL: https://www.merriamwebster.com/dictionary/charactonym (время обращения – 17.07.19).

[2**] Подольская Н.В. Словарь русской ономастической терминологии / Н.В. Подольская. – Москва : Наука, 1978. – 200 с.

[3**] Словарь-справочник. Электронное издание. Сибирский федеральный университет / Под редакцией А.П. Сковородникова. Красноярск, 2014. – С.101. URL: http://lib3.sfu-kras.ru/ft/lib2/elib/b81/i-489924.pdf (время обращения – 17.07.19).

[4**] Чернец Л.В., Семенов В.Б., Скиба В.А. Школьный словарь литературных терминов и понятий / Л.В. Чернец, В.Б. Семенов, В.А Скиба. – Изд: Просвещение, 2013. – 558 с.

[5**] Ожегов С.И., Шведова Н.Ю. Толковый словарь русского языка / С.И. Ожегов, Н.Ю. Шведова. URL: https://classes.ru/all-russian/russian-dictionary-Ozhegov-term-12234.htm

(время обращения – 17.07.19).

[6**] Ефремова Т.Ф. Новый словарь русского языка. Толково-

словообразовательный / Т.Ф. Ефремова. URL: https://classes.ru/all-russian/russian-dictionary- Efremova-term-85978.htmв (время обращения – 18.07.19).

[7**] Брокгауз Ф.А., Ефрон И.А. Энциклопедический словарь / Ф.А. Брокгауз, И.И. Ефрон. – Санкт - Петербург, 1890-1907. URL: dic.academic.ru/dic.nsf/brokgauz_efron/83784/Прозвища.] (время обращения – 19.07.19).

[8**] Merriam-Webster. URL: https://www.merriam-webster.com/dictionary/nickname

(время обращения – 19.07.19).

[9**] Cambridge Dictionary. URL: https://dictionary.cambridge.org/dictionary/english/ (время обращения – 19.07.19).

References

[1]Razhina V.A. Onomastic realities: linguistic, cultural and pragmatic aspects: dis. kand. fil. nauk / V.A. Razhina. – Rostov-na-Donu, 2007. – 156 s.

[2]Matveev A. K. Onomastics and onomatology: a terminological inquiry / A. K.Matveev

//Voprosy onomastiki. 2005 g. № 2. – P. 5-11. URL: http://www.ruslang.ru/doc/onomastica/onomastica2text.pdf (vremya obrashcheniya – 07.07.19).

[3]Wilard L. Naming characters: charactonym / L. Wilard. URL: https://larawillard.com/2012/06/06/naming-characters/ (vremya obrashcheniya – 06.07.19).

[4]Balteiro, Isabel. Word-formation and the translation of Marvel comic book charactonyms. 2010. № 7. – Р. 31-53. URL: https://www.researchgate.net/publication/290652782_Word-formation_and_the_translation_of_ Marvel_comic_book_charactonyms (vremya obrashcheniya – 06.07.19).

[5]Kalashnikov A. Shakespearean Charactonyms in Translations into Russian. Journal of Language and Education / A. Kalashnikov // National Research University Higher School of Economics Journal of Language & Education Issue 2, 2016. №2. – Р. 14-22. URL: https://jle.hse.ru/article/view/1354 (vremya obrashcheniya – 06.07.19).

[6]Boër S. E. Attribtive names. Notre Dame J. Formal Logic Boër S. E. 19 (1978), № 1. – Р. 177-185. URL: https://projecteuclid.org/euclid.ndjfl/1093888224 (vremya obrashcheniya – 06.07.19).

[7]Oliviu Felecan Name and naming : synchronic and diachronic perspectives Newcastle-upon- Tyne : Cambridge Scholars Publishing, 2012. – 470 р. URL: (vremya obrashcheniya – 06.07.19).

[8]Strel'cova M.YU. Сharacterizing names in Russian language: dis. kand. fil. nauk / M.YU. Strel'cova. – Vladivostok, 2010. – 325 s.

137

Выпуск № 3(43), 2019

ISSN 2587-8085

[9]Kapkova S.YU. The translation of realities and nicknames (based on the cycle of stories «Horrid Henry»//Nauchnyj vestnik Voronezhskogo gosudarstvennogo arhitekturnostroitel'nogo universiteta. Seriya: Sovremennye lingvisticheskie i metodiko-didakticheskie issledovaniya. 2011. № 16. – Р. 174-182.

[10]Kapkova S.YU. Features of the individual author's style in the cycle of children's humorous stories by F. Simon // Nauka i obrazovanie v XXI veke, sbornik nauchnyh trudov po aterialam Mezhdunarodnoj nauchno-prakticheskoj konferencii: v 34 chastyah. – Tambov. – Izdvo : TROOO «Biznes.Nauka.Obshchestvo», 2013. – P. 70-72.

Analyzed sources

[1*] Simon F. Horrid Henry’s Wicked Ways. London: Orion Children’s Books, 2006. – 190 p.

Dictionaries used

[1**] Onomastic terminology. URL: https://www.merriamwebster.com/dictionary/charactonym (vremya obrashcheniya – 17.07.19).

[2**] Dictionary of Russian onomastic terminology / N.V. Podol'skaya. – Moscow : Nauka, 1978. – 200 s.

[3**] Dictionary-reference. Electronic edition. Siberian federal University / Pod redakciej A.P. Skovorodnikova. Krasnoyarsk, 2014. – Р. 101. URL: http://lib3.sfu- kras.ru/ft/lib2/elib/b81/i-489924.pdf (vremya obrashcheniya – 17.07.19).

[4**] Chernec L.V., Semenov V.B., Skiba V.A. School dictionary of literary terms and concepts / L.V. Chernec, V.B. Semenov, V.A Skiba. – Izd: Prosveshchenie, 2013. – 558 s.

[5**] Ozhegov S.I., Shvedova N.YU. Dictionary of the Russian language / S.I. Ozhegov, N.Yu. Shvedova. URL: https://classes.ru/all-russian/russian-dictionary-Ozhegov-term- 12234.htm (vremya obrashcheniya – 17.07.19).

[6**] Efremova T.F. New Russian dictionary. Explanatory and word-formation / T.F. Efremova. URL: https://classes.ru/all-russian/russian-dictionary-Efremova-term-85978.htmv (vremya obrashcheniya – 18.07.19).

[7**] Brokgauz F.A., Efron I.A. Jenciklopedicheskij slovar' / F.A. Brokgauz, I.I. Efron. – Sankt - Peterburg, 1890-1907. URL: dic.academic.ru/dic.nsf/brokgauz_efron/83784/Prozvishha.]. (vremja obrashhenija – 19.07.19).

[8**] Merriam-Webster. URL: https://www.merriam-webster.com/dictionary/nickname (vremja obrashhenija – 19.07.19).

[9**] Cambridge Dictionary. URL: https://dictionary.cambridge.org/dictionary/english/ (vremya obrashcheniya – 19.07.19).

138

Научный журнал «Современные лингвистические и методико-дидактические исследования»

STYLISTIC AND FUNCTIONAL FEATURES

OF CHARACTONYMS AND CHARACTERIZING NICKNAMES IN MODERN

CHILDREN'S ENGLISH HUMOROUS LITERATURE

(BASED ON THE STORY CYCLE "HORRID HENRY" BY F. SIMON)

S.Yu. Kapkova

_____________________________________________________________________________________________

Voronezh State Pedagogical University,

Candidate of Philology, Associate Professor of the Chair of English Language Svetlana Yu. Kapkova

e-mail: kapk@list.ru

_____________________________________________________________________________________________

Statement of the problem. The objectives of the study include the analysis of the meanings of the terms of characterizing nicknames and charactonyms as at the present stage of research in the field of onomastics there is a significant number of new terms that clarify the meaning of a proper name. Moreover, the task is to clarify the concept of characterizing nicknames and charactonyms because of their differences in home and foreign linguistics. The third task is the lexical and semantic analysis of characterizing nicknames in modern children's English humorous literature due to the fact that young readers sometimes find it difficult to understand whether a particular character is positive or negative one and the use of characterizing nicknames and charactonyms in the text helps to get the necessary information.

Results. The article gives an overview of the dictionary definitions of charactonyms and nicknames available in Russian and English dictionaries in order to clarify the meanings that have a different interpretation in foreign and Russian onomastics. More than that, the characteristic components of characterizing nicknames and meaningful content of the charactonyms of the onomastic space are decoded in the children's humorous stories of the English writer F. Simon and the use of charactonyms and characterizing nicknames from the standpoint of author's individual style and their functioning in children's humorous stories by F. Simon is analyzed.

Conclusion. The study clarified the concept of a charactonym and identified five functional and stylistic features of charactonyms and characterizing nicknames in the analyzed English humorous texts for children. Characterizing, aesthetic, developing, educational and stylistic functions were defined.

Key words: modern children's English literature, onomastics, characterizing nicknames, charactonyms, comic, humor.

139

Выпуск № 3(43), 2019

ISSN 2587-8085

ТЕОРИЯ И ПРАКТИКА ПЕРЕВОДА

THEORY AND PRACTICE OF TRANSLATION

DOI 10.25987/VSTU.2019.42.50.011

УДК 81-13

ТЕХНОЛОГИЯ ПАРАЛЛЕЛЬНЫХ КОРПУСОВ ТЕКСТОВ И ЕЕ ИСПОЛЬЗОВАНИЕ В ПРОЦЕССЕ ОБУЧЕНИЯ ПЕРЕВОДУ

А.А. Авдеев

_____________________________________________________________________________

Воронежский государственный технический университет кандидат филологических наук, доцент, доцент кафедры иностранных языков и технологии перевода Александр Александрович Авдеев

e-mail: alexander77777@mail.ru

_____________________________________________________________________________

Постановка задачи. Задача настоящей статьи состоит в определении сущности, целей и особенностей использования технологии построения корпусов текстов как средства оптимизации автоматизированного переводческого процесса. Раскрываются особенности структурной организации, свойства и механизмы функционирования текстовых корпусов, описываются основные инструменты корпусной лингвистики, цели их создания, их роль в изучении аспектов перевода, а также характер и типы использования корпусной методики в обучении переводу.

Результаты. Выявлена значимость технологии параллельных текстовых корпусов как средства обучения переводческой деятельности и компонента систем машинного перевода. Рассмотрены принципы структурной и лингвистической организации коллекций текстов, определены этапы технологии создания текстовых корпусов, раскрыта их роль в методико-дидактическом обеспечении процесса обучения переводу. Выводы. Корпус параллельных текстов представляет собой эффективный инструмент в работе преподавателей перевода и переводчиков-практиков, обеспечивая аутентичный и корректный перевод текстов общего и специализированного дискурса с одного языка на другой. Создание текстового корпуса можно представить как алгоритм, включающий как этапы лингвистического анализа, так и этапы, связанные с технической поддержкой данного процесса и его автоматизацией. Разнообразие представленных текстовых материалов, удобство их структурной и визуальной презентации делают текстовый корпус важным средством реализации инновационных подходов к преподаванию перевода и практической переводческой деятельности. Задания, разрабатываемые на основе корпусной технологии, способствуют выработке у обучаемых навыков семантического анализа и профессионально-ориентированного перевода, а также использования терминологических словарей и тезаурусов.

Ключевые слова: корпусная лингвистика, корпус текстов, параллельные текстовые корпусы, аспекты перевода, технология, инструменты, межкультурные связи, разметка, выравнивание текста, конкорданс.

Введение.

Известно, что в процессе перевода с одного языка на другой специалисты часто сталкиваются с проблемой нехватки вспомогательных средств, способных упростить задачу поиска эквивалентных единиц, а также сходств и различий между двумя языковыми системами. Большое число возникающих переводческих задач может быть решено благодаря привлечению методов корпусной лингвистики. Данная методика не только позволяет осуществлять обучение переводу на основе полученных данных, но и обеспечивает возможность поиска текстов в параллельных корпусах большого объема с использованием методов обработки естественного языка.

Понятие «корпус текстов», являющееся базовым для корпусной лингвистики, занимает все более важное место в научном дискурсе специалистов в области языкознания и компьютерного перевода. Большинство известных лингвистов рассматривает корпус как подобранную и обработанную по определенным правилам совокупность текстов, используемых в качестве основы для изучения языка. Назначением

__________________

© Авдеев А.А., 2019

140

Научный журнал «Современные лингвистические и методико-дидактические исследования»

корпуса также являются статистический анализ языковых единиц и явлений, а также подтверждение правил данного языка. Среди главных характеристик текстового корпуса можно выделить следующие: электронный, репрезентативный (способный качественно представлять моделируемый объект), размеченный (отличающийся от обычной коллекции текстов), прагматически-ориентированный (созданный под определенную функционально-прагматическую задачу) [1, c. 223].

Появление параллельных текстовых корпусов изменило способ, которым пользуются специалисты в области языкознания и перевода. Лексикологи, имеющие неограниченный доступ к текстовому корпусу или иной совокупности текстов, подлежащих автоматической обработке, способны в кратчайший период времени осуществить выборку, анализ и статистический подсчет примеров употребления слова или словосочетания, используя материалы базы данных, содержащей миллионы текстовых единиц разной величины. В свою очередь, переводчики, использующие указанную технологию, способны легко выбрать наиболее частотный вариант перевода исходной языковой единицы, как правило, оказывающийся верным. Большое количество изученных примеров позволяет делать полученные описания более полными и точными. Тот факт, что данные текстового корпуса включают в себя большой объем метаинформации (автор текста, его стиль и жанр, дата написания, региональные, социальные и культурные различия и т.д.), позволяет легко установить связи употребления отдельных единиц или словосочетаний, характерных для определенного стиля, регионального отличия и т.д.

Ряд исследователей отмечают особую актуальность использования текстовых корпусов в процессе двустороннего письменного перевода. Так, в фокусе исследования Л.Н. Беляевой находятся прикладные аспекты корпусной лингвистики, а одним из таких аспектов, по ее мнению, может стать создание автоматизированных лексикографических систем, необходимых для работы письменных переводчиков [2, c. 86; 3]. В.Н. Шевчук отмечает, что применение технологии текстового корпуса дает возможность повысить качество письменного перевода и дать полное представление обо всех разновидностях норм (лексических, грамматических, синтаксических, стилистических, орфографических и пунктуационных), действующих в современном языке [3]. Кроме того, не подлежит сомнению роль текстовых корпусов в решении многочисленных лингвистических и экстралингвистических проблем, возникающих в процессе перевода.

Объект и предмет исследования. Объектом исследования настоящей статьи являются корпусы параллельных текстов русского и английского языков, представленные на порталах www.linguee.ru и www.context.reverso.net. Предметом исследования являются основные структурные и языковые особенности текстовых корпусов, механизмы их функционирования и использования для разнообразных задач в сфере теории языка и перевода, основные инструменты корпусной лингвистики, способствующие изучению аспектов перевода.

Целью исследования является рассмотрение принципов структурного построения и лингвистической организации текстовых корпусов, описание алгоритма их создания, исследование особенностей их использования как средства методико-дидактического обеспечения аудиторной и самостоятельной работы студентов в области перевода. Практической задачей исследования является анализ основных форм обучения переводу на основе параллельных текстовых корпусов с примерами использования языкового материала, представленного на порталах систем контекстуального поиска www.linguee.ru

и www.context.reverso.net.

Материалом исследования являются русские и английские текстовые фрагменты, представленные в соответствующих корпусах на электронных порталах www.linguee.ru и www.context.reverso.net.

Методы исследования. В работе используютcя сопоставительный и контрастивный методы, а также метод контекстуального анализа языковых единиц.

141

Выпуск № 3(43), 2019

ISSN 2587-8085

Результаты исследования.

Исследование теоретических работ в области корпусной лингвистики и сравнительный анализ текстового материала (базы данных порталов www.linguee.ru и www.context.reverso.net) позволили выявить принципы структурной и лингвистической организации коллекций текстов, положенных в основу параллельных корпусов на русском

ианглийском языках. Представлена типология текстовых корпусов, описаны основные разновидности метаразметки текстовой информации, рассмотрены основные инструменты

имеханизмы, позволяющие текстовым корпусам реализовать свой методический и дидактический потенциал. Исследуемый практический материал позволил выявить характер и основные типы использования корпусной методики в обучении профессионально-ориентированному переводу.

Использование текстовых корпусов и сопутствующих им программ ставит своей задачей достижение следующих целей:

-поиск и отбор лексических и грамматических языковых единиц разных уровней - слов, словоформ, грамматических категорий и словосочетаний. Данная процедура осуществляется при помощи особой функции, называемой морфологическим дескриптором. Эта функция применяется для полного анализа исследуемой языковой единицы на основе ее грамматических категорий и свойств;

-поиск искомой словоформы в контекстах, определенных заданными параметрами и выделяемых по тем или иным критериям. Данная функция ставит своей задачей, вопервых, сбор фактического материала, a во-вторых, составление теоретической базы исследования (словарей, грамматических справочников, учебников, методикодидактических пособий и практикумов);

-анализ конкорданса (совместного употребления языковой единицы с другими в контекстах фиксированной длины);

-получение лингвостатистических данных, ставящее целью выявить частоту употребления определенных форм, слов или словосочетаний. Решение данной задачи включает в себя определение семантических различий в структуре синонимов, определение контекстов, а также окказиональных вариантов употребления и перевода, характерных для синонимичных языковых единиц; выявление, разграничение и анализ жанровых и стилистических особенностей, а также оттенков значений слов;

-этимологический анализ и описание характера семантических преобразований языковой единицы [4].

Рассмотрим подробнее вопрос о свойствах и структуре текстового корпуса, а также о механизмах функционирования параллельных текстовых корпусов в процессе перевода с использованием автоматизированных средств.

Среди основных свойств корпуса текстов, на наш взгляд, следует выделить репрезентативность и открытость. В.П. Захаров определяет репрезентативность как достаточное и пропорциональное представление в корпусе текстов различных периодов, жанров, стилей, авторов и т.п. [5]. Функционал корпусного исследования предоставляет возможность обработки огромного массива языкового материала (как устного, так и письменного), что обеспечивает необходимую типичность данных и полноту представления всего спектра языковых явлений. Содержание корпуса составляют многочисленные естественные письменные и устные тексты всех типов, существующие в конкретный исторический период в определенной социокультурной среде. Более того, разнообразные данные представлены в текстовом массиве в своей естественной контекстной форме и типичном языковом окружении, что создает возможность их всестороннего и объективного изучения.

В свою очередь, открытость корпуса текстов предполагает неограниченную возможность его пополнения новыми фактами, вследствие чего исследователи и переводчики, основываясь на анализе употребления того или иного слова в корпусе, имеют возможность получить представление о самых последних тенденциях в языке.

142

Научный журнал «Современные лингвистические и методико-дидактические исследования»

По своей структуре корпусы текстов подразделяются на одноязычные, двуязычные и многоязычные. В состав многоязычного корпуса входят несколько одноязычных корпусов, аналогичных по структуре. К числу параллельных корпусов относятся и другие типы текстовых массивов, в частности, диахронические корпусы (включающие в себя тексты на языке в более ранней форме его развития и их переводы на современный язык), а также транскрипционные корпусы, в состав которых входят тексты на литературном языке, прочитанные носителями разных его диалектов и территориальных разновидностей [6].

Значимость параллельных корпусов обусловлена тем фактом, что они дают возможность представить и объективно установить методы, с помощью которых переводчики на практике занимаются разрешением переводческих трудностей. Кроме того, разнообразные текстовые массивы представляют собой важный инструмент для разработки объективных моделей перевода, предназначенных для начинающих специалистов.

Еще одна важнейшая сфера применения корпусной технологии – исследование переводческой нормы в определенных социокультурных и исторических контекстах, а также характера соответствия текстов нормативным требованиям, либо отклонения от них. В области прикладной лингвистики, массивы параллельных текстов обеспечивают данные, необходимые для апробации и тестирования автоматических переводческих систем, формирования, наполнения и функционирования систем памяти перевода, разработки системы автоматического поиска переводных эквивалентов. Другие задачи, успешно решаемые с помощью параллельных текстовых корпусов, включают контрастивный, статистический и частотный анализ языкового материала, определение степени неточностей и информационных потерь в процессе переводческой деятельности, разработку и внедрение разнообразных переводческих стратегий и выбор адекватных им технических приемов перевода.

Следует отметить, что при составлении параллельных корпусов текстов необходимо учитывать фактор межкультурных связей. Если они чрезвычайно слабы или отсутствуют, задача построения полноценного параллельного текстового корпуса становится невозможной. Тексты на исходном языке, несмотря на свою первичность, отбираются с учетом наличия эквивалентов на языке перевода. В число используемых материалов могут входить разнообразные источники: тексты специальной тематики, газетноинформационные тексты, научные и технические тексты, художественные тексты. Совокупность данных источников наделяет параллельный корпус уже отмеченным нами свойством репрезентативности.

Структурная организация корпуса текста может быть самой разнообразной, что определяется прагматическими задачами его составителя или пользователя. Наиболее распространенными вариантами являются:

1)традиционный текст со ссылкой на перевод;

2)табличная «зеркальная» форма, обеспечивающая удобство восприятия, сравнения и анализа;

3)база данных (структура, являющаяся неотъемлемой частью систем автоматической обработки.

Одним из важнейших условий создания полноценного текстового корпуса является

выравнивание текстов. Выравнивание представляет собой идентификацию соответствующих друг другу фрагментов в обеих половинах корпусов. Необходимость данной операции обусловлена двумя факторами. Во-первых, наличие различий в семантической структуре и сочетаемости слов, в грамматических и синтаксических структурах двух языков, а также наличие идиоматических и стилистических различий между текстом оригинала и переводом исключает существование линейного соответствия на уровне языковых единиц. Во-вторых, наиболее буквальный вариант перевода не всегда является предпочтительным на практике, вследствие чего переводчик использует разнообразные технические приемы, в частности, разбиение исходных синтаксических

143

Выпуск № 3(43), 2019

ISSN 2587-8085

структур. Таким образом, выравнивание параллельных текстов является основой любой работы, связанной с их статистическим анализом. Выравнивание параллельного корпуса на уровне предложений – это важное условие для проведения прикладных лингвистических исследований. В процессе перевода предложения текста могут подвергаться разнообразным трансформациям (разбиение, объединение, вставка предложений, изменение последовательности слов). В связи с этим выравнивание часто оказывается сложной задачей.

Наличие массива текстов не является достаточным и единственным условием для решения разнообразных задач в области лингвистики текста и перевода. Всеобъемлющий анализ текстового материала в обязательном порядке требует наличия в текстах дополнительной лингвистической и экстралингвистической информации. Это привело к необходимости правильного структурирования корпуса текстов, что нашло свое выражение в идее размеченного корпуса. Идея разметки (aнгл. tagging) состоит в том, что текстовые единицы и их компоненты получают специальные метки, благодаря чему специалист имеет возможность получить полное представление о свойствах данного текста и требуемые предварительные знания. Лингвистические метки, как правило, содержат сведения о языковых характеристиках самого текста – лексических, грамматических и прочих, структурные – об особенностях его структурной организации и уровнях текстового материала (глава, рубрика, абзац, предложение, словосочетание, словоформа), а экстралингвистические – сведения об авторе и общие данные об исследуемом тексте (автор, заглавие, дата издания, жанр, тематика, стилистическая принадлежность, прагматическая функция и многое другое). Общие цели исследования, потребности специалистов в конкретном случае языкового или переводческого анализа, а также возможность внесения в текст каких-либо дополнительных признаков являются важнейшими факторами, определяющими обращение специалистов (переводчиков) к тем или иным корпусным данным.

Анализ работ в области структурной организации текстового корпуса (A.М. Амиева, И.М. Богуславский) позволяет заключить, что лингвистическая разметка включает в себя следующие разновидности [7; 8]:

-морфологическая или частеречная разметка (part-of-speech tagging). Данный тип разметки служит для указания признаков частей речи, а также свойственных им грамматических категорий. Большинство крупных корпусов являются морфологически размеченными по своей структуре, что создает предпосылки для всеобъемлющего морфологического и семантико-синтаксического анализа, а достижения в области компьютерной морфологии позволяют осуществлять автоматическую разметку корпусов больших размеров;

-синтаксическая разметка как результат синтаксического анализа, или парсинга (англ. parsing – синтаксический анализ) на основе данных морфологического анализа. Данный вид разметки служит для описания синтаксических связей между лексическими единицами, то есть, поверхностной синтаксической структуры предложения, и различных синтаксических конструкций (например, придаточное предложение, глагольное словосочетание и т.п.). Полученная информация помогает полнее представить совокупность логических ролей в ситуации, описываемой конкретным предложением, то есть понять глубинную структуру данного предложения;

-семантическая разметка, служащая для обозначения семантических категорий, к которым относятся конкретные языковые единицы, а также их более специфических разновидностей.

-анафорическая разметка, являющаяся маркером референтных (например, местоименных) связей в данном предложении;

-просодическая разметка, содержащая маркеры ударения и интонации. Данному типу разметки часто сопутствует так называемая дискурсная разметка, которая служит для обозначения пауз, повторов и т.д.

144

Научный журнал «Современные лингвистические и методико-дидактические исследования»

Создание текстового корпуса – это сложный технологический процесс, включающий как собственно лингвистические процедуры, так и комплекс действий, связанных с автоматизацией данного процесса. Его можно представить в виде следующих шагов или этапов:

-Поиск и выбор информационных ресурсов. На современном этапе, данные задачи решаются с помощью универсальных поисковых систем и каталогов (например, Google), а также национальных поисковых систем. Использование механизмов расширенного поиска (advanced search) позволяет осуществлять поиск необходимых текстов на сайтах на определенном языке или имеющих определенную территориальную принадлежность.

-Оцифровка текстов (преобразование в компьютерную форму). Необходимо отметить, что в настоящее время данная проблема решается относительно легко, по крайней мере, применительно к современным текстам и в современной орфографии. Простота решения этой проблемы базируется на совершенствовании возможностей оптического ввода (сканирования) и распознавания текстовой информации, а также на растущей компьютеризации современной жизни, в том числе и в областях, связанных с поиском и обработкой текстовых данных. Основные методы получения текстов в электронном виде для создания корпусов - ручной ввод, сканирование, использование авторских копий и ряд других методов.

-Предварительная обработка текста. На данном этапе текстовый материал, предназначенный для формирования корпуса и полученный из разных источников, подвергается предварительному редактированию и корректировке, а также снабжается необходимым библиографическим и экстралингвистическим описанием.

-Конвертирование, перекодировка, форматирование и графематический анализ. На данной стадии тексты подлежат комплексной машинной обработке, включающей один или несколько этапов, в ходе которых, по мере необходимости, осуществляются перекодировка, обработка нетекстовых элементов (рисунков, чертежей, таблиц), часто связанная с их удалением либо трансформацией, удаление из текста переносов и прочие операции. Как правило, данные операции выполняются в автоматическом режиме. Кроме того, данный этап включает в себя и фрагментацию текста, то есть выделение его структурных составляющих для последующего анализа.

-Разметка текста. Данный этап связан с составлением метаописания для текстовых единиц, то есть, с приписыванием дополнительной информации (метаданных) текстам и их составным элементам (структурным и лексическим). Данная операция значительно упрощает автоматический анализ текстового корпуса. О содержательных элементах метаописания уже было сказано выше, а формальные элементы включают указание технических параметров оформления текстовой единицы (имя файла, параметры кодирования, версия языка разметки, исполнители конкретных этапов работ). Данная информация обычно вводится вручную, а структурная и лингвистическая разметка выполняются в автоматическом режиме.

-На следующем этапе результаты автоматической разметки подвергаются корректировке, связанной с исправлением ошибок и снятием неоднозначности, вызванной различными лингвистическими и экстралингвистическими факторами.

-Заключительный этап включает в себя оформление размеченных текстов в виде информационно-поисковой структуры, называемой корпус-менеджером (corpus manager).

145

Выпуск № 3(43), 2019

ISSN 2587-8085

Данная система дает возможность осуществлять быстрый поиск текстов по множеству критериев и обеспечивает их статистическую обработку.

- Обеспечение доступа к корпусу. Свободный доступ к текстовым массивам большого объема возможен как в дисплейном классе, так и посредством распространения на цифровых носителях, CD-ROM, а также в режиме глобальной сети. Различные категории пользователей могут наделяться разными правами и разными возможностями.

Переходя к вопросу о механизмах функционирования текстовых корпусов и инструментах корпусной лингвистики, следует отметить, что поиск в корпусе по запросу пользователя осуществляется с помощью особых программ - корпусных менеджеров. С их помощью сортируются результаты поиска, производится статистический подсчет частотных вариантов, выполняется составление конкордансов. Большинство современных корпусных менеджеров позволяют осуществлять все типы поиска разнообразных текстовых единиц: поиск конкретных словоформ; поиск словоформ по лемме (поиск всех форм одной и той же лексемы, встретившихся в тексте); поиск неразрывных и разрывных словосочетаний.

При наличии соответствующей разметки, основным критерием поиска является набор необходимых морфологических признаков (например, поиск всех русских словосочетаний модели «предлог к + существительное в дательном падеже», английских устойчивых фразовых словосочетаний с глаголом take и т.п.) и другой информации, коррелирующей с представленными в корпусе уровнями лингвистической разметки. Наличие метаразметки дает пользователю возможность формировать собственный подкорпус текстов, отобранных по разным признакам. Каждый из примеров снабжается информацией об источнике заимствования. В ряде корпусов также существует возможность получить полную статистическую информацию о запрашиваемом языковом выражении: его процентное представление в общем массиве данного корпуса, распределение по жанровой отнесенности или временным периодам, информацию о частоте его сочетаемости.

Перейдем к описанию инструментов корпусной лингвистики, реализующих ее практический потенциал.

Одним из важных корпусных элементов анализа является генерирование строк конкорданса. Конкорданс определяется как совместное употребление слов в контексте фиксированной длины, a функция конкорданса позволяет проанализировать совместное употребление искомых словоформ. Возможности конкорданса, в сравнении с текстовым редактором, представляются более обширными. C его помощью можно произвести анализ не единичного текста, а группы текстов; выявить частотность употребления языковых единиц и получить представление о характере их сочетаемости; осуществлять запрос искомых единиц c помощью более сложных форм, по сравнению с предлагаемыми текстовым редактором; предоставлять возможность обращения к конкретному тексту, в котором был найден пример; предлагать различные варианты представления информации (в виде законченных предложений или с пропуском искомой лексической единицы) [9, с. 85-89].

Лингвистический корпус также используется для поиска коллокаций, которые определяются как статистически устойчивые словосочетания [10, с. 57]. Инструмент поиска коллокаций позволяет фиксировать характер употребления слова в контексте (например, в составе терминологической группы), определить левое и/или правое окружение лексической единицы и, таким образом, получить информацию о лексикограмматической сочетаемости слова. При этом подобные статистически устойчивые сочетания могут быть как фразеологизированными, так и свободными. Главной особенностью коллокации является тот факт, что один из ее компонентов сохраняет лексическое значение, а словосочетание в целом сохраняет свою устойчивость. Кроме того, коллокации характеризуются отсутствием либо ослаблением образного и эмоционально-оценочного значения.

146