- •§ 2. Рефлексия лингвистической теории в прикладной лингвистике
- •Предисловие
- •Глава 1 Объект и методы прикладной лингвистики § 1. Понимания термина «прикладная лингвистика»
- •§ 2. Круг задач прикладной лингвистики
- •§3. Методы прикладной лингвистики
- •Глава 2 Оптимизация когнитивной функции языка § 1. Компьютерная лингвистика
- •1.1. Компьютерная лингвистика как прикладная лингвистическая дисциплина
- •1.2. Когнитивный инструментарий компьютерной лингвистики
- •1.3. Некоторые направления компьютерной лингвистики
- •1.4. Гипертекстовые технологии представления текста
- •§ 2. Прикладные аспекты квантитативной лингвистики
- •2.1. Проблематика квантитативной лингвистики с теоретической и прикладной точек зрения
- •2.2. Основные области приложения структурно-вероятностной модели языка
- •2.3. Авторизация текста: пример экспертизы
- •§ 3. Психолингвистика как приложение лингвистики
- •Глава 3 Оптимизация эпистемической функции языка §1. Лексикография
- •1.1. Из истории словарного дела
- •1.2. Базовые параметры типологизации словарей
- •1.3. Основные структурные компоненты словаря
- •1.4. Основные структурные компоненты (зоны) словарной статьи
- •1.5. Компьютерная лексикография
- •§ 2. Терминоведение и терминография
- •2.1. Исходные понятия
- •2.2. Важнейшие направления деятельности в терминоведении и терминографии
- •2.3. Институциональный аспект терминоведения и терминографии
- •2.4. Лингвистическая терминология как особая терминосистема*
- •2.5. Миры лингвистической терминологии
- •Термины семиотики19'
- •Термины прагматики
- •Термины теории диалога, термины теории речевой коммуникации
- •Термины логического анализа естественного языка
- •Термины прикладной лингвистики
- •Термины теории речевых актов
- •Термины искусственного интеллекта
- •Термины когнитивной науки
- •2.6. Лингвистическая терминография
- •§ 3. Корпусная лингвистика
- •3.1. Языковой материал в лингвистическом исследовании
- •3.2. Исходные понятия корпусной лингвистики
- •3.3. Требования к корпусу текстов с точки зрения пользователя
- •3.4. Опыт разработки корпусов текстов
- •3.5. Заключение
- •Глава 4 Оптимизация функционирования языка как средства передачи информации § 1. Перевод как прикладная лингвистическая дисциплина*
- •1.1. Лингвистические и нелингвистические аспекты перевода
- •1.2. Виды перевода
- •1.3. «Естественный» перевод: лингвистические проблемы
- •1.4. Машинный перевод
- •§ 2. Теория и методика преподавания языка*
- •2.1. Грамматико-переводной метод в обучении иностранным языкам
- •2.2. Прямой метод обучения иностранному языку
- •2.3. Аудиолингвальный и аудиовизуальный методы обучения иностранным языкам
- •2.4. Коммуникативно-ориентированный подход в обучении иностранным языкам
- •§3. Оптимизация общения с эвм:системы обработки естественного языка
- •§4. Теория и практика информационно-поисковых систем
- •4.1. Основные понятия информационного поиска
- •4.2. Типы информационно-поисковых систем
- •4.3. Информационно-поисковые языки
- •Глава 5 Оптимизация социальной функции языка, функционирование языка как средства воздействия § 1. Лингвистика и функционирование государства
- •§ 2. Лингвистические аспекты теории воздействия: языковые механизмы вариативной интерпретации действительности*
- •2.1. Предмет теории воздействия и ее истоки
- •2.2. Языковое варьирование как важнейший источник имплицитного воздействия языка на сознание. Предпосылки языкового варьирования
- •2.3. Типология языковых механизмов воздействия на сознание
- •2.4. Лингвистические аспекты теории аргументации
- •2.5. Языковые механизмы вариативной интерпретации действительности в аргументации: пример анализа
- •§ 3. Механизмы вариативной интерпретации действительности в нейро-лингвистическом программировании
- •3.1. Нейро-лингвистическое программирование -эффективная практика как теория
- •3.2. Нлп как психотерапевтический метод
- •3.3. Постулаты нлп по отношению к языку: взгляд лингвиста
- •3.4. Роль языковых механизмов вариативной интерпретации действительности в нлп
- •§4. Политическая лингвистика
- •4.1. Предмет и задачи политической лингвистики
- •4.2. Методика контент-анализа
- •4.3. Примеры применения методики контент-анализа
- •4.4. Методика когнитивного картирования
- •Глава 6 Прикладная и теоретическая лингвистика: проблемы взаимовлияния § 1. Инструментарий прикладной лингвистики в лингвистической теории
- •1.1. Традиционные проблемы лексической семантики с точки зрения когнитивного подхода*
- •1.2. Эвристики лингвистической семантики
- •1.3. Заключение
- •§ 2. Рефлексия лингвистической теории в прикладной лингвистике
- •2.1. Базовые теоретические оппозиции в прикладной лингвистике
- •2.2. Филологические методы анализа текста как эвристики построения систем искусственного интеллекта*
- •Актуальные проблемы прикладной лингвистики
- •Список сокращений
- •Литература
- •Словарные издания
§ 3. Корпусная лингвистика
3.1. Языковой материал в лингвистическом исследовании
Любое лингвистическое исследование в той или иной мере опирается на анализ языкового материала, языковых данных. Чем больше материал, тем выше достоверность выводов, тем шире сфера дейсвия наблюденных закономерностей. В традиционном языкознании сбору материала всегда придавалось особое значение. Более того, во многих областях лингвистики сбор новых языковых фактов может считаться основной задачей лингвистического описания — ср. исследование неописанных и плохо описанных языков, выявление фонетических и морфологических различий в диалектах, изучение функционирования жаргонов, определение изменений в функционировании языка и множество других задач, которые невозможно даже перечислить.
Каковы традиционные способы сбора и хранения языковых данных? Если отвлечься от области фонетики (это совершенно особая тема, требующая специального обсуждения), то чаще всего речь идет ручной обработке письменных текстов, опросе информантов по разным методикам и последующем изучении полевых анкет, о записях текстов в письменной форме, словарных картотеках и пр21). Нет нужды говорить, что часто этап сбора материала в традиционной технологии исследования занимал многие годы. Конечно, при удачном стечении обстоятельств лексикографическая картотека становилась важнейшим источником для изучения языковых форм — такова судьба картотеки Академического слоЭаРя петербургского Института лингвистических исследований (ранее ленинградского отделения Института языкознания АН СССР). Однако это скорее исключение, чем правило. К сожалению, многие картотеки недоступны для лингвистов-исследователей, некоторые из них просто потеряны.
Имеются и другие проблемы. При традиционной технологии сбора и обработки языковых данных обновление собранного материала представляет собой отнюдь не тривиальную задачу. Текущая обработка картотеки, поиск нужных единиц и пр. — все эти абсолютно необходимые операции отнимают значительное время. Кроме того, традиционная технология делает практически невозможным доступ к языковым данным на расстоянии. Некоторые типы данных — корпусы текстов — существовали
21) Целый ряд методов полевого исследования языка обсуждается в [Кибрик 1972].
в весьма ограниченном по объему виде (например, в виде хрестоматий, сборников текстов).
Новые информационные технологии и технические средства (компьютерные системы, системы связи, системы мультимедиа) значительно облегчили сбор языковых данных. Так, поскольку компьютерные технологии широко используются в печатном деле и в средствах массовой информации, то существенно упростился процесс получения материала: большинство крупных газет имеют электронные версии, функционирующие в информационных сетях, в частности, в Интернете. Имеются довольно продуктивные устройства сканирования текста (сканеры) и эффективные программы расшифровки графической информации («картинки» текста) в собственно текстовый формат (текст как совокупность графем). Налицо колоссальный технологический рывок вперед. Многие издательства используют для составления словарей специально подготовленные корпусы текстов — ср., например, Бирмингемский корпус английского языка и соответствующую базу данных, созданные как источники для подготовки англоязычных словарей издательства «Коллинз» (см., например, [Collins COBUILD English language dictionary 1987]).
Этот технологический рывок создал, однако, другие — не менее серьезные — проблемы, существенно осложняющие использование языкового материала как для чисто научных, так и научно-практических целей (например, для составления словарей). Дело в том, что чрезмерный объем изучаемых данных может и затруднить описание исследуемого феномена. Такой эффект возникает в двух случаях: во-первых, когда информации слишком много22), и, во-вторых, когда выбранный языковой материал искажает реальную картину функционирования языка относительно описываемого феномена. При наложении первой и второй ситуации — и материал слишком велик и он не отражает реальный узус — результаты исследования практически не поддаются никакой разумной оценке. Заметим, что перечисленные проблемные ситуации не исключение, а рутинная практика современной лингвистики. В этом смысле остроумная метафора У. Фрэнсиса, сравнившего процесс формирования корпуса с попыткой вычерпывания ведром океана, не кажется значительным преувеличением [Фрэнсис 1983, с. 337].
Встает задача разработки общих принципов построения лингвистических корпусов данных с использованием современных компьютерных технологий. Рассмотрим здесь две важнейших темы корпусной лингвистики, связанные с конструированием корпусов текстов:
22)Например, изучение функционирования выражения по крайней мере в художественных произведениях Ф. М.Достоевского требует анализа более чем 500 употреблений этого грамматического фразеологизма. Между тем представление о реальной картине употребления появляется после просмотра первых 70-80 контекстов. Остальной материал не дает практически ничего нового. См. по этому поводу [Баранов 1996].
-
формулировка общих требований к корпусу данных с точки зрения пользователя;
-
обсуждение опыта создания корпусов данных для различных исследовательских проектов.
Ниже речь пойдет о корпусах текстов, однако многие обсуждаемые здесь проблемы вполне переносимы и на корпусы данных других типов.