- •I. Общие проблемы изучения языка сми
- •II. Особенности языка конкретных сми
- •III. Практическое освоение сми
- •§ 1. Предмет и задачи герменевтики. Исторические типы герменевтики
- •§ 2. Герменевтические принципы и категории исследования текста
- •§ 3. Возможность применения герменевтики к языку сми
- •§ 4. Язык сми и новые проблемы герменевтики
- •1. Теория речевых актов как основополагающая теоретическая концепция лингвистической прагматики
- •2. Лингвистическая модель текстообразования
- •3. Эксплицитная и имплицитная информация в сообщении; различия в способах их воздействия на сознание
- •1. Теория речевых актов как основополагающая теоретическая концепция лингвистической прагматики
- •2. Лингвистическая модель текстообразования
- •3. Эксплицитная и имплицитная информация в сообщении; различия в способах их воздействия на сознание
- •1. Дискурс
- •2. Политический дискурс
- •3. Интерпретация дискурса
- •4. «Имплицированная» адресация
- •5. Параметры политического дискурса в интерпретации
- •5.1. Оценочность и агрессивность политического дискурса
- •5.2. Эффективность политического дискурса
- •5.3. Отстаивание точки зрения в политическом дискурсе
- •2. Политические метафоры как показатели кризиса 17 августа 1998 г.
- •3. Результаты эксперимента
- •4. Заключение
- •1. Понятие локальной культуры
- •2. Механизмы общения между культурами
- •3. Нарушение пропорции и механизмов общения как условие господства массовой культуры
- •4. Проявления поп-культуры в обществе и философии
- •2. Общая характеристика корпуса газетных текстов современного русского языка
- •3. Система маркировки газетных текстов маркерами конкретных жанров и жанровых типов
- •4. Автоматизированный анализ лексических, морфологических и морфемных характеристик газетных текстов различных жанров
- •5. Частотно-распределительный
- •7. Новые слова
- •2. Типологические и структурные особенности рекламных текстов
- •3. Особенности и закономерности использования лингвистических приемов в рекламных текстах
- •3.1. Функционально-экспрессивные особенности рекламных текстов
- •3.2. Синтактико-стилистические особенности экспрессивности рекламных текстов
- •3.3. Роль парентетических внесений в рекламных текстах
- •3.4. Рекламный текст в социолингвистическом освещении
- •3.5. Использование и понимание аббревиатур в рекламных текстах
- •3.6. Культура речи в рекламе
- •4. Культура речи в рекламном бизнесе. Вопросы рекламной терминологии
- •I. Модель структуры опосредованной коммуникации
- •II. Категориальная структура восприятия рекламных текстов
- •2.1. Интерпретация и анализ результатов факторного анализа психологических критериев
- •2.2. Интерпретация и анализ результатов факторного анализа филологических критериев
- •2.3. Факторный анализ полной матрицы. Взаимодействие филологических и психологических критериев
- •III. Этнокультурный фактор восприятия рекламных сообщений
- •1. Пространственный характер интернет-коммуникации
- •2. Письменность и устность в интернет-коммуникации
- •3. Категория времени в интернет-коммуникации
- •4. Персонификация и деперсонификация интернет-общения
- •5. Интернет как средство научной коммуникации
- •1.1. Необходимые навыки
- •1.2. Необходимые знания и интуитивные ощущения
- •2. «Задача копирайтера»
- •2.1. «Вампиры» и «вурдалаки»
- •4. Общая информация
- •5. Цель проекта
- •6. Целевая группа
- •7. Главные достоинства продукта
- •8. Потребительские предрассудки
- •9. Конкуренты
- •10. Суть сообщения
2. Общая характеристика корпуса газетных текстов современного русского языка
В настоящей работе представлены результаты работы по созданию, категоризации и анализу «Компьютерного корпуса газетных текстов русского языка конца XX века», подготовленного в течение 2000–2002 гг. в Лаборатории общей и компьютерной лексикологии и лексикографии филологического факультета МГУ по грантам РФФИ 00-07-90007 и 01-07-90386. В ходе выполнения данного проекта реализована серия основных задач построения и анализа базы данных газетного материала в интересах получения объективной картины состояния современного русского газетного языка (а отчасти и картины состояния всего языка в целом, если иметь в виду то, что в наборе газетных жанров присутствуют многие жанры остальных родов словесности). Для этого был осуществлен подбор обширного газетного материала для корпуса (тексты общим объемом более 11 млн. словоупотреблений) на основе принципов включения в него полных номеров 13 российских газет на русском языке за 1994–1997 гг., представленности в нем ежедневных и неежедневных («МН», «Новая газета», «АиФ»), «левых» («Завтра», «Правда», «Правда-5») и «правых», центральных и местных, общих и профессионально ориентированных («Литературная газета») газет. Эти принципы позволяют получить относительно объективную и надежную картину соотношения в газетном материале текстов различного типа, их единиц и отношений между ними. В том числе это обеспечивает возможность анализа в дальнейшем не только общих для всего газетного языка характеристик, но и жанровой специфики представленности в нем лексико-фразеологической, грамматической и иной информации.
Корпус управляется СУБД, построенной на основе системы «Диктум-1» (разработанной в Лаборатории общей и компьютерной лексикологии и лексикографии МГУ). С помощью этой системы тексты и единицы корпуса автоматически и полуавтоматически маркируются различного рода маркерами: тексты (и, соответственно, каждое их словоупотребление) – маркерами газеты-источника, объема текста, его жанра, даты публикации и т.п.; словоупотребления – маркерами грамматических, лексических, морфемных и иных категорий.
Разработка и реализация на материале корпуса принципов жанровой классификации газетных текстов (включая типизацию жанров, а также определение характеристических признаков различных типовых жанров) позволила выявить профиль распределения объемов текстов разного жанрового и источникового состава и особенностей употребления в них единиц.
Проведенная автоматическая лемматизация и морфологическая квалификация словоупотреблений Ядерного корпуса (с последующими контролирующими процедурами), а также морфемная сегментация словоформ и лексем позволила автоматически получить для него алфавитно-частотные и частотно-распределительные словари словоформ, лемм, корней и морфемных моделей.
В таком объеме и с такой подробной разработкой различных характеристик корпуса текстов на русском материале еще не строились. Каждый текст Большого газетного корпуса характеризовался (а) датой публикации источника (газеты), (б) названием источника, (в) рубрикой (если есть), (г) автором (если указан), (д) жанром текста и его (е) жанровым типом (на основе классификации, разработанной в Лаборатории общей и компьютерной лексикологии и лексикографии, – см. ниже), (ж) объемом текста.
Каждое словоупотребление во всем корпусе характеризовалось (а) той формой словоизменения, которая ему свойственна, (б) леммой (исходная форма лексемы), (в) некоторыми лексико-грамматическими, лексико-семантическими, морфемными и иными характеристиками.
В составе Большого газетного корпуса находится часть, которая исторически раньше всего была сформирована и была более подробно охарактеризована со стороны квалификации лексем и словоформ, реализуемых в ее текстах. Эту часть мы называем Ядерный газетный корпус. Объем Ядерного корпуса – ок. 1 млн. 350 тыс. словоупотреблений.
При подготовке демонстрационного варианта корпуса для Интернета был выделен из Ядерного корпуса его фрагмент – так называемый «Микрокорпус русских газет» (около 200 тыс. словоупотреблений). Его единицы охарактеризованы наиболее подробно, но этот материал в рамках учебного пособия не рассматривается.
Общая картина источникового устройства Большого корпуса выглядит следующим образом. Всего в корпусе 23110 текстов по полным номерам 13-ти разных российских газет на русском языке.
Ниже приводится Таблица 1 по объемным характеристикам разных привлеченных газет.
Таблица 1
Соотношение источников по их объемам в Большом газетном корпусе русского языка
Название газеты |
Объем в числе словоупотреблений |
ЗАВТРА |
1215968 |
ИЗВЕСТИЯ |
1373682 |
ЛИТЕРАТУРНАЯ ГАЗЕТА |
1449307 |
МК |
1170229 |
МОСКОВСКИЕ НОВОСТИ |
1403472 |
НЕЗАВИСИМАЯ ГАЗЕТА |
905733 |
НОВАЯ ГАЗЕТА (ПОНЕДЕЛЬНИК) |
910042 |
НОВГОРОДСКИЕ ВЕДОМОСТИ |
14472 |
НОВГОРОД |
84589 |
ПРАВДА |
1438278 |
ПРАВДА-5 |
18819 |
СВОБОДНЫЙ САХАЛИН |
95652 |
ТОМСКАЯ НЕДЕЛЯ |
1321236 |
Все газеты вместе |
11401479 |
в начало статьи << >> в начало
