Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Уч. пособие по ММСИ.doc
Скачиваний:
43
Добавлен:
11.12.2018
Размер:
2.12 Mб
Скачать

Тема 11. Контент-анализ

1. Определение контент-анализа.

2. Содержательный контент-анализ.

3. Структурный контент-анализ.

4. Что нужно учитывать при проведении контент-анализа.

1. Определение контент-анализа

Кроме исследований, построенных на различных видах опроса (см. тему 8), существуют неопросные методы исследования. Оказывается, многое можно узнать об индивидах, социальных группах и учреждениях, не опрашивая их напрямую в ходе интервью или анкетирования. К таким неопросным методам относится контент-анализ. Его можно определить как систематическая числовая обработка и оценка содержания и формы информационного источника1.

Слово «контент-анализ» происходит от английского выражения «content-analysis», его можно перевести как анализ содержания. Контент-анализ может быть использован, если имеется какой-то материальный носитель информации. Примеры таких носителей: книги, журналы, газеты, фонограммы, аудио- и видеозаписи, фотографии, протоколы собраний, документы, фильмы, плакаты, карикатуры и лозунги, тексты речей, письма и дневники. Условно различаются содержательный и структурный контент-анализы.

2. Содержательный контент-анализ

Содержательный контент-анализ начинается с определения генеральной совокупности сообщений, которую предстоит изучать. Допустим, нас интересует освещение в газетах предвыборной кампании кандидатов в депутаты Законодательного собрания области. Тогда генеральной совокупностью будут все предвыборные газетные публикации относительно этих кандидатов определенного объема (допустим, два и более газетных столбца) в ежедневных газетах региона за определенный период времени. Или мы проводим мониторинг областных газет за неделю. В таком случае берутся все областные газеты за одну неделю.

После определения генеральной совокупности необходимо решить вопрос: исследовать всю совокупность либо ограничиться выборкой на основе простого случайного либо систематического случайного отбора. Например, можем анализировать газеты, выпущенные лишь по средам. Эту будет пример применения систематического случайного отбора. Но в этом случае в нашу выборку может как раз не попасть именно то, что нас интересует, если этот материал помещается, как правило, в пятничных номерах. Так что наилучшим способом определения выборки будет все-таки простой случайный отбор.

Далее необходимо принять решение о единице измерения, или единице анализа, это – минимальный элемент источника информации, на основе которого делаются обобщения. Простейшим элементом сообщения является слово или словесное выражение.

Допустим, мы хотим сравнить значимость проблемы развития малого бизнеса для двух кандидатов в депутаты – Петрова и Николаева. Мы можем взять все выступления кандидатов и подсчитать, сколько раз в них присутствует выражение «малый бизнес». Таким образом, метод состоит в определении ключевых слов в качестве единицы измерения и подсчете частоты их употребления в выступлениях.

Однако здесь необходимо решить две проблемы. Первая состоит в выборе способа стандартизации измерения. Пусть в своих выступлениях Петров использовал выражение «малый бизнес» 30 раз, а Николаев произнес это выражение 40 раз. И получается вроде бы, что Николаев в 1,33 раза (40 : 30) больше озабочен проблемой малого бизнеса, чем Петров.

Но если мы стандартизируем меру, и возьмем в качестве показателя количество ключевых слов на каждые 1000 слов в выступлениях, то получится иная картина. За все выступления Петров употребил 20 000 слов, и стандартизированный показатель у Петрова составит примерно 1,5 (30 : 20 000 х 1000). Николаев в своих выступлениях употребил 56 000 слов, и его показатель будет равен соответственно 0,7 (40 : 56 000 х 1000). Получается, что теперь Петров в 2,1 раза (1,5 : 0,7) больше озабочен проблемами малого бизнеса.

Но мы можем взять в качестве показателя количество выражений «малый бизнес» на каждые 100 строк в выступлениях. Пусть у кандидата Петрова все выступления составляют 1800 строк, тогда стандартизированный показатель окажется равным 1,67 (30 : 1800 х 100). Николаев в своих выступлениях употребил 4800 строк и его показатель будет равен 0,83 (40 : 4800 х 100). Получается, что Петров снова примерно в 2 раза (1,67 : 0,83) больше озабочен проблемами малого бизнеса.

Но мы можем взять количество выражений «малый бизнес» в среднем в течение одного выступления. Пусть у Петрова будет 28 выступлений, а у Николаева всего 18 выступлений. Тогда соответствующий показатель у Петрова будет 1,07 (30 : 28). А у Николаева показатель будет равен 2,2 (40 : 18). Таким образом, окажется, что уже Николаев в своих выступлениях в 2 раза (2,2 : 1,07) чаще употреблял ключевое слово, чем Петров (см. табл. 11.1).

Мы столкнулись с известной проблемой операционализации. Нужно определиться, что взять в качестве количественного показателя понятия «значимость проблемы малого бизнеса для данного кандидата». Мы видим, что в зависимости от способа операционализации результат будет различный, и надо выбирать, какой подход все же использовать. Тут нужно рассуждать следующим образом: наиболее близкие показатели получились при первом и втором способах стандартизации. Это означает, что именно эти показатели наиболее валидны. Остается выбрать из данных двух способов стандартизации наиболее дешевый и простой. Таким будет, очевидно, второй способ, потому что количество строк сосчитать проще, чем количество слов.

Таблица 11.1

Тема малого бизнеса в выступлениях кандидатов в депутаты

Кандидаты в депутаты

Общее число выражений

«малый бизнес»

Способы стандартизации

Число выражений на каждые 1000 слов

Число выражений на каждые 100 строк

Число выражений на 1 выступление

Петров

30

1,5

1,67

1,07

Николаев

40

0,7

0,78

2,2

Коэффициент

1,33 (в пользу Николаева)

2,1 (в пользу Петрова)

2 (в пользу Петрова)

2 (В пользу Николаева)

На практике делают так. Отбирают произвольным способом из заданной выборки примерно четверть материала, и на нем выясняют наиболее валидный и дешевый способ стандартизации. И затем этот способ используют для обработки всего массива выборки.

Итак, мы получили количественные показатели значимости проблемы малого бизнеса для данного кандидата. Эти показатели, как мы видим, можно сравнивать и определять, во сколько раз данный кандидат больше интересуется проблемой, чем другой кандидат.

Но возникает вторая проблема. Она состоит в необходимости учета контекста, в котором употребляется выражение «малый бизнес». Сравним фразы: «Я за то, чтобы помогать малому бизнесу, чтобы он становился все более массовым» и «О потакании так называемому малому бизнесу с его неизбежными нарушениями санитарных норм не может быть и речи». В обоих случаях используется ключевое выражение, но в разных контекстах, и смысл получается противоположный. Поэтому считать слова необходимо с учетом контекста.

Для учета контекста и избежания разночтений каждое упоминание должно быть прочитано не менее чем двумя членами исследовательской группы, причем оценки их должны быть согласованы. Таким образом, подсчитывается числовое соотношение позитивных, негативных и нейтральных упоминаний. Интересно то, что, оказывается, необязательно читать всю статью, чтобы определить характер контекста. Достаточно учесть смысл нескольких слов до и после ключевого выражения. Это позволяет машинизировать определение контекста через автоматический поиск ключевого выражения и прибавления к нему этих нескольких слов до и после.

Допустим, что у Петрова из всех 30 случаев употребления выражений «малый бизнес» 10 случаев даны в отрицательном контексте. Тогда показатель положительного или хотя бы нейтрального контекста будет равен 1,1 ((30 – 10) : 1800 х 100). Мы тут выбрали второй способ операционализации: учет количества применения ключевого слова на 100 строк. Николаев из всех 40 случаев употребления выражений «малый бизнес» 15 случаев дает в отрицательном контексте. Тогда показатель положительного или хотя бы нейтрального контекста будет равен 0,52 ((40 – 15) : 4800 х 100). Соотношение положительных показателей будет равно 2,1 (1,1 : 0,52). Можно сделать вывод, что отношение к малому бизнесу Петрова является в 2,1 раза более положительным, чем у Николаева.

Очевидно, что любой внимательный читатель выступлений обоих кандидатов уже на уровне интуиции поймет, что для Петрова тема малого бизнеса более значима, чем для Николаева, и что Петров более положительно относится к данной теме, чем Николаев. Но мы, проведя контент-анализ, получили количественные выражения того, как относятся тот и другой кандидат к проблеме малого бизнеса. Мы выяснили, что не просто более значима и более положительно, но во сколько раз более значима и более положительно. Это является особенно важным, когда сравниваются несколько фигур или проблем, и здесь интуиция уже точно не поможет.

Возможны другие способы применения контент-анализа. Допустим, мы исследуем газетные статьи, посвященные реформе местного самоуправления. Здесь применим так называемый метод «снежного кома»1.

Рассматривая отдельную статью, мы обнаруживаем, что в ней можно выделить две темы: изложение общей сути реформы и критику реформы в том виде, в каком она предлагается.

Мы объединяем все фрагменты статьи, которые относятся к первой теме, и все фрагменты, которые относятся ко второй теме. Получаем два отдельных текста. Помещаем их в два разных файла. Это несложно сделать, если уже проведена работа по переносу всех газетных статей в компьютер в электронном виде.

Таким же образом анализируем вторую статью. Обнаруживаем, что в ней рассматриваются тоже две темы, но теперь речь идет об общей сути реформы и проблемах, с которыми скорее всего столкнется ее реализация. Мы объединяем фрагменты статьи, которые относятся к первой теме, и переносим их в файл с фрагментами первой статьи по данной же проблеме. И так же объединяем в отдельный, уже третий, файл все фрагменты, которые относятся к третьей теме.

Таким образом, из обеих статей мы разнесли по разным файлам тексты по трем темам в проблеме реформы местного самоуправления: общая суть реформы, критика реформы и проблемы ее реализации.

Аналогичным образом разделяем другие статьи на фрагменты, соответствующие разным темам, переносим эти фрагменты в соответствующие файлы. А далее определяем объем текстов в каждом файле через количество знаков с пробелами. Изобразим ход дела в виде табл. 11.2.

Здесь строчные латинские буквы с индексами указывают объем части статьи, посвященной данной теме.

В крайней правой колонке мы записываем суммарные объемы всех тем, эти объемы в таблице обозначены буквами ai, bi, ci, di. Буквой N обозначим общий объем всех рассмотренных статей на тему о местном самоуправлении.

Таблица 11.2

Распределение тем по проблеме местного самоуправления в СМИ

Темы

Статья 1

Статья 2

Статья 3

Статья 4

Всего

Общая суть реформы

a1

a2

a4

ai

Критика реформы

b1

b3

b4

bi

Проблемы реформы

c2

c3

ci

Финансовая суть реформы

d4

di

Всего

a1+b1

a2+c2

b3+c3

a4+b4+d4

N

Теперь, деля по отдельности объемы ai, bi, ci, di на общий объем N, мы получаем удельный вес каждой темы в общем массиве статей. Эти веса можно выразить в процентах. После этого мы можем проранжировать темы по их удельному весу в общем массиве публикаций, посвященных реформе местного самоуправления.

В изложении данного метода мы опирались на пример конкретного исследования по проблеме местного самоуправления. Покажем реальное соотношение объема тем, которое получилось при анализе статей, помещенных в газетах федерального уровня (табл. 11.3).

Таблица 11.3

Распределение тем по проблеме местного самоуправления

Место

Темы

Удельный вес темы, в %

1

Проблемный аспект

39

2

Критика

24,5

3

Финансовая суть реформы

21,5

4

Изложение общей сути реформы

15

Мы можем сделать вывод, что в прессе главное внимание при обсуждении реформы местного самоуправление было уделено ее проблемным аспектам и критике, которые вместе заняли 63,5% от общего объема всех анализируемых статей1.

Возможно применение иных единиц при контент-анализе. Например, мы можем за единицу измерения взять статью или книгу, и определить процент книг и статей, пропагандирующих европейские ценности, среди всех книг и статей, опубликованных в России в течение определенного года. И соотнести его с процентом, изданных за этот же период книг и статей, в которых подчеркивается особый путь России.

Если мы сопоставим такого рода данные за несколько лет, то перед нами проступит некая тенденция, отражающая сдвиг в понимании места России в мире.