- •Тема 1. Общие идеи. Постановка проблемы и выдвижение гипотез
- •1. Идея метода
- •2. Постановка проблемы и выдвижение гипотез
- •3. Требования к теории
- •Тема 2. Понятия ковариации и каузации. Каузальная модель теории
- •1. Ковариация и каузация
- •2. Понятие функциональной связи
- •3. Построение каузальной модели
- •Тема 3. Понятие операционализации, альтернативные и рабочие гипотезы
- •1. Альтернативные гипотезы
- •2. Процедура операционализации
- •3. Рабочие гипотезы, их отличие от альтернативных гипотез
- •Тема 4. Измерение. Ошибки измерения
- •1. Понятие измерения
- •2. Ошибки измерения
- •Тема 5. Валидность и надежность измерения
- •1. Понятие валидности
- •2. Способы валидизации
- •3. Надежность измерения
- •Тема 6. Построение анкеты
- •1. Структура анкеты
- •Уважаемые сограждане!
- •Сводная таблица данных1
- •2. Виды вопросов и их формулировка
- •3. Расположение вопросов и ответов
- •4. Предварительное опробование анкеты
- •Тема 7. Формирование выборки
- •1. Генеральная совокупность и выборка
- •2. Способы построения выборки
- •3. Определение объема выборки
- •Тема 8. Проведение опроса
- •1. Опрос и его виды и способы организации
- •2. Проведение опроса
- •3. Контроль над проведением опроса
- •4. Вторичный анализ данных опроса
- •Тема 9. Интервью
- •1. Определение интервью. Выборочное интервью
- •2. Направленное интервью
- •3. Специализированное интервью
- •Тема 10. Социологический эксперимент
- •1. Понятие переменной
- •2. Классический эксперимент в социологии
- •3. Способы подбора групп, участвующих в эксперименте. Полевой эксперимент и квазиэксперимент
- •Тема 11. Контент-анализ
- •1. Определение контент-анализа
- •2. Содержательный контент-анализ
- •3. Структурный контент-анализ
- •4. Что нужно учитывать при проведении контент-анализа
- •Тема 12. Описание и анализ данных: таблицы, диаграммы, гистограммы
- •1. Перечневая таблица
- •2. Графическое изображение
- •3. Другие способы представления данных
- •4. Правила оформления данных
- •Тема 13. Анализ номинальных и порядковых переменных
- •1. Анализ номинальных переменных
- •2. Анализ порядковых переменных
- •Тема 14. Анализ интервальных переменных
- •1. Понятия средней арифметической и стандартного отклонения
- •2. Анализ нормального распределения
- •Тема 15. Анализ связей между номинальными переменными
- •1. Связь двух номинальных переменных с двумя значениями. Понятие Хи-квадрата
- •2. Связь двух номинальных переменных, имеющих больше двух значений
- •3. Связь между несколькими номинальными переменными
- •Тема 16. Анализ связи между порядковыми переменными
- •1. Определение связи между двумя порядковыми переменными
- •2. Определение связи между таблицами с порядковыми переменными
- •Тема 17. Анализ связей между интервальными переменными
- •1. Понятие линии регрессии. Определение коэффициента связи между интервальными переменными
- •2. Проверка коэффициента связи на статистическую значимость
- •3. Смысл коэффициента корреляции Пирсона
- •Тема 18. Пример социологического исследования
Тема 11. Контент-анализ
1. Определение контент-анализа.
2. Содержательный контент-анализ.
3. Структурный контент-анализ.
4. Что нужно учитывать при проведении контент-анализа.
1. Определение контент-анализа
Кроме исследований, построенных на различных видах опроса (см. тему 8), существуют неопросные методы исследования. Оказывается, многое можно узнать об индивидах, социальных группах и учреждениях, не опрашивая их напрямую в ходе интервью или анкетирования. К таким неопросным методам относится контент-анализ. Его можно определить как систематическая числовая обработка и оценка содержания и формы информационного источника1.
Слово «контент-анализ» происходит от английского выражения «content-analysis», его можно перевести как анализ содержания. Контент-анализ может быть использован, если имеется какой-то материальный носитель информации. Примеры таких носителей: книги, журналы, газеты, фонограммы, аудио- и видеозаписи, фотографии, протоколы собраний, документы, фильмы, плакаты, карикатуры и лозунги, тексты речей, письма и дневники. Условно различаются содержательный и структурный контент-анализы.
2. Содержательный контент-анализ
Содержательный контент-анализ начинается с определения генеральной совокупности сообщений, которую предстоит изучать. Допустим, нас интересует освещение в газетах предвыборной кампании кандидатов в депутаты Законодательного собрания области. Тогда генеральной совокупностью будут все предвыборные газетные публикации относительно этих кандидатов определенного объема (допустим, два и более газетных столбца) в ежедневных газетах региона за определенный период времени. Или мы проводим мониторинг областных газет за неделю. В таком случае берутся все областные газеты за одну неделю.
После определения генеральной совокупности необходимо решить вопрос: исследовать всю совокупность либо ограничиться выборкой на основе простого случайного либо систематического случайного отбора. Например, можем анализировать газеты, выпущенные лишь по средам. Эту будет пример применения систематического случайного отбора. Но в этом случае в нашу выборку может как раз не попасть именно то, что нас интересует, если этот материал помещается, как правило, в пятничных номерах. Так что наилучшим способом определения выборки будет все-таки простой случайный отбор.
Далее необходимо принять решение о единице измерения, или единице анализа, это – минимальный элемент источника информации, на основе которого делаются обобщения. Простейшим элементом сообщения является слово или словесное выражение.
Допустим, мы хотим сравнить значимость проблемы развития малого бизнеса для двух кандидатов в депутаты – Петрова и Николаева. Мы можем взять все выступления кандидатов и подсчитать, сколько раз в них присутствует выражение «малый бизнес». Таким образом, метод состоит в определении ключевых слов в качестве единицы измерения и подсчете частоты их употребления в выступлениях.
Однако здесь необходимо решить две проблемы. Первая состоит в выборе способа стандартизации измерения. Пусть в своих выступлениях Петров использовал выражение «малый бизнес» 30 раз, а Николаев произнес это выражение 40 раз. И получается вроде бы, что Николаев в 1,33 раза (40 : 30) больше озабочен проблемой малого бизнеса, чем Петров.
Но если мы стандартизируем меру, и возьмем в качестве показателя количество ключевых слов на каждые 1000 слов в выступлениях, то получится иная картина. За все выступления Петров употребил 20 000 слов, и стандартизированный показатель у Петрова составит примерно 1,5 (30 : 20 000 х 1000). Николаев в своих выступлениях употребил 56 000 слов, и его показатель будет равен соответственно 0,7 (40 : 56 000 х 1000). Получается, что теперь Петров в 2,1 раза (1,5 : 0,7) больше озабочен проблемами малого бизнеса.
Но мы можем взять в качестве показателя количество выражений «малый бизнес» на каждые 100 строк в выступлениях. Пусть у кандидата Петрова все выступления составляют 1800 строк, тогда стандартизированный показатель окажется равным 1,67 (30 : 1800 х 100). Николаев в своих выступлениях употребил 4800 строк и его показатель будет равен 0,83 (40 : 4800 х 100). Получается, что Петров снова примерно в 2 раза (1,67 : 0,83) больше озабочен проблемами малого бизнеса.
Но мы можем взять количество выражений «малый бизнес» в среднем в течение одного выступления. Пусть у Петрова будет 28 выступлений, а у Николаева всего 18 выступлений. Тогда соответствующий показатель у Петрова будет 1,07 (30 : 28). А у Николаева показатель будет равен 2,2 (40 : 18). Таким образом, окажется, что уже Николаев в своих выступлениях в 2 раза (2,2 : 1,07) чаще употреблял ключевое слово, чем Петров (см. табл. 11.1).
Мы столкнулись с известной проблемой операционализации. Нужно определиться, что взять в качестве количественного показателя понятия «значимость проблемы малого бизнеса для данного кандидата». Мы видим, что в зависимости от способа операционализации результат будет различный, и надо выбирать, какой подход все же использовать. Тут нужно рассуждать следующим образом: наиболее близкие показатели получились при первом и втором способах стандартизации. Это означает, что именно эти показатели наиболее валидны. Остается выбрать из данных двух способов стандартизации наиболее дешевый и простой. Таким будет, очевидно, второй способ, потому что количество строк сосчитать проще, чем количество слов.
Таблица 11.1
Тема малого бизнеса в выступлениях кандидатов в депутаты
Кандидаты в депутаты |
Общее число выражений «малый бизнес» |
Способы стандартизации |
||
Число выражений на каждые 1000 слов |
Число выражений на каждые 100 строк |
Число выражений на 1 выступление |
||
Петров |
30 |
1,5 |
1,67 |
1,07 |
Николаев |
40 |
0,7 |
0,78 |
2,2 |
Коэффициент |
1,33 (в пользу Николаева) |
2,1 (в пользу Петрова) |
2 (в пользу Петрова) |
2 (В пользу Николаева) |
На практике делают так. Отбирают произвольным способом из заданной выборки примерно четверть материала, и на нем выясняют наиболее валидный и дешевый способ стандартизации. И затем этот способ используют для обработки всего массива выборки.
Итак, мы получили количественные показатели значимости проблемы малого бизнеса для данного кандидата. Эти показатели, как мы видим, можно сравнивать и определять, во сколько раз данный кандидат больше интересуется проблемой, чем другой кандидат.
Но возникает вторая проблема. Она состоит в необходимости учета контекста, в котором употребляется выражение «малый бизнес». Сравним фразы: «Я за то, чтобы помогать малому бизнесу, чтобы он становился все более массовым» и «О потакании так называемому малому бизнесу с его неизбежными нарушениями санитарных норм не может быть и речи». В обоих случаях используется ключевое выражение, но в разных контекстах, и смысл получается противоположный. Поэтому считать слова необходимо с учетом контекста.
Для учета контекста и избежания разночтений каждое упоминание должно быть прочитано не менее чем двумя членами исследовательской группы, причем оценки их должны быть согласованы. Таким образом, подсчитывается числовое соотношение позитивных, негативных и нейтральных упоминаний. Интересно то, что, оказывается, необязательно читать всю статью, чтобы определить характер контекста. Достаточно учесть смысл нескольких слов до и после ключевого выражения. Это позволяет машинизировать определение контекста через автоматический поиск ключевого выражения и прибавления к нему этих нескольких слов до и после.
Допустим, что у Петрова из всех 30 случаев употребления выражений «малый бизнес» 10 случаев даны в отрицательном контексте. Тогда показатель положительного или хотя бы нейтрального контекста будет равен 1,1 ((30 – 10) : 1800 х 100). Мы тут выбрали второй способ операционализации: учет количества применения ключевого слова на 100 строк. Николаев из всех 40 случаев употребления выражений «малый бизнес» 15 случаев дает в отрицательном контексте. Тогда показатель положительного или хотя бы нейтрального контекста будет равен 0,52 ((40 – 15) : 4800 х 100). Соотношение положительных показателей будет равно 2,1 (1,1 : 0,52). Можно сделать вывод, что отношение к малому бизнесу Петрова является в 2,1 раза более положительным, чем у Николаева.
Очевидно, что любой внимательный читатель выступлений обоих кандидатов уже на уровне интуиции поймет, что для Петрова тема малого бизнеса более значима, чем для Николаева, и что Петров более положительно относится к данной теме, чем Николаев. Но мы, проведя контент-анализ, получили количественные выражения того, как относятся тот и другой кандидат к проблеме малого бизнеса. Мы выяснили, что не просто более значима и более положительно, но во сколько раз более значима и более положительно. Это является особенно важным, когда сравниваются несколько фигур или проблем, и здесь интуиция уже точно не поможет.
Возможны другие способы применения контент-анализа. Допустим, мы исследуем газетные статьи, посвященные реформе местного самоуправления. Здесь применим так называемый метод «снежного кома»1.
Рассматривая отдельную статью, мы обнаруживаем, что в ней можно выделить две темы: изложение общей сути реформы и критику реформы в том виде, в каком она предлагается.
Мы объединяем все фрагменты статьи, которые относятся к первой теме, и все фрагменты, которые относятся ко второй теме. Получаем два отдельных текста. Помещаем их в два разных файла. Это несложно сделать, если уже проведена работа по переносу всех газетных статей в компьютер в электронном виде.
Таким же образом анализируем вторую статью. Обнаруживаем, что в ней рассматриваются тоже две темы, но теперь речь идет об общей сути реформы и проблемах, с которыми скорее всего столкнется ее реализация. Мы объединяем фрагменты статьи, которые относятся к первой теме, и переносим их в файл с фрагментами первой статьи по данной же проблеме. И так же объединяем в отдельный, уже третий, файл все фрагменты, которые относятся к третьей теме.
Таким образом, из обеих статей мы разнесли по разным файлам тексты по трем темам в проблеме реформы местного самоуправления: общая суть реформы, критика реформы и проблемы ее реализации.
Аналогичным образом разделяем другие статьи на фрагменты, соответствующие разным темам, переносим эти фрагменты в соответствующие файлы. А далее определяем объем текстов в каждом файле через количество знаков с пробелами. Изобразим ход дела в виде табл. 11.2.
Здесь строчные латинские буквы с индексами указывают объем части статьи, посвященной данной теме.
В крайней правой колонке мы записываем суммарные объемы всех тем, эти объемы в таблице обозначены буквами ai, bi, ci, di. Буквой N обозначим общий объем всех рассмотренных статей на тему о местном самоуправлении.
Таблица 11.2
Распределение тем по проблеме местного самоуправления в СМИ
Темы |
Статья 1 |
Статья 2 |
Статья 3 |
Статья 4 |
… |
Всего |
Общая суть реформы |
a1 |
a2 |
– |
a4 |
… |
ai |
Критика реформы |
b1 |
– |
b3 |
b4 |
… |
bi |
Проблемы реформы |
– |
c2 |
c3 |
– |
… |
ci |
Финансовая суть реформы |
– |
– |
– |
d4 |
… |
di |
Всего |
a1+b1 |
a2+c2 |
b3+c3 |
a4+b4+d4 |
… |
N |
Теперь, деля по отдельности объемы ai, bi, ci, di на общий объем N, мы получаем удельный вес каждой темы в общем массиве статей. Эти веса можно выразить в процентах. После этого мы можем проранжировать темы по их удельному весу в общем массиве публикаций, посвященных реформе местного самоуправления.
В изложении данного метода мы опирались на пример конкретного исследования по проблеме местного самоуправления. Покажем реальное соотношение объема тем, которое получилось при анализе статей, помещенных в газетах федерального уровня (табл. 11.3).
Таблица 11.3
Распределение тем по проблеме местного самоуправления
Место |
Темы |
Удельный вес темы, в % |
1 |
Проблемный аспект |
39 |
2 |
Критика |
24,5 |
3 |
Финансовая суть реформы |
21,5 |
4 |
Изложение общей сути реформы |
15 |
Мы можем сделать вывод, что в прессе главное внимание при обсуждении реформы местного самоуправление было уделено ее проблемным аспектам и критике, которые вместе заняли 63,5% от общего объема всех анализируемых статей1.
Возможно применение иных единиц при контент-анализе. Например, мы можем за единицу измерения взять статью или книгу, и определить процент книг и статей, пропагандирующих европейские ценности, среди всех книг и статей, опубликованных в России в течение определенного года. И соотнести его с процентом, изданных за этот же период книг и статей, в которых подчеркивается особый путь России.
Если мы сопоставим такого рода данные за несколько лет, то перед нами проступит некая тенденция, отражающая сдвиг в понимании места России в мире.