- •Оглавление
- •От автора
- •Область применения метода
- •Общая характеристика метода
- •4. Методика контент-анализа
- •4.1. Этапы проведения контент-анализа
- •4.2. Разработка программы анализа текстов
- •4.3 Кодификатор контент-анализа
- •4.4. Обработка и анализ данных
- •4.5. Представление результатов исследования
- •5. Контент-анализ редакционной почты
- •6. Задания для контрольной работы
- •Список использованной литературы
- •Кодификатор исследования
- •Образец регистрационной карточки
- •Текст статьи, подвергнутой контент-анализу в приложении 3 справиться с катастрофой
- •Представление данных в таблице
- •Кодификатор для анализа редакционной почты
4.4. Обработка и анализ данных
Как отмечает Л.Ньюман, тщательное измерение является решающим в контент-анализе: задача исследователя – замерить расплывчатые и неясные символические формы коммуникации и превратить их в точные, объективные признаки содержания текста, выраженные в количественных данных [4. С. 121]. Для того чтобы справиться с этой задачей, автору необходимо разработать программу обработки и анализа данных.
Программа обработки и анализа данных позволяет исследователю получить именно те результаты, которые более полно отвечают поставленной цели и соответствуют гипотезе исследования. Этот документ помогает автору выбрать информативные способы количественного подсчета признаков анализируемого текста; продумать, какие показатели должны быть сопоставлены для получения более наглядной картины исследуемой ситуации; учесть полученные данные по всем направлениям анализа (иногда студенты забывают отразить в общих результатах данные по сопутствующим гипотезам); оптимально использовать графические средства (таблицы, графики, диаграммы) при изложении результатов исследования.
Рассмотрим, какие статистические методы применяются в контент-анализе. Для начала отметим, что основная задача количественного анализа содержания текста − определить частоты появления интересующего исследователя признака. Эти частоты могут быть простыми и относительными.
Простая частота есть обычный подсчет частоты встречаемости в тексте определенного признака (ее еще называют абсолютной частотой, поскольку она выражена в абсолютных, то есть не соотносимых с другими, числах).
Пример: из истории разведки известно, как по изменению в специальной литературе частоты упоминания определенных научных тем и фамилий ученых делались достоверные выводы об успехах, достигнутых в конкретных областях исследований.
Относительная частота есть отношение абсолютной частоты встречаемости признака к длине анализируемого текста (в зависимости от принятой системы измерения, под длиной текста может пониматься количество слов в нем, количество предложений, абзацев и прочее).
Пример: отечественный специалист по контент-анализу В.И.Шалак показывает, что выявление относительной частоты встречаемости определенных категорий в посланиях Б.Клинтона к стране (послания 1994 и 1995 годов), стало весьма информативным для отслеживания изменений государственной политики США в различных областях. Эти послания содержали от 7000 до 10000 слов. Были сформированы категории слов, относящихся к экономике, бюджету страны, образованию, преступности, вопросам семьи, международным делам, социальной помощи и прочим сферам. Эти темы нашли отражение в обоих посланиях, но в одном из них некоторым темам уделялось больше внимания, чем в другом. Например, в послании 1995 года больше внимания было уделено вопросам образования, семьи, но меньше внимания − преступности, международным делам, социальной помощи. На основании этого был сделан вывод о приоритетах правительства США [9. С. 112].
Помимо частотного анализа появления признака, исследователя может интересовать корреляция (или теснота связи) данного признака с другими признаками текста. Речь идет о том, что смысл того или иного признака текста (слова, персоналии, имени собственного) проясняется через другие его признаки – слова, предложения, метафоры – которые сопровождают данный признак.
Пример: так, в коммунистической прессе партия КПРФ может упоминаться совместно с понятиями «справедливость», «народ», «власть трудящихся», а в демократической – с понятиями «советский режим», «историческое прошлое», «неэффективный».
Доктор социологических наук, профессор Л.Я.Аверьянов [1. С. 179] отмечает, что корреляционные связи не показывают причинно-следственных зависимостей. К примеру, слово «офицер» может быть тесно связано с понятием «защитник Родины», но что является основой этой связи, ответить сложно. На практике, достаточно исследователю получить высокую корреляционную зависимость, как он сразу же интерпретирует ее в категориях причинно-следственной связи. И основания для этого у него, без сомнения, имеются.
Л.Я.Аверьянов говорит о том, что корреляционные взаимосвязи признаков образуют контекст, который определяет смысл интересующего исследователя признака. В.И. Шалак употребляет понятие контекстного анализа в отношении выявления автором корреляционных связей признаков [9. С. 20-21]. Так, для определения контекста слова «змея» (предположим, что анализируется статья натуралиста), необходимо отметить в тексте все предложения, в которые входит это слово, и составить статистику слов из этих предложений. Наиболее частотными в этих предложениях, предполагает В.И.Шалак, окажутся слова: яд, ядовитый, укус, ползать, − те слова, которыми наиболее часто характеризуют змей. Таким образом, контекстный анализ текстов позволил выделить существенные признаки, характеризующие змей. Данный прием позволяет выявить, как характеризуются в материалах СМИ те или иные явления, события, персоналии.
Пример: английские социологи уверены, что существует легкий способ выявления образа, который формируют СМИ у аудитории по отношению к определенным персоналиям, партиям, событиям. Для этого надо выделить фрагменты текста в пять слов до и после упоминания интересующего нас предмета (к примеру, упоминания президента Грузии М.Саакашвили). Обобщить полученную информацию и выявить ее направленность, интенсивность, наиболее часто встречающиеся характеристики предмета. Почему по пять слов? Потому что, как доказали психологи, кратковременная человеческая память запоминает 7 ± 2 элемента, отсюда пять слов – минимальный предел возможностей памяти, доступный каждому человеку. Этот способ позволяет изучить неявные смыслы, заложенные в тексте, поскольку негативные слова, употребляемые в непосредственной близости с исследуемым предметом (в пределах пяти слов), но формально входящие в состав другого предложения, напрямую влияют на восприятие нами этого предмета, считают английские социологи.
Рассмотрев наиболее простые и часто используемые методы обработки данных, вернемся к программе обработки и анализа данных. Как мы уже отметили, в этом документе фиксируется логика работы с информацией, полученной в ходе исследования. Мы продумываем, какие статистические методы измерения интересующих нас фактов следует применять (частотный или корреляционный анализ), в какой последовательности осуществлять вычислительные операции, какие данные сопоставлять между собой. Обратимся к примеру.
Пример: предположим, что мы, на основе контент-анализа телепрограммы, исследуем объемы детского телевещания на каналах «Первый», «Россия», СТС, ТНТ. Какой будет программа обработки и анализа данных? Поскольку перед нами стоит довольно простая задача, наша программа также не будет сложной.
Программа обработки и анализа данных по исследованию объемов детского телевещания на каналах «Первый», «Россия», СТС, ТНТ:
1. Вычислить объемы эфирного вещания телеканала «Первый» за исследуемый период (складываем время вещания – в минутах эфирного времени − за все исследуемые дни).
2. Найти объемы среднедневного эфирного вещания на канале «Первый» (для этого делим полученные объемы вещания на количество исследуемых дней, получаем данные в минутах эфирного времени).
3. Вычислить объемы детского вещания на канале «Первый» (складываем время детского вещания – в минутах эфирного времени − за все исследуемые дни).
4. Найти объемы среднедневного детского вещания на канале «Первый» (для этого делим полученные объемы детского вещания на количество исследуемых дней, получаем данные в минутах эфирного времени).
5. Вычисляем процентное соотношение среднедневного детского вещания к общему объему среднедневного вещания «Первого» канала (для этого принимаем за 100 % объемы среднедневного вещания, за х – % среднедневного детского вещания, тогда:
х = объемы среднедневного детского вещания × 100 / объемы среднедневного вещания; получаем данные в процентах).
Пункты 6–10 программы: эти же шаги проделываем в отношении канала «Россия».
Пункты 11−15 программы: посвящены исследованию канала СТС.
Пункты 16−20 программы: то же самое в отношении канала ТНТ.
21. Сравниваем между собой полученные результаты (в абсолютных числах и в процентном соотношении) по всем исследуемым каналам, анализируем полученные данные.
22. Если это необходимо, анализируем различия в политике объемов детского показа на каналах государственной («Россия»), смешанной («Первый» канал) и частной (СТС, ТНТ) собственности.
23. И прочее – в зависимости от целей, задач и гипотезы исследования (именно они определяют основные направления анализа данных).
Более подробно об анализе данных в социологии можно узнать из учебника Г.Г. Татаровой [7].
Итак, в ходе исследования мы получили определенные данные, теперь их необходимо грамотно представить.