
Контент анализ состоит из трех основных этапов:
1 этап – определение единиц анализа и их кодировка. Здесь можно выделить несколько шагов.
1-й шаг - определения ключевых понятий или категорий анализа, которые ориентируются на программу исследования.
Покажем это на примере. В проекте "Влияние СМИ на различные группы молодежи" изучалась степень соответствия позиций молодежи оценочным суждениям, интерпретационным моделям, транслируемым различными СМИ РФ. В основу исследования был положен предложенный финскими социологами парадигматический подход. В рамках этого подхода под парадигмой понимают определенную интерпретационную схему явлений действительности. Парадигмы (т.е. интерпретационные схемы объективной реальности) выявлялись как в массовом сознании, так и в массовой информации. В соответствии с теоретическими посылками, парадигму образуют такие элементы: представление ситуации как проблемной, т.е. содержащей противоречие, оценка напряженности, видение причин, путей решения, виновников проблемной ситуации, главные герои. Все элементы парадигмы, которые в ней теоретически вычленяются, использованы в данном исследовании для контент-анализа в качестве категорий.
2-й шаг - структурирование ключевых понятий или категорий анализа, т.е. деление (операционализация) понятия на более частные понятия (подкатегории) в соответствии с выбранными классификационными признаками. Важно, чтобы при разработке системы подкатегорий контент-аналитик соблюдал правила деления объема понятий: а) одно и то же деление понятия должно осуществляться по одному и тому же основанию; б) объем членов деления, вместе взятых, должен равняться объему делимого понятия; в) члены деления должны взаимоисключать друг друга. Например, категория "главный герой" может подразделяться с точки зрения такого знака, как социально-профессиональная принадлежность на героя-рабочего, служащего, студента и т.д. Если же в характеристике героя важно зафиксировать его возраст, пол или политические убеждения, категориальная сетка будет иной, т.к. иными являются основания классификации. Важно только, чтобы совокупность подкатегорий исчерпывающе раскрывала категорию по выбранному основанию. Итак, категории анализа жестко заданы проблемой исследования, его концепцией, тогда как подкатегории, как правило, вариативны, гибко приспособлены к тому материалу, который предстоит анализировать, и к тем задачам, которые предстоит решить. Например, одна из традиционных категорий, используемых при анализе СМИ - "тема" - зачастую содержит самые различные подкатегории в разных исследованиях. Это обусловлено тем, что тематика разных изданий сильно варьируется, но, не в меньшей степени и тем, что аналитик может стремиться к разной степени подробности в описании тематической структуры. Аналогично и категория "география описываемых событий" классифицируется существенно по-разному, если объектом исследования является республиканская или местная печать. А такая категория, как "оценка", наоборот, всегда структурируется одинаково: положительная, отрицательная, сбалансированная, нейтральная оценка.
3-й шаг - полученную схему, состоящую из категорий и подкатегорий, необходимо "наложить" на конкретный текст, или, иными словами, найти для всех категорий и подкатегорий адекватное выражение на языке исследуемых документов. Таким их выражением являются единицы анализа текста. Если сопоставить категории (подкатегории) и единицы анализа, то можно сказать, что последние являются результатом операционализаиии первых. Например, категория "география сообщений" операционализирована так: "слова, обозначающие названия городов и других населенных пунктов РФ" и соотносимых с ними регионов, типа "Витебская область", "Борисовский район".
В практике сложился целый ряд устойчивых стандартных единиц контент-анализа. К их числу относятся следующие:
- отдельное слово. Известно исследование, проведенное американскими учеными Гарольдом Лассуэллом, Натаном Лейтесом и др. в конце 40-х годов. Его целью было изучить политическую и идеологическую информацию в газетах различных стран мира. Для анализа были выбраны так называемые “престижные” газеты, которые читаются политической элитой всего мира и могут считаться достаточно надежным индикатором идеологических трансформаций, происходящих в тех странах, где они издаются. Были проанализированы редакционные статьи газетных выпусков первого и пятнадцатого дня каждого месяца следующих газет (что составило в общей сложности 20000 статей). Единицей анализа были взяты слова-символы - язык политики, по терминологии авторов исследования: 416 имен политических деятелей, политических институтов (конгресс, парламент, премьер, фюрер и т.д.), стран, политических сил (масса, пролетариат), обозначение политических актов и состояний (мир, война, революция) и наименования идеологий (коммунизм, либерализм, демократия и т.д.). Методологическая посылка авторов состояла в том, что эти символы - ключевые, ударные моменты в любой политической информации с точки зрения коммуникатора, но это и те узлы, на которых застревает внимание аудитории. Таким образом, в политическом словнике конкретизируется это двувекторное внимание. Анализ состоял в фиксации частотности употребления каждого символа и в фиксации оценки, которой сопровождался каждый символ (благоприятной, неблагоприятной и нейтральной) в тексте.
Наиболее широкую популярность в общественных кругах получило исследование намерений редакции газеты «Истинный американец», послужившее главным аргументом обвинения газеты в профашистской ориентации. Исследование Лассуэлла и Лейтеса открыло новые возможности применения контент-анализа как метода обнаружения неявных ценностных установок и пропагандистских целей коммуникатора. Это исследование стало опытной базой для многих теоретических обобщений, которые на сегодня составляют методологическую основу контент-анализа.
- суждение, законченная мысль, логическая цепь, в которой обнаруживается центральная идея. Примеры подобных смысловых единиц анализа: описание брака или любви между двумя конкретными людьми, истории их взаимоотношений и всех сопутствующих обстоятельств; экологическая проблемная ситуация - часть текста, содержащая информацию об определенном аспекте отношений человека со средой, оценке этих отношений и о связанных с ним объяснениях.
- персонаж ("герой") сообщения используется при изучении пропаганды профессий, интерпретации особенностей того или иного национального характера в СМИ, в других контент-аналитических исследованиях, когда необходимо определить, какие качества приписываются личности (группе) в интересующих аналитика документах.
Из приведенного описания очевидно, что фрагменты текста, соответствующие различным единицам анализа, могут колебаться от минимального размера (слово) до максимального (логическая цепь, жизненная ситуация), которые фиксируются в пределах целого сообщения или даже нескольких сообщений.
2 этап - подсчет частоты упоминаний исследуемых переменных, выявление взаимосвязи между ними, рассчитываются относительные индексы, например, индекс информационного присутствия или пресс-индекс, индекс эмоциональной направленности, индекс тематической активности и другие. Здесь устанавливается единица счета (единицы измерения), т.е. количественная мера единицы анализа, позволяющая регистрировать частоту (регулярность) появления признака категории анализа в тексте. Единицами счета могут быть число определенных слов или их сочетаний, количество строк, печатных знаков, страниц, абзацев, авторских листов, площадь текста, выраженная в физических пространственных величинах и многое другое. Возможен и другой тип единиц измерения – единицы протяженности (в координатах пространство – время), например, количество минут эфирного времени телевизионного сообщения, квадратные сантиметры в тексте или на странице сайта (в процентном соотношении).
Единица анализа с наибольшей точностью идентифицируется на фоне более широких содержательных структур, которые иногда называют единицами контекста. Для слова и предложения контекстом будет абзац, для жизненной или проблемной ситуации - целое сообщение.
Обнаружение единиц анализа в тексте документа сопровождается процедурой их измерения с целью определить объем внимания или частоту обращения к тем или иным проблемам, символам, темам, героям, выявлении объема внимания вычисляется количеством строк, минут эфирного времени или размер газетной, журнальной площади, посвященной интересующей единице анализа. Прежде чем приступать к измерению, необходимо решить, будет ли входить заголовок в объем сообщения, какой единый стандарт избрать для измерения материалов, набранных разными шрифтами и в. случае, если необходимо определить частоту обращений, подсчитывается количество упоминаний соответствующего символа, общее число упоминаний слов, предложений, суждений или количество абзацев, других фрагментов текста, содержащих данную единицу. Если единицей анализа выступает признак, характеризующий сообщение в целом, фиксируется просто его наличие в тексте и подсчитывается количество материалов, содержащих этот признак. Таким признаком может быть, например, авторство материала: подытоживается количество сообщений, авторы которых профессиональные журналисты, политики, ученые, специалисты и т.д.
Приступая к контент-анализу, социолог должен иметь следующие документы: таблицу (классификатор, бланк) контент-анализа, инструкцию кодировщика, кодированную карточку.
Taблица (классификатор, бланк) контент-анализа содержит список категорий и подкатегорий и присвоенные им коды. Ее основное предназначение — предельно четко зафиксировать то, в каких единицах выражается каждая категория, используемая в исследовании. Классификатор можно уподобить социологической анкете, где категории анализа играют роль вопросов, а единицы анализа — ответов. Он является основным методическим документом контент-анализа, предопределяющим содержание всех прочих инструментов этого метода.
Инструкция кодировщика содержит описание единицы анализа и счета, в ней изложены правила кодирования, проиллюстрированные соответствующими примерами, оговариваются возможные затруднения и спорные моменты. Осваивая инструкцию, кодировщик (т.е. тот, кто выполняет работу по сбору эмпирической информации, фиксируя, классифицируя и подсчитывая единицы анализа) овладевает алгоритмом действий, что, в конечном счете, и обеспечивает реализацию принципа объективности, когда различные аналитики, приложив методику к одному и тому же содержанию, получают один и тот же результат. Регистрация единиц анализа производится в специальных таблицах, кодировочных матрицах или карточках.
Кодировочная карточка, например, включает все классификационные единицы - категории и подкатегории. Единицы анализа, обнаруженные в документе, по ходу работы фиксируются в соответствующих графах кодировочной карточки (Рис 1).
Рис. 1. Образец кодировочной карточки
Номер документа № |
Категории и подкатегории анализа |
|||||||||||||||
Тема (код) |
Знак информации (код) |
География сообщений (код) |
Автор сообщения (код) |
|||||||||||||
1 |
2 |
… |
n |
1 |
2 |
… |
n |
1 |
2 |
… |
n |
1 |
2 |
… |
N |
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
… |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Для количественного описания результатов анализа содержания используются те же средства и приемы, что и в любых других социологических исследованиях: процентное распределение, индексы, парные корреляции, различные виды многомерного статистического анализа. Существуют и специальные коэффициенты для анализа документов. Таков коэффициент Яниса, который предназначен для вычисления баланса положительных и отрицательных оценочных суждений относительно избранного объекта высказывания. Если число положительных оценок превышает число отрицательных, коэффициент вычисляется по формуле:
C+ = - (f2 – f*n) / (r*t)
где f - число положительных оценок, n – число отрицательных оценок, r - объем содержания текста, имеющего прямое отношение к изучаемой проблеме, t - общий объем текста. Если число положительных оценок меньше, чем отрицательных, коэффициент находится по формуле:
C- = (f*n – n2) / (r*t)
Полезна при анализе текста формула для измерения удельного веса категорий содержания, предложен А.Н.Алексеевым:
Ykc = ((2Кгл + Квт) / ∑(Кглi + Квтi)) * 100%
где Укс - удельный вес данной категории содержания; Кгл - количество случаев, когда данная категория (единица) оказалась главной; Квт - количество случаев,| когда данная категория (единица) оказалась второстепенной; Z- сумма анализируемых документов.
Удельный вес категории содержания можно вычислить и более просто: Укс = отношению числа единиц анализа, фиксирующих данную категорию к общему числу единиц анализа.
В контент-анализе предполагается своя выборка. Массив вербальных, фонетических или иконографических документов, объединенных общим признаком (источник, автор, тема и т.п.), представляет генеральную совокупность, подлежащую изучению. Границы генеральной совокупности задаются достаточно произвольно: исходя из целей исследования и с учетом естественных временных циклов (год, квартал, месяц) и периодичности изданий (если речь идет об анализе содержания СМИ). Например, в исследовании динамики освещения в прессе РФ проблем, связанных с аварией на Чернобыльской АЭС, генеральной совокупностью документов были все газеты, изданные в республике с конца апреля 1986 года (т.е. с момента аварии). Если стоит задача провести контент-анализ кампании по выборам президента, то в границы генеральной совокупности будут включены все документы, опубликованные в связи с выборами с момента начала кампании до момента ее завершения.
При формировании выборочной совокупности документов из трех возможных стратегий: сплошного, случайного, направленного отбора - используются только две первые. Направленный тип отбора исключается, т.к. отсутствуют данные о распределении признаков в генеральной совокупности документов. Чаще всего в контент-анализе используется многоступенчатый отбор. На первой ступени отбираются источники. В том случае, если источников много, они предварительно группируются, и отбор производится из каждой группы. На второй ступени отбираются собственно тексты документов - протоколы собраний, инструкции, листовки, письма, фильмы, передачи, материалы газет внутри каждого из выделенных на первой ступени источника. Отбор газет представляет собой разновидность гнездовой выборки (гнездо - номер газеты). Выделение гнезд - номеров газеты - методом систематического отбора нежелательно, т.к., учитывая периодичность выхода газет, можно получить смешенную выборку, в которую попадут только, например, номера за понедельник, или за вторник, или за пятницу, в то время как номера за другие дни недели вообще выпадут из поля зрения. У практиков контент-анализа существует метод "конструирования недели", позволяющий избежать такого смещения. Он предполагает предварительное районирование генеральной совокупности. В годовой подшивке выделяют выпуски за понедельник, вторник и т.д. А затем из каждой группы чисто случайно отбирается нужное количество номеров.
Но как определить объем выборки в контент-аналитическом исследовании? Целесообразно осуществлять формирование выборочной совокупности по принципу наполнения. В соответствии с этим принципом выбор единиц наблюдения прекращается тогда, когда ошибка выборки удовлетворяет исследователя. Для этого необходимо процесс отбора контролировать, периодически меряя ошибку. Ссылаясь на опыт, Н.Н.Чурилов, описавший этот метод, отмечает, что предельная теоретическая ошибка выборки стремительно уменьшается при анализе первых 10-15 газет. Если же и дальше продолжать увеличивать число единиц наблюдения, то ошибка уменьшается незначительно. Порогом насыщения являет совокупность в 30-35 газет. На практике для анализа большого массива документов чаще всего используется выборка в 200-600 отдельных текстов для одного источника (это соответствует количеству материалов в 30-35 газетах).