Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
SMK_2-y_semestr_zachet.docx
Скачиваний:
3
Добавлен:
21.09.2019
Размер:
74.29 Кб
Скачать

27. Индикаторы исследования текстов сми при контен-анализе. Частотность употребления единиц в тексте

Единицей анализа выступает отдельный фрагмент текста: слово, персонаж, суждение, абзац, или нетвердо фиксируемый отрезок текста, совпадающий с определенной темой. Во всех случаях речь идет о довольно ограниченном наборе слов, персонажей, суждений, который интересует исследователя.

Их появление в тексте фиксируется уже значительно большим числом способов:

а - возможность подсчета количества упоминаемых в тексте слов, персонажей, суждений, тем и т.п. сводится к таким вариантам (разберем эти варианты для самого простого случая, когда единицей анализа является слово):

подсчитывается общее число упоминаний каждого слова;

подсчитывается количество предложений, абзацев, которые могут содержать искомые слова;

подсчитывается число материалов, в которых встретилось хотя бы одно искомое слово.

б - подсчитывается сумма площадей (в газете) или эфирного времени (на радио и телевидении) отрезков текста, содержащих нужное слово:

тут мельчайшей частицей выступают законченные, «оформленные» единицы площади (абзац, страница микрофонной папки с радио- и телематериалами) с нужным словом, сумма которых и подсчитывается;

суммируются площади материалов в целом, если они содержат хотя бы одно искомое слово. Здесь следует ввести понятие единицы контекста. Обсудим его на примере подсчета слов, соответствующих категориальной сетке исследователя. Слово живет в рамках предложения; более сложной пространственной единицы, состоящей из нескольких предложений, если все они обеспечивают законченное суждение; абзаца и, наконец, материала в целом. Если объектом исследования служит небольшой текстовой материал, имеет смысл подсчитывать все количество упоминаний слова. Но иногда при больших объемах исследователи устанавливают единицы контекста, и тогда употребление хотя бы одного искомого слова в рамках абзаца считается равноценным его неоднократному употреблению в этом же абзаце. Более того, упоминание слова в рамках материала иногда фиксируется как равнозначное неоднократному его употреблению в рамках этого же материала.

Так, в исследовании языка политики школой Г. Лассвелла, когда кодировщики оперировали совокупностью анализируемых текстов в 20000 редакционных статей и 416 символами, отсутствие или присутствие которых они фиксировали в тексте, тактика кодировки состояла в том, что достаточно было встретить хотя бы одно упоминание - независимо от того, сколько на самом деле их было в тексте: ведь, как объяснялось в инструкции, вариации числа появления могли зависеть от индивидуального стиля автора

Как правило, перед тем, как принять решение, какой стратегии подсчета придерживаться, проводится пробный подсчет вариантов - не искажает ли выводов выбор той или иной стратегии.

Чтобы проиллюстрировать механизм существования обозначенных нами категорий, единиц анализа, измерения и контекста, разберем с этой точки зрения некоторые исследования, которые мы ввели в пласт наших рассуждений о контент-анализе и которые, таким образом, уже знакомы читателю.

Количественный контент-анализ (также именуется содержательным) основывается на исследовании слов, тем и сообщений, сосредоточивая внимание исследователя на содержании сообщения. Таким образом, собираясь подвергнуть анализу выбранные элементы, нужно уметь предвидеть их смысл и определять каждый возможный результат наблюдения в соответствии с ожиданиями исследователя.[8]

На деле это означает, что в качестве первого шага при проведении контент-анализа этого типа исследователь должен создать своего рода словарь, в котором каждое наблюдение получит определение и будет отнесено к соответствующему классу.[8]

Проблема состоит в том, что исследователь должен предвидеть не только упоминания, которые могут встретиться, но и элементы их контекстуального употребления, а для этого должна быть разработана детальная система правил оценки каждого случая употребления. Эта задача обычно решается посредством пилотажа подлежащей анализу совокупности сообщений (то есть с помощью выявления на материале небольшой выборки сообщений тех типов ключевых упоминаний, которые с наибольшей вероятностью могут встретиться в последующем, более полном анализе) в сочетании с арбитражными оценками контекстов и способов употребления терминов. Предпочтительнее иметь дело с наблюдениями не одного, а нескольких исследователей.[8]

Более трудной является задача, заключающаяся в необходимости приписывания ключевым упоминаниям конкретных оценок, — когда мы должны решить, приводится ли данное упоминание в позитивном или негативном смысле, «за» или «против» интересующего нас объекта и т. д., а также когда нам надо ранжировать ряд упоминаний соответственно силе их оценок (т.е. в соответствии с тем, какое из них самое положительное, какое следующее за ним по положительности и т. д.). При этом исследователь нуждается в показателях достаточно тонких, которыми можно было бы измерять не только настроения политических субъектов, но и силу этих настроений. Особенно трудным выполнение этой задачи является в исторических, историко-философских и психологических исследованиях, поскольку предполагает высокий уровень гуманитарной подготовки специалистов, использующих методику контент-анализа. Существует множество методов, облегчающих принятие такого решения. В некоторых случаях они опираются на суждения группы арбитров (экспертов) о значении или силе (интенсивности) некоторого термина. В качестве примера таких приемов можно привести метод Q-сортировки и шкалирование методом парного сравнения.[8] На рубеже XX-XXI вв. специалисты по применению математических методов в исторических исследованиях много внимания уделяли разработке специальных компьютерных экспертных систем (в рамках идеологии Искусственного Интеллекта). Помимо слов, тем и других элементов, обозначающих содержательную сторону сообщений, существуют и иные единицы, позволяющие проводить качественный или, как он ещё называется, структурный контент-анализ. В этом случае исследователя интересует не столько что говорится, сколько как говорится.

28. Представление и интерпретация результатов контент-анализа текстов СМИ. Кодирование данных при контент-анализе обычно осуществляется с помощью достаточно простых анкет или компьютерных программ, в которых фиксируется каждое появление в анализируемом тексте искомой единицы. (Проблема подготовки кодировщиков, очень важная в практическом плане, в настоящей статье не затрагивается.) Эта элементарная схема может быть усложнена многими разными способами. Прежде всего, наборы единиц с сопоставленными им количественными оценками, как правило, сопоставляются с другими количественными оценками тех же единиц. Это могут быть, например, результаты подсчета частотности упоминания одних и тех же тем для различных выпусков одного и того же печатного издания или одной и той же регулярно выходящей в эфир новостной программы (временные ряды); результаты аналогичного подсчета для различных изданий/программ или, скажем, обобщенных категорий изданий. Очевидно, что такие данные могут быть представлены с помощью разнообразных графических средств – диаграмм, графиков и т.д., обеспечивающих наглядность. Наглядность, следует заметить, важна не только для аналитика: наглядная диаграмма или впечатляющий график обладают большим потенциалом воздействия, особенно в обществе, привыкшем с почтением относиться к естественнонаучному инструментарию. Классификации зачастую бывают многомерными, и для представления это также могут использоваться различные формальные средства. На практике результаты контент-анализа чаще всего представляются рядами диаграмм, столбчатых или круговых, хотя понятно, что в распоряжении контент-аналитика имеется все разнообразие средств представления количественных данных. А также и качественных: для отображения отношений между единицами контент-анализа и результатов их категоризации используются такие стандартные средства отображения структур, как различные графы. Квантификация данных, естественно, создает необходимые предпосылки для применения к ним средств математического анализа. Помимо анализа частотного распределения, к ним относится анализ различного рода корреляций между переменными, ассоциаций, анализ сопряженности, кластерный анализ. Разумеется, весь этот инструментарий должен применяться корректно. Если при определении единиц контент-анализа и идентификации их в тексте добиться полной объективности возможно лишь в некоторых (как правило, не самых интересных) случаях, то при экспликации и обработке данных обеспечить следование строгим стандартам вполне возможно. Содержательная интерпретация результатов зависит от целей анализа; она является прежде всего творческим актом, результаты которого во многом предопределены политологической квалификацией и интуицией аналитиков. В ходе контент-аналитического исследования как для анализа текста, так и для последующей обработки его результатов может использоваться вычислительная техника. Второй тип использования не вызывает особых проблем: после квантификации, т.е. перевода данных в числовую форму, их математическая и, в частности, статистическая обработка может осуществляться многими разными программными средствами, в том числе стандартными статистическими пакетами типа SPSS. При анализе текста и последующем сохранении результатов этого анализа в базах данных могут использоваться специальные программы, предназначенные для целей лингвистических исследований. В частности, анализ метафорики в русских политических текстах велся с помощью разработанной в Институте русского языка РАН программы Dialex, способной осуществлять составление частотных словарей и конкордансов, а также поиск лексических единиц с их контекстами и сохранять его результаты в базе данных; в настоящее время завершается работа над более совершенной системой, предназначенной для решения тех же задач. Некоторая подсистема контент-анализа входит составной частью в отечественную систему прикладного анализа текстов ВААЛ. Имеется также ряд зарубежных контент-аналитических компьютерных систем, а также систем, потенциально применимых для целей контент-анализа – такова, в частности, система KEDS, разработанная Ф.Шродтом в Канзасском университете и используемая для анализа потока политических событий, отображаемых на ленте информационного агентства «Рейтер».

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]