Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
15-09-2015_20-18-46 / 6. Контент-анализ.docx
Скачиваний:
31
Добавлен:
04.02.2016
Размер:
44.67 Кб
Скачать

6.3. Особенности компьютерного контент-анализа сми

В последние годы появилось много специальных компьютерных программ для проведения контент-анализа газетного текста. Их главная особенность состоит в том, что исходным материалом для обработки являются не числовые данные, а текстовые документы.

Одна из наиболее распространенных программ компьютерного контент-анализа — KWALITAN. Она представляет собой прикладной программный пакет, работающий в операционной системе MS-DOS, занимающий 640 КБт памяти и предназначенный для количественно-качественного исследования текстовых документов.

При работе с программой KWALITAN особое внимание уделяется подготовке исходных текстов. Исходный текст может состоять как из одного цельного текстового документа, так и из нескольких отдельных документов, связанных темой исследования. Для того, чтобы исходный текст мог обрабатываться на компьютере, он должен быть преобразован в рабочий файл программы KWALITAN. От того, как будет создан рабочий файл, во многом зависит результат исследования. При этом рабочий файл программы формируется по следующим критериям:

1. Исходный текст разбивается на документы, которым присваивается имя и порядковый номер.

2. Документы, в свою очередь, разбиваются на сегменты. Сегментом является логически цельный раздел документа, который может быть выделен в самостоятельный объект. Сегменту автоматически присваивается порядковый номер внутри документа.

3. Каждому документу присваивается идентификационный код. В отличие от имени документа, код содержит более развернутую информацию о документе, а также может “обслуживать” разные документы.

4. Исходный текст сохраняется на диске в виде ASCII — файла и с этого момента именуется как рабочий файл программы KWALITAN.

Далее программа представляет возможность для определения и описания ключевых слов каждого сегмента текста. Ключевое слово — это единичное слово или словосочетание, несущее основную смысловую нагрузку в данном текстовом отрезке. Для каждого сегмента текста программа позволяет ввести до 25 ключевых слов, состоящих не более чем из 20 символов.

Программа создает своеобразную библиотеку из ключевых слов и сохраняет ее в отдельном файле. Если при описании нового сегмента встречается уже упомянутое ключевое слово, оно может быть выведено автоматически из библиотеки.

При проведении анализа возникает необходимость сортировки исходных данных с помощью специальных фильтров. Программа KWALITAN предоставляет 5 фильтров для группировки внутри рабочего файла:

— по ключевым словам;

— по словам непосредственно из текста сегментов;

— по номеру документа;

— по номеру сегмента;

— по идентификационному коду сегмента.

В случае определения фильтра по словам возможно применение логических операций “и”, “или”, “не”. Только проведя все предварительные операции с исходным текстом, можно приступать к процедурам получения статистических результатов.

Предварительные операции с исходным текстом являются одновременно и лингвистическими операциями по преобразованию, а значит, и анализу текста. Здесь первоначальной задачей является выбор ключевых слов. 25 предлагаемых программой позиций для ключевых слов, каждого речевого сегмента позволяют не только обозначить каждый блок информации, но и сделать другие пометки, например, характеризовать тип общения, жанр, тип аргументации, характер модальности, т. е. некоторые из категорий, которые используются сегодня в контент-анализе. Далее программа позволяет связать ключевые слова по каждому содержательному аспекту по всем абзацам и описать их с учетом протяженности, функциональной целостности и взаимодействия.