
- •Применения математики в исторических исследованиях
- •Сыктывкар 2014
- •Рабочая учебная программа
- •Учебная программа Тема 1. Группировки в историческом исследовании
- •Тема 2. Формы графического изображения. Визуализация статистических данных
- •Тема 3. Средние величины
- •Тема 4. Методы несплошного наблюдения. Выборочный метод
- •Тема 5. Корреляционный анализ
- •Тема 6. Математические методы исследования текстов. Контент анализ
- •Тема 4:
- •Урока по математике.
- •Цели урока:
- •План у р о к а :
- •Тема 4:
- •Урока по математике.
- •Цели урока:
- •План у р о к а :
- •Список литературы
Тема 6. Математические методы исследования текстов. Контент анализ
Теория: Наиболее обширную группу исторических источников составляют развернутые индивидуальные тексты. Письменный текст имеет статистическую структуру и определенные характеристики, в нем содержащиеся, могут быть описаны с помощью вероятностных законов. Таким образом, в случае необходимости нарративный источник можно превратить в массовый путем частотных, классификационных преобразований, т. е. методом контентанализа. Контентанализ складывается из двух основных этапов.
На первом, классификационном этапе, исходя из исследовательской цели и информативного потенциала источников, выделяется совокупность признаков, многократно встречающихся в документах. Здесь происходит формализация документа, вырабатывается не кое подобие анкеты.
На втором этапе решается вопрос "как считать?". В зависимости от характера количественных данных, от частотных классификаций, от группировок определяется процедура расчета показателей по разработанным математикостатистическим методам.На втором этапе решается вопрос "как считать?". В зависимости от характера количественных данных, от частотных классификаций, от группировок определяется процедура расчета пока зателей по разработанным математикостатистическим методам.
Рассмотрим некоторые примеры:
С помощью контентанализа О.Г.Буховец изучил содержание 72 приговоров и наказов политического характера, принятых крестьянами Самарской губернии в 19051906 гг. (См.Буховец О.Г. к методике изучения "приговорного" движения и его роли в борь бе крестьянства в 19051907 гг. //История СССР. 1979, N 3). Классификационный этап завершился формированием 30 катего рий требований. Подсчет частоты встречаемости каждой категории в тексте источника показал, что наиболее важными для кре стьян были: 1) амнистия политическим заключенным (73% документов), 2) установление демократических свобод ( 58 % ), 100 3) отмена смертной казни (43%), 4) упразднение земских начальников, полиции, стражников (39%) и т.д.
На основе математических методов получены полезные результаты при дешифровке текстов (например, в случае тайнописи или неизвестного языка написания), в области атрибуции памятника письменности, установления авторства. Использование теории информации в текстологии позволяет оценить число промежуточных списков, предшествующих данному.
Возможна реконструкция источника, его ранее утраченных фрагментов, очищение оригинального текста от более поздних наслоений. Однако, несмотря на накопленный опыт, множество методологических и методических проблем, связанных с измерением нарративных источников остаются нерешенными.
Область применения контентанализа: периодическая печать, мемуары, дневники, письма, летописи, агитационные материалы, философские тексты, анкеты, политические прошения и прокламации и др. Формализация информации документа: этапы, проблемы. Перевод текстовой информации в количественные показатели. Выбор математического метода. Явная и скрытая информация. Эффективность применения контентанализа.