
- •Предисловие
- •Введение
- •Основные методы математической статистики
- •Основные понятия теории статистического оценивания
- •Основные понятия теории статистической проверки гипотез
- •Пакет statistica
- •1.1. Основные статистические характеристики
- •1.1.1. Меры среднего уровня
- •1.1.2. Меры рассеяния
- •1.2. Частотные распределения
- •1.2.1. Частотные распределения количественных признаков
- •1.2.2. Частотные распределения качественных признаков
- •1.3. Визуализация данных
- •1.4. Категоризованные распределения 1
- •Вопросы
- •Задания
- •Глава 2 выборочный метод
- •2.1. Нормальное распределение
- •2.2. Основные понятия выборочного метода
- •2.3. Ошибки выборки
- •2.4. Точность и надежность выборочного метода. Доверительный интервал
- •2.5. Определение объема выборки
- •2.6. Статистическое оценивание доли качественного признака
- •Вопросы
- •Задания
- •Глава 3 статистическая проверка гипотез
- •3.1. Основные понятия
- •3.2. Критерии для средних
- •3.2.1.Критерий для сравнения групповых средних
- •3.3. Критерии согласия
- •3.3.1. Сравнение эмпирического и теоретического распределений
- •3.3.2. Проверка нормальности распределения с помощью коэффициентов асимметрии и эксцесса
- •Вопросы
- •Задания
- •4.1.1. Построение диаграмм рассеяния
- •4.1.2. Построение уравнения линейной регрессии
- •4.1.3 Коэффициент корреляции
- •4.1.4. Проверка гипотезы о значимости коэффициента корреляции
- •4.1.5. Коэффициент детерминации
- •4.2. Множественная корреляция и регрессия
- •4.2.1. Визуализация множественной зависимости в пространстве трех переменных
- •4.2.2. Уравнение множественной регрессии
- •4.2.3. Проверка значимости в регрессионном анализе
- •4.2.4. Корреляции в модели множественной регрессии
- •Вопросы
- •Задания
- •Глава 5 анализ взаимосвязей качественных данных
- •5.1. Типы качественных данных
- •5.2. Взаимосвязь ранговых качественных данных
- •5.3. Взаимосвязь номинальных качественных данных
- •5.3.1. Таблицы сопряженности
- •5.3.2. Критерий значимости связи качественных признаков. (Проверка гипотезы о независимости признаков по таблице сопряженности 1)
- •5.3.3. Коэффициенты взаимосвязи качественных признаков
- •5.3.4. Бинарные признаки. Четырехклеточные таблицы
- •Вопросы
- •Задания
- •6.1. Кластерный анализ
- •6.1.1. Агломеративно-иерархический метод
- •6.1.2. Метод k-cредних
- •6.2. Гибкая классификация: использование нечетких множеств
- •Вопросы
- •Задания
- •Глава 7 факторный анализ
- •7.1. Общее описание
- •7.1.1. Факторные нагрузки
- •7.1.2. Факторные веса
- •7.2. Метод главных компонент
- •7.3. Факторный анализ как способ классификации
- •Вопросы
- •Задания
- •8.1. Первичный анализ динамики
- •8.1.1. Характеристики скорости и интенсивности изменения временного ряда
- •8.1.2. Средние характеристики временного ряда
- •8.2. Анализ временных рядов
- •8.2.1. Составляющие временного ряда
- •8.2.1.1. Временной тренд
- •8.2.1.2. Анализ остатков после удаления тренда
- •8.2.1.3. Сезонная составляющая
- •8.2.1.4. Анализ остатков после выделения сезонной составляющей
- •Вопросы
- •Задания
- •2. Основные показатели общего уровня развития стран в 1987 году (файл tab_1987.Sta)
- •3. Численность занятых в обрабатывающей промышленности ссср и сша в 1987 г. (тыс. Чел.) (файл workers.Sta)
- •4. Сопоставление производительности труда в обрабатывающей промышленности ссср и сша в 1987 г. (по товарной продукции) (файл product1.Sta)
- •5. Годовая квартирная плата в городах России за квартиру в 1-3 комнаты * (файл apartmen.Sta)
- •7. Данные об объеме внешней торговли и численности населения по 16 странам мира в 1938 г. (файл trade.Sta)
- •9 Динамика внп, занятости и производительности труда в народном хозяйстве ссср (файл econ.Sta)
- •10. Продолжение
- •10. Продолжение
- •12. Динамика поденной платы строительных рабочих в Санкт-Петербурге и индекса цен с 1853 по 1913 гг. (файл wages.Sta)
- •13. Валовая добыча угля в некоторых угольных бассейнах Российской империи, 1887-1913 гг. (тыс. Тонн) (файлы coal.Sta, coal.Xls)
- •14. Вывоз хлопка из Средней Азии, со станций ж.Д., 1902-1908 гг. (в тыс. Пудов) (файл cotton.Sta)
- •15. Сводные данные об аграрном развитии 50 губерний Европейской России на рубеже XIX-XX вв. (файл typol.Sta)
- •15. Продолжение
- •16. Урожайность хлебов в России и других странах в 1913 г. (пудов с десятины) (файлы harvest.Sta, harvest))
- •17. Урожай хлебов в 64 губерниях Европейской России, 1890-1913 гг. (в тыс.Пудов) (файл harvest1.Sta)
- •18. Факторы урожайности (погодный индекс, обрабатываемая площадь, мощность двигателей) в ссср в 1925-1940 гг. (файл hunter.Sta)
- •Социально-политическая история
- •19. Итоги выборов в Учредительное собрание по избирательным округам (число голосов) (файл uchred.Sta)
- •19. Продолжение
- •19. Продолжение
- •20. Социально-экономические показатели и результаты голосования по выборам в Учредительное Собрание в 1917 г. По уездам Тамбовской губернии (файл tambov.Sta)
- •21. Социальные движения в городах Италии в XIV в. Матрица экспертных оценок показателей (файл bragina.Sta)
- •22. Распределение случаев выступлений по формам борьбы в "приговорном" и остальной части крестьянского движения в 1905-1907 гг. В Воронежской и Самарской губ. * (файл bukhovez.Sta)
- •Социальная история, история культуры
- •23. Криминальная статистика сша (данные XIX – начала XX вв.) (файл criminal.Sta)
- •24. Распространенность заразных болезней в России в 1912 г. (чел.) (файл deseases.Sta)
- •25. Грамотность населения в России (в тыс.) (файл edu_1897.Sta)
- •26. Динамика уровня образования населения республик ссср за 1959-1979 гг. (файл educat.Sta)
- •27. Распределение учащихся учебных заведений Мèнистерства народного просвещения по вероисповеданиям и сословиям на 1 января 1914 года (ôайл religsoc.Sta)
- •27. Продолжение.
- •28. Распределение книг, вышедших в 1913 г., по видам изданий и содержанию (файл books1.Sta)
- •29. Распределение книг, вышедших в 1913 г., по языкам (файл books2.Sta)
- •Историческая демография
- •30. Число этнически смешанных семей в республиках ссср (1959-1979 гг.; на 1000 семей) (файл mixture.Sta)
- •31. Средний размер семьи в республиках ссср (1959-1979 гг., чел. *) (файл family.Sta)
- •32. Динамика естественного прироста населения республик ссср (на 1000 человек населения) * (файл populat.Sta)
- •33. Распределение новобранцев русской армии, призванных в 1911 году, по росту (файл novobr.Sta)
- •34. Численность населения сша в 1902-1914 гг. (тыс. Человек) (файл us_popul.Sta)
- •35. Численность населения России (млн. Человек) (файл rus_pop.Sta)
- •"Большие таблицы", представленные в виде файлов электронного архива Лаборатории исторической информатики кафедры источниковедения исторического факультета мгу
Исторический факультет Московского государственого университета им. М.В. Ломоносова
КОМПЬЮТЕРИЗОВАННЫЙ СТАТИСТИЧЕСКИЙ АНАЛИЗ ДЛЯ ИСТОРИКОВ
Учебное пособие
Под редакцией Л.И. Бородкина, И.М. Гарсковой
МОСКВА
1999–2009
ББК 63.3 (2) 521
В 75
Авторы:
Е.Б. Белова, Л.И. Бородкин, И.М. Гарскова, Т.Ф. Изместьева, В.В. Лазарев, А.И. Тихонов
Компьютеризованный статистический анализ для историков / Под ред. Л.И. Бородкина и И.М. Гарсковой. – М.: 1999. – 187 с.: илл.
Пособие представляет собой методический материал по второй части курса "Информатика и математика", который читается студентам исторического факультета Московского государственного университета им. М.В. Ломоносова. В пособии дается изложение основных понятий и методов математической статистики и анализа данных, адаптированное с учетом опыта применения этих методов в исторических исследованиях. Большое внимание уделяется компьютерной реализации этих методов. Изложение иллюстрировано многочисленными примерами, основанными на материалах исторических источников и результатах исследований историков-квантификаторов. Каждая глава пособия завершается списком контрольных вопросов и заданий. Самостоятельную ценность представляет обширное приложение, содержащее около 40 таблиц статистических данных, которые могут использоваться для самостоятельной работы студентов и выполнения контрольных заданий
Пособие ориентировано не только на студентов-историков, но и на других читателей, интересующихся применением статистических методов в исторических исследованиях.
Рецензенты:
д.и.н., проф. С.Г. Кащенко,
д.т.н., проф. Е.В Бауман
ISBN 5-204-00125-5 © Коллектив авторов, 1999
© Исторический факультет МГУ, 1999
Предисловие
Преподавание статистических методов на исторических факультетах имеет уже достаточно длительную традицию. Так, студентам-историкам Московского университета эта дисциплина преподается (по инициативе И.Д. Ковальченко) уже около 30 лет. С начала 1980-х годов занятия со студентами-историками по курсу "Основы математической статистики" включали элементы практикума на ЭВМ, когда с помощью удаленных терминалов, расположенных на историческом факультете, удавалось использовать возможности парка "больших" машин университетского вычислительного центра для обучения студентов статистическим методам 1. Ситуация начала резко меняться в лучшую сторону на рубеже 80-х – 90-х годов, в связи с приходом "микрокомпьютерной волны". Появление на историческом факультете компьютерных классов создало новые возможности. Их реализации способствовало и то обстоятельство, что разработанные в середине 90-х гг. новые образовательные стандарты включали и цикл "Информатика и математика", обязательный для студентов исторических специальностей в университетах РФ.
Сейчас цикл дисциплин "Информатика и математика" на историческом факультете МГУ преподается студентам непосредственно после курса "Количественные методы в исторических исследованиях", читаемого в III семестре. Цикл "Информатика и математика" рассчитан на два семестра (программа цикла включена в homepage исторического факультета МГУ – http://www.hist.msu.ru). Лекции сопровождаются практическими занятиями; оба практикума были поставлены в 1991 г. и непрерывно совершенствуются на протяжении 90-х гг. 2
Курс математики является второй частью цикла "Информатика и математика". Этот курс специально ориентирован преимущественно на использование статистических методов и методов анализа данных в работе историка; здесь также затрагиваются методические вопросы математического моделирования исторических процессов и явлений. Курс включает лекции и практические занятия и завершается экзаменом.
В центре внимания практикума по данному курсу находятся методы математической статистики и анализа данных. Несколько особняком стоит последний раздел, посвященный математическому моделированию в социальных науках, и, в частности, в исторических исследованиях. В этой части курса студенты знакомятся с аналитическими, статистическими и имитационными моделями, обсуждают проблемы их адекватности, верификации, оценки параметров, а также корректности полученных на их основе содержательных результатов.
Курс ориентирован на учет специфики гуманитарного образования. Так, при изложении математических понятий и методов основное внимание уделяется их логической структуре. Обсуждение принципов построения математических моделей и статистических теорий проводится с учетом ограничений, порождаемых особенностями социально-гуманитарного знания.
Курс математики (с акцентом на методы статистики) для историков имеет свою специфику также и в том, что иллюстративный, учебный материал и тестовые задания базируются на фрагментах реальных источников. Кроме того, преподаватели и в постановке задач обычно выделяют наиболее характерные типы исследовательских проблем, с которыми сталкиваются историки (например, построение типологии или изучение динамики и т.д.).
Далее, помимо стандартных методов, которые есть практически в любом пакете статистических программ, в данном курсе имеется и компонента, методически ориентированная на особенности задач, возникающих в социально-гуманитарных исследованиях. Здесь можно назвать задачи многомерной нечеткой классификации (для решения которых используется оригинальное программное обеспечение, разработанное в Лаборатории исторической информатики) или задачи моделирования динамики исторических процессов с использованием методов теории самоорганизующихся систем (пока эта проблематика изучается на демонстрационном уровне).
Вновь подчеркнем, что методика преподавания курса особое внимание уделяет не чисто математическим аспектам, а скорее вопросам логики и корректности применения тех или иных методов, т.е. умению выбирать методически верные способы решения конкретных исследовательских проблем, работая со стандартными пакетами статистических программ. Практические занятия ведут сотрудники Лаборатории исторической информатики в компьютерных классах исторического факультета, оснащенных современными компьютерами, соединенными в локальную сеть. Практические задания студенты выполняют, работая преимущественно в пакете STATISTICA.
Методическое пособие, предлагаемое вниманию читателя, состоит из введения, восьми глав (4 частей) и приложения.
Введение написано Л.И. Бородкиным и И.М. Гарсковой, главы 1, 4 и 5 – Е.Б. Беловой, И.М. Гарсковой и В.В. Лазаревым, главы 2 и 3 – И.М. Гарсковой, главы 6 и 7 – Л.И. Бородкиным и И.М. Гарсковой, глава 8 – Т.Ф. Изместьевой. Материалы для приложения подготовлены при участии А.И. Тихонова.