
- •Введение
- •Рабочая программа курса1
- • Литература
- •Вопрос 2. Классификация исторических источников, принятая в исторической информатике.
- •Программное обеспечение для анализа различных типов исторических источников
- •Тема 2. Электронные таблицы – программное обеспечение для анализа статистических и структурированных исторических источников
- •Вопрос 1. Преимущества электронных таблиц.
- •Вопрос 2. Семейство электронных таблиц
- •Тема 3. Основные понятия и приемы работы в электронных таблицах ms Excel.
- •Вопрос 1. Введение в электронные таблицы ms Excel.
- •Вопрос 2. Структура экрана.
- •Вопрос 3. Основные понятия.
- •Вопрос 4. Ячейка, понятие адресации.
- •Вопрос 5. Графические возможности.
- •Вопрос 6. Расчетные операции.
- •Вопрос 7. Основные манипуляции с таблицей.
- •? Вопросы для самоконтроля
- • Лабораторные работы
- •Создание и редактирование файла электронных таблиц
- •Вычисления и статистические расчеты (Часть 1)
- •Вычисления и статистические расчеты (Часть 2)
- •Графические возможности электронных таблиц
- •Решение некоторых источниковедческих проблем
- •Ms excel как база данных
- •Анализ данных (Часть 1)
- •Анализ данных (Часть 2)
- •Работа с географической картой
- • Задания для самостоятельной работы
- • Тест Выберите правильный ответ, поставив флажок
- •3. Ms Excel отличает текст от формулы при помощи знака,
- •Продолжите ответ.
- •Вопрос 2. Машиночитаемые данные, источники.
- •Тема 2. Базы данных в исторических исследованиях Беларуси
- •Вопрос 1. Особенности создания баз данных на материале исторических источников.
- •Вопрос 2. База данных " Лица, незаконно репрессированные".
- •Вопрос 3. Проект Базы данных по церковным метрическим книгам и подушным переписям населения.
- •Структура бд по церковным метрическим книгам и подушным переписям населения
- •Вопрос 4. База данных по исторической географии Беларуси.
- •Вопрос 5. Базы данных к 28-му тому Литовской Метрики.
- •Вопрос 6. Базы данных по материалам "Пописов Войска Великого княжества Литовского".
- •Вопрос 7. Базы данных по "Тарифам подымного налогообложения".
- •Вопрос 8. Полоцкая просопографическая база данных.
- •Вопрос 9. Базы данных "Музеи Беларуси в зеркале периодики 1985–1995 гг." и "Архивы войны".
- •Вопрос 10. Базы данных архивов и музеев рб.
- •Тема 3. Базы данных в исторических исследованиях России и Украины, включая археологические базы данных
- •Вопрос 1. Базы данных в исторических исследованиях России.
- •Вопрос 2. Археологические базы данных России и Украины.
- •Тема 4. Основные понятия технологии баз данных. Субд ms Access
- •Вопрос 1. Базы данных: архитектура и модели данных.
- •Упорядочивать информацию по различным признакам и критериям;
- •Быстро извлекать выборки с произвольным сочетанием признаков.
- •Вопрос 2. Понятия реляционной алгебры.
- •Соответствие традиционных понятий, терминов реляционной алгебры и терминов систем управления базами данных.
- •Вопрос 3. Стандартные системы управления базами данных.
- •Вопрос 4. Структура экрана.
- •Вопрос 5. Принципиальная схема работы.
- •Вопрос 6. Объекты (базовые и производные).
- •Вопрос 7. Рсубд ms Access: режимы работы.
- •Вопрос 8. Организация данных.
- •Вопрос 9. Связи между таблицами.
- •Тема 5. Специальное программное обеспечение для историков kleio, tact, socrates, censsys, wincens)
- •Вопрос 1. Иерархическая источнико-ориентированная база данных kleio.
- •Вопрос 2. Полнотекстовая база данных таст.
- •Вопрос 3. Socrates, специализированная надстройка субд.
- •Вопрос 4. Система представления и анализа структурированных источников CensSys (WinCens).
- • Вопросы для самоконтроля.
- • Лабораторные работы
- •Структурирование информации. Создание базы данных
- •Проведение группировок и групповых вычислений. Импорт/экспорт данных
- •Категории налогоплательщиков
- •Создание отчетов и форм. Построение запросов с условием
- •Создание сложных запросов. Работа с гиперссылками
- •Автоматизация работы с базой данных
- • Задания для самостоятельной работы
- • Тест Выберите правильный ответ, поставив флажок
- •Поставьте в соответствие.
- •Продолжите ответ.
- • Терминологический словарь
- • Основные команды и операции
- •Основные действия при работе в Windows 98
- •Перечень основных действий при работе
- •Перечень основных действий при работе с субд ms Access
- • Экзаменационные вопросы и задания Вопросы к экзамену по курсу «Историческая информатика»
- •Экзаменационные задания по курсу “Историческая информатика”
- •Приложения
- •Основные повинности тяглых крестьян с волоки в имениях духовных и светских феодалов
- •Суадносіны асноўнай і прыемнай зямлі ў надзеле сялян Беларусі ў другой палове XVIII ст.
- •Склад казенных маенткаў і дзяржаўных сялян у 1837 г.
- •Колькасць духоўных маенткаў і сялян,
- •Колькасць вольных людзей у Беларусі і Літве
- •Склад і рассяленне аднадворцаў паводле іх перапісу 1842-1843 гг.
- •Колькасць і ўдзельная вага асноўных груповак сялян на Беларусі ў канцы XVIII - першай палове XIX ст.
- •Суадносіны рэнтных формаў цяглых сялян магнацкіх уладанняў захаду і цэнтра Беларусі ў другой палове XVI-XVIII ст.
- •Суадносіны рэнтных формаў цяглых сялян магнацкіх уладанняў усходу Беларусі ў другой палове XVII-XVIII ст.
- •Содержание
- •Тема1. Исторические источники, их классификация 12
- •Тема 2. Электронные таблицы – программное обеспечение 18
- •Тема 3. Основные понятия и приемы работы в электронных таблицах ms Excel. 20
- •220050, Минск, проспект Франциска Скорины, 4.
- •220030, Минск, ул. Красноармейская, 6.
Вопрос 2. Классификация исторических источников, принятая в исторической информатике.
В последние годы историки стали активно осваивать т.н. массовые исторические источники, которые характеризуют объекты действительности, образующие определенные общественные системы с соответствующими структурами и отражающие сущность и взаимодействие этих объектов (Ковальченко И.Д.) Примерами таких источников могут служить инвентари, переписи населения, анкетные данные и т.д.
Необходимость изучения массовых исторических источников, содержащих информацию о массовых процессах и явлениях, сохранившихся в большом количестве и имеющих в основном количественные показатели, заставила ученых обратиться к количественным методам анализа и новым информационным технологиям.
В 80-х – начале 90-х гг. XX в. появился термин "компьютерное источниковедение", отражавший роль новых технологий работы с историческими источниками. В середине 1990-х гг. сформировалась новая научная дисциплина — историческая информатика, в основе которой лежит совокупность теоретических и прикладных знаний, необходимых для создания и использования в исследовательской практике машиночитаемых версий исторических источников разных видов.
Учитывая возможности информационных технологий для создания, обработки и анализа исторических источников, последние были подразделены на 4 группы (авторы классификации Белова Е.Б., Бородкин Л.И., Гарскова И.М. и др.):
статистические источники;
структурированные;
текстовые, или нарративные (свободный текст);
изобразительные и картографические источники.
В основу этой классификации положены два критерия. Исторические источники, переведенные в электронную форму, представлены в текстовом и графическом формате (растровое или векторное изображение). Источники, имеющие текстовый формат, в зависимости от степени их формализации делятся на статистические, структурированные и нарративные.
Первыми в практике исторических исследований стали переводиться в машиночитаемый вид статистические источники, или источники статистического характера. Прежде всего, это таблицы статистических показателей (количественных данных), собранных по всем объектам некоторой совокупности (хозяйствам, губерниям, отраслям промышленности, группам населения и т.п.). Официальное происхождение большинства статистических источников во многом способствует их сохранности. Специалисты в области социально-экономической, социально-политической истории, исторической демографии и др. в своих исследованиях активно используют статистические источники (статистику численности населения, статистику промышленности и сельского хозяйства, статистику занятости, статистику транспорта, торговли и т.д.).
Историк может работать с различными видами статистических источников:
первичными данными статистических обследований (как правило, в виде архивных документов);
сводными данными, агрегированными на некотором уровне (как опубликованными, так и не опубликованными);
сводными машиночитаемыми данными (по существу их можно считать опубликованными, если они сданы в архив и к ним имеется доступ).
Чаще всего статистические источники, с которыми работает историк, относятся к одному из уровней: либо это первичные, либо агрегированные данные. Первичные данные чисто количественного характера (например, типа бюджетов) обычно не вызывают проблем: если все сведения источника являются числовыми, он чаще всего переводится в формат АSСII-файла, простой однотабличной базы данных, или электронной таблицы.
Вторым видом исторических источников, материалы которых хорошо формализуются и преобразуются в машиночитаемый вид, стали структурированные (документальные). В 1980–90-е гг. технология создания баз данных, используемая для обработки и анализа структурированных источников, достигла наибольшей популярности. Источники этого вида, как правило, имеют формуляр и часто называются формулярными. Они имеют стандартную форму записи информации и хорошо структурируются.
К таким источникам относятся материалы типа переписей, пописов, реестров, книг церковной или гражданской регистрации рождения и крещения, брака и венчания, смерти и погребения, личные дела, личные карточки, анкеты, справочники и т.д.
Основными особенностями структурированных источников являются соединение разнотипной информации (текстовой, числовой, логической и т.д.) в одном формуляре и отсутствие обобщенной информации.
Формуляр источника представляет собой практически готовую структуру базы данных – исследователю остается только описать признаки объектов, определить имена полей, т. е. их названия, их типы и размеры.
Среди баз данных (БД) по структурированным источниками традиционно выделяют просопографические базы данных. Просопографией называется изучение характерных черт определенных групп людей на основе их индивидуальных биографических данных. Эти данные в отличие от статичных анкет социологического обследования интересны тем, что содержат динамическую информацию, связанную с разными моментами в жизни человека. Примером просопографической БД может быть база, содержащая для каждого индивидуума три поля: имя, дату рождения, дату смерти. Просопографические исследования ведутся историками давно, особенно по средневековым источникам, а в последние время наблюдается явный всплеск интереса к просопографии. Это явление связано с тем, что такие источники почти идеально подходят для компьютерного анализа. Целый проект такого рода разрабатывается в Париже; аналогичная БД в Германии насчитывает более 15 тысяч записей; в СНГ есть такие базы по депутатам I Государственной думы; по высшему командному составу Советской Армии периода Великой Отечественной войны; преподавателям и студенчеству Полоцкой академии и Полоцкого иезуитского коллегиума.
Особый по уровню структурированности тип источников – неоднородные источники, такие, как завещания, описи имущества, деловые письма, другие документы с нестандартизированным содержанием. Они обычно содержат много фактических сведений об определенных людях или событиях. Их называют документами, включающими данные, и классифицируют как находящиеся между структурированными и текстовыми (нарративными) источниками. Очевидно, что в этих источниках существует некая нечеткая структура, например архивные реквизиты, дата создания документа, тип документа, имена людей с указанием "их ролей" в описываемом событии, в описании места и даты события. Все эти элементы включены в текст, из которого их можно выделить. На такого рода источнике – книге записей 28 Литовской Метрики – создана БД в Институте истории НАНБ.
Наиболее трудными для формализации и перевода в машиночитаемый вид являются нарративные источники (текстовые, повествовательные). Для таковых было разработано специальное программное обеспечение, учитывающее их специфику. Основной их особенностью является полное отсутствие в них структуры (если не считать, что текст естественным образом разбит на слова, предложения). Первыми поставили вопрос о полном сохранении текста источника специалисты по истории античности и средневековья, а также филологии. Банки данных текстовых источников существуют во многих странах; анализ таких источников чаще всего ведется на уровне лексики; для них строятся частотные словари. В настоящее время с помощью специального программного обеспечения из хранящегося текста можно извлекать информацию, предварительно внеся в текст специальные коды – проведя маркировку текста. Полнотекстовые системы индексируют слова текста, что ускоряет операции поиска, более того, позволяют легко найти и просмотреть нужный контекст.
Изобразительные источники – произведения изобразительного искусства, кинопроизведения и фотографии, источники, которые содержат информацию, переданную при помощи графических изображений, в том числе и картографические. Долгое время они играли второстепенную роль в исторических исследованиях, однако в последнее время ситуация заметно изменилась. Все более заметную роль в информационном обеспечении исторических исследований играют технологии оцифровывания изображений (картин, икон, схем, карт и т.д.), создания баз данных, содержащих наряду с описательной информацией об образах и оцифрованные изображения. Исследователи, изучающие самые различные исторические эпохи, все шире используют возможности геоинформационных систем, так как исторические явления и процессы, отраженные в источниках, происходили не только во времени, но и в пространстве. Созданные геомодели позволяют доказательно ответить на вопросы об основных этапах и направлениях заселения той или иной территории, закономерностях возникновения населенных пунктов разных территорий и т.д. Основным способом представления этих моделей является карта.
Таким образом, статистические источники, имеющие преимущественно числовую информацию, предпочтительнее переводить в машиночитаемый вид, проводить первичную обработку и анализ данных с помощью электронных таблиц. ЭТ позволяют визуализировать статистические данные — представить их на самых разнообразных графиках, помогают подготовить данные для последующей обработки в статистических пакетах.
Таблица 1