Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
2 курс_ВСЕ_УМКИИ_Липницкая Попова.doc
Скачиваний:
16
Добавлен:
24.08.2019
Размер:
4.67 Mб
Скачать

Вопрос 2. Машиночитаемые данные, источники.

Сначала вспомним, что такое в историческом исследовании машиночитаемые исторические данные. В литературе встречаются понятия "машиночитаемые данные" и "машиночитаемые источники" для обозначения материалов источников, переведенных в "электронную" форму. Когда в машиночитаемую форму переводится часть информации, содержащейся в источнике, причем сознательно выбранная, то исследователь создает не машиночитаемую копию, а версию (модель) источника. В этой связи термин "машиночитаемые данные" является более корректным. Однако есть такие источники, машиночитаемые версии которых можно называть "машиночитаемыми источниками". Теперь уже во многих странах созданы банки и архивы "машиночитаемых данных". Библиотеки, архивы, исследовательские институты, музеи и т.п. создают все больше "машиночитаемых файлов данных" для хранения и вторичного использования. Помимо отдельных исследователей и исследовательских групп в процесс создания "машиночитаемых данных" все более активно включаются архивы. Так, весьма актуальной задачей становится перевод существующих в традиционной бумажной форме ценных, редких или плохо сохранившихся источников в машиночитаемый вид. Зачастую это является единственным средством не только продлить их жизнь, но и сделать их доступными широкому кругу исследователей.

Тема 2. Базы данных в исторических исследованиях Беларуси

План лекции:

  1. Особенности создания баз данных на материале исторических источников. Подходы к проектированию БД в исторических исследованиях.

  2. База данных "Лица, незаконно репрессированные".

  3. Проект Базы данных по церковным метрическим книгам и подушным переписям населения.

  4. База данных по исторической географии Беларуси.

  5. Базы данных к 28-му тому Литовской Метрики.

  6. Базы данных по материалам Пописов Войска Великого княжества Литовского.

  7. Базы данных по Тарифам подымного налогообложения.

  8. Полоцкая просопографическая база данных.

  9. Базы данных "Музеи Беларуси в зеркале периодики 1985-1995 гг." и "Архивы войны".

  10. Базы данных архивов и музеев РБ.

Вопрос 1. Особенности создания баз данных на материале исторических источников.

Зачастую вид исторического источника уже определяет и модель представления данных. Например, исследователь ставит перед собой задачу создания баз данных о некоторых персоналиях по массиву анкет, личных карточек или иных сведений, как принято говорить, "формулярного характера", т. е. уже имеющих табличную форму представления. Он находит в таком источнике готовую реляционную модель данных, и перед ним не стоит задача выбора адекватной СУБД. Этот выбор практически предопределен самим форматом исходных данных. Но представления об использовании информации этого источника могут не совпадать у разных исследователей. Например, должен ли конкретный пользователь строить базу данных по принципу полного использования всй информации источника или он может сделать более узкую, специализированную базу данных, включив туда только необходимую ему информацию? Ответ на него зависит от нескольких факторов, в том числе и от намерения представить свою БД для хранения и вторичного использования в архиве машиночитаемых данных, что побуждает учитывать интересы других возможных исследователей, и от оценки ресурсов, которыми исследователь располагает (материальные средства, время и т. п.). Можно выделить два подхода к проектированию БД в исторических исследованиях: от источника (source-driven) и от модели (model-driven). Они соответственно называются источнико-ориентированный и проблемно-ориентированный.

Проблемно-ориентированный подход реализуется в работе с высокоструктурированными источниками — однотипными массивами анкет, формуляров, бланков и др, в которых информация уже разбита на смысловые поля. Историку, который создает БД, остается только перенести практически все содержимое источника согласно его структуре на компьютерные носители, иначе говоря, конвертировать в машиночитаемый вид.