- •Специализированное программное обеспечение.
- •1. Типы и уровни специализированного программного обеспечения для историков.
- •2. Система kleio.
- •Kleio - система обработки данных исторических источников (краткое изложение основных принципов).
- •Дом, Квартира, Семья, Муж-Жена-Ребенок
- •Правила замены пропущенных данных.
- •3. Программа FuzzyClass.
- •4. Программа QualiDatE.
- •5. Система CensSys.
- •6. Система socrates.
2. Система kleio.
Источнико-ориентированная система управления базами данных KLEIO по своей идеологии в первую очередь ориентирована на работу с неструктурированными текстами, например, источниками по средневековью. KLEIO проводит три основных принципа в подходе к историческому источнику: контекстной чувствительности (т.е. учета контекста), размытости (нечеткости) данных и многомерности связей элементов источника.
KLEIO использует в качестве базовой единицы понятие элемента или элементарной информации; элементы содержатся в структурах, которые являются весьма нерегулярными и часто могут быть описаны как иерархические. Например, изучая описи имущества, удобно каждый тип собственности рассматривать отдельно, как отдельный объект (сущность), имеющий отличный от других объектов набор атрибутов (например, "размер" и "расположение" в противоположность "количеству" и "цвету"). С другой стороны, все типы имущества обладают таким важнейшим атрибутом, как "стоимость", и для целей "стоимостного" анализа наверняка придется потратить много времени на соединение разных типов объектов в один тип.
KLEIO базируется на оригинальной модели данных, тесно связанной с понятием семантической сети:
• Каждый из объектов в базе данных (называемый группой) может включать произвольное подмножество всех элементов базы данных. Теоретически возможна база данных, состоящая из групп лишь одного типа, каждый из экземпляров которой состоит, однако, из полей, не встречающихся ни в одном из прочих экземпляров.
• Каждая группа может быть связана с произвольным числом других групп - как в той же базе данных, так и в других.
• Если группы двух различных типов включают элемент с данным именем, система автоматически осуществляет нечто вроде их "неявного соединения".
• Поскольку многие исторические источники имеют неявную иерархическую структуру, то иерархические отношения являются для системы наиболее важными и для них предусмотрено немало средств, переводящих иерархию в отношения более общего типа.
Между традиционными структурами данных и теми, что описаны выше, существует огромное различие. Например, в рамках реляционной модели процесс создания базы данных можно сравнить с заполнением некоторых предварительно разработанных форм. По существу, создание этих форм и их последующее заполнение есть не что иное, как создание некоего нового, не существовавшего до того источника. Поэтому, отбрасывая какой-либо элемент информации, не вошедший в реляционную структуру, историк должен иметь в виду, что это может исказить или разрушить какие-то связи, важные для понимания других частей источника. KLEIO в этом отношении является настолько гибкой системой, что ее можно адаптировать к специфике каждого конкретного источника.
Процесс создания базы данных в системе KLEIO выглядит примерно следующим образом: исследователь знакомится с источником, затем переводит в машиночитаемый вид небольшой его фрагмент, используя синтаксис, который понимает система, и создавая словарь (списки объектов и полей). Когда накапливается достаточный словарь, система сможет прочитать часть источника, которую перевел для нее человек. Важно, что описание структуры данных в KLEIO по существу никогда не завершается, т.к. можно включать дополнительные элементы непосредственно во время ввода данных без явного изменения описания базы.
Описанный подход к созданию базы данных можно назвать, по выражению М.Таллера, "переводом или редактированием источника для читателя-нечеловека". По существу, подход, используемый KLEIO, моделирует работу историка с источником в рамках традиционного метода при наличии проблем интерпретации отдельных фрагментов текста этого источника. При традиционном методе историк, работая с полным текстом источника, фиксирует все его особенности и собственные предположения о значении отдельных фрагментов источника. Именно такую модель KLEIO и пытается реализовать на компьютере: например, для всех упомянутых проблемных областей, т.е. для хронологии, денежных систем, систем мер и весов, сравнения имен, система содержит базовые алгоритмы оперирования с информацией такого рода, причем имеется возможность выбора специфических правил интерпретации значений, верных для каждого конкретного региона и периода времени.
В рамках описанной источнико-ориентированной методики существуют два различных подхода к переводу исторического источника в память компьютера. Первый из них обычно называют структурированным, он подразумевает, что исследователь присваивает в качестве значений отдельных полей в базе данных различные фрагменты данных из источника. В этом случае сохраняется семантика текста, но не синтаксис, так как в текст вносятся специальные метки. При втором подходе, который называется предиздательским, сохраняются и семантика источника, и его синтаксис. Это особенно важно, потому что позволяет совместить публикацию источника с подготовкой того же текста к компьютерной обработке (о чем уже упоминалось при сравнении источнико-ориентированной подготовки данных к анализу с подготовкой издания текста для читателя - не человека).
Идея подготовки электронного издания органична для источнико-ориентированного подхода, при котором структура базы данных неразрывно связана с полной транскрипцией исходного текста. Доступные и легко воспроизводимые факсимильные репродукции рукописных источников в электронных архивах могли бы в корне изменить понятие публикации. Традиционная форма издания рукописных источников подразумевает их воспроизведение в форме транскрипции, являющейся результатом научной интерпретации и сопровождаемой необязательным факсимильным воспроизведением и различного рода справочным аппаратом. Основным недостатком такого издания является его статичный характер, т.к. опубликованная интерпретация источника уже не может изменяться. "Электронная публикация" будет иметь динамический характер, причем с самого начала процесса исследования машиночитаемый текст источника можно предоставлять другим ученым.
Наконец, приведем исчерпывающее определение KLEIO, данное М.Таллером:
"В KLEIO работа с историческим источником осуществляется путем по возможности буквального переписывания различных фрагментов его, сопоставленных отдельным элементам базы данных. Все знания о значении переписанных фрагментов хранятся отдельно - в том слое системы, который специально посвящен управлению знаниями. Любой запрос пользователя, любая команда доступа к записанным данным источника интерпретируется в соответствии со знаниями об источнике, хранимыми в машине. Визуальная репродукция транскрибированного источника хранится в базе данных; фрагменты его могут воспроизводиться на подходящем устройстве вывода. После того как репродукция части источника выбрана и выдана на экран, она может быть модифицирована подсистемами, включающими весь спектр средств обработки изображений."
Таким образом, можно представить последовательность работы с источником, реализуемую KLEIO, в виде следующей схемы:
Пользователь
Программное обеспечение
База знаний
Транскрипция источника
Оцифрованное изображение источника.
