Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Краткий-курс-лекций-по-архивным-технологиям.docx
Скачиваний:
241
Добавлен:
21.03.2015
Размер:
6.56 Mб
Скачать

Краткий курс лекций Лекция 1.История механизации и автоматизации архивного дела: итоги и уроки.

План лекции.

1) Механизация, автоматизация, информатизация. Термины и определения.

2) Этапы механизации и автоматизации архивного дела.

3) Механизация и автоматизация архивного дела с конца XIX века до 1950-х годов.

4) Механизация и автоматизация архивного дела 1950 - первой половины 1970-х годов.

5) Механизация и автоматизация архивного дела второй половины 1970 - п.п. 1980-х годов.

6) Информатизация архивного дела за рубежом в 1960-80-е годы.

Процесс развития информационных технологий во второй половине XX часто сравнивают с тотальным взрывом, изменившим лицо мира, повлиявшим не только на все сферы деятельности человека, но и на лексику и моду. Скорость смены поколений техники, стремительная череда технологических революций превзошла самые смелые прогнозы. То, что вчера касалось новейшим достижением технического прогресса, сегодня уже достояние истории. И все же автоматизация архивного дела для нас не столько область истории науки и техники, музей устаревших технологий. Во-первых, архивист должен себе представлять все способы документирования, созданные человечеством, в том числе и связанные со считыванием информации машиной. Во-вторых, как мы убедимся ниже, несмотря на смену технологий, в информатизации архивного дела из год в год мы можем выделить одни и те же проблемы и ошибки, которые неразрешимы технологическим путем и требуют развития теории и методики архивоведения.

Итак, изучая историю механизации и автоматизации архивного дела, постараемся найти ответы на вопросы:

  • в какой мере информационные технологии повлияли на развитие теории и методики архивоведения?

  • какие уроки следует извлечь из опыта прошлого?

Под механизацией архивного дела мы будем понимать усовершенствование и рационализацию отдельных операций обработки архивных документов с помощью машин и механизмов. Так, механизация информационного поиска в архивах - использование в архивах информационных систем, осуществляющих многократный поиск в массиве специальных носителей информации, ускоренный с помощью механических приспособлений. Простейшие из них использовались в архивах еще в XVII –XIX вв. для подъема тяжестей, т. е. архивных документов. Транспортеры применялись для переноски документов из хранилище в хранилище или в читальный зал. В Межевом архиве в XIX в. использовались «передвижные алфавиты». С 1930-х годов в ведомствах СССР широко использовались «элеваторные картотеки», механические нумераторы для обозначения листов дел.

Под автоматизацией архивного дела мы будем понимать процесс усовершенствования технологий обработки архивных документов в результате применения в архивах машин-автоматов, максимально устраняющих ручной труд в ходе данной операции.

Под информатизацией архивного дела мы будем понимать более масштабный процесс внедрения в теорию и практику архивного дела теоретических и прикладных разработок информатики, а также эволюции архивных технологий в результате использования компьютерной техники и программного обеспечения.

Все три процесса могут осуществляются в архивах одновременно, поскольку служат для решения разных задач.

Механизация и автоматизация архивного дела тесно связана с двумя аспектами:

  1. историей эволюции вычислительной техники, математического (программного), лингвистического обеспечения и носителей информации.

  2. изменением роли автоматизированных технологий в развитии архивного дела.

Техническое обеспечение – совокупность механических, электромеханических устройств, электронно-вычислительных машин, периферийных устройств (принтеры, сканеры, стриммеры, плоттеры и др.) средств коммуникации (аппаратного обеспечения локальных и глобальных сетей), применяемых в архивах.

Математическое (программное) обеспечение – алгоритмы и специализированные прикладные программы для ЭВМ, созданные для обработки информации и усовершенствования архивных технологий.

Лингвистическое обеспечение – совокупность искусственных информационно-поисковых языков (ИПЯ) различных видов, используемых в архивных информационно-поисковых системах (кодовые таблицы, таблицы дескрипторов, глоссарии, информационно-поисковые тезаурусы).

Носители информации – материальные объекты, содержащие запись информации в форме, понятной для считывания и обработки с помощью механических, электромеханических устройств и ЭВМ.

Исходя из этих важнейших факторов, в истории механизации и автоматизации архивного дела можно выделить четыре больших периода:

1) с конца XIX века до 1950-х годов;

  1. 1950 - первой половины 1970-х годов (в данном периоде мы можем выделить два этапа: 1950-1960-е гг.; первая половина 1970-х годов);

3) период второй половины 1970-х годов - первой половины 1980-х годов;

  1. период второй половины 1980-х -1990-х годов – современный этап.

Предметом нашего рассмотрения в этой лекции будут первые три периода.

Время с конца XIX века до 1950-х годов характеризуется эпизодической механизацией делопроизводства и ведомственных архивов на основе работы с матричными носителями информации, созданием первых хранилищ для временного хранения машиночитаемых документов.

Период 1950-первой половины 1970-х годов характеризуется механизацией и автоматизацией работы ведомственных и государственных архивов, созданием учетных и поисковых автоматизированных систем, появлением наряду с матричными магнитных и оптических носителей информации, электромеханических устройств и ЭВМ, повсеместным созданием АСУ на уровне предприятия, республиканском и отраслевом уровне и созданием сети ведомственных архивов машиночитаемых данных - ВЦ и ГВЦ. При этом первая половина 1970-х гг. может рассматриваться как отдельный этап благодаря внедрению в начале 1970-х гг. ЕГСД и созданию ОГАС. В результате АСУ охватили все союзные и союзно-республиканские министерства и ведомства, что, в свою очередь, вызвало лавинообразный рост количества машиночитаемых документов.

Период второй половины 1970-х годов - первой половины 1980-х годов характеризуется преобладанием магнитных носителей информации и ЕС ЭВМ, созданием межархивных АИПС, а также формированием теоретических основ архивоведения машиночитаемых документов.

Начнем наш экскурс с рассмотрения носителей информации. На первых этапах своей истории средства механизации не позволяли непосредственно воспринимать информацию архивных документов и справочников, поэтому переход к механизированному поиску был связан с переводом документов из человекочетаемой формы в форму, пригодную для считывания машиной. Для этого информацию воспроизводили в виде физических состояний: отверстий, сочетания цветов, позже - электромагнитных соединений. Поэтому для каждой информационной системы создавались специальные носители информации. Матричными называют носители, воспроизводящие кодированную информацию на специальных таблицах – матрицах (программирующих различные, физические состояния - пробивки, магнитные импульсы). По мнению К.Б. Гельмана-Виноградова, все основные разновидности как машиночитаемых документов на матричных носителях информации, так и технических устройств по их обработке, были опробированы и классифицированы еще в 1920-е годы.9

Матричные носители информации разделяют на машиночитаемые и человекочитаемые. Матричные носители информации имели следующие характеристики: физический объем (размеры), объем информации (максимальная емкость кода для данного вида перфорирования), компактность.

Перфокарта – карточка из плотной бумаги или (позднее) из пластического материала), на которой проставляются отверстия или вырезы.

В перфокартах с предварительной перфорацией отверстия вырезаны заранее. В них при кодировании специальным краевым компостером прорезались щели. В перфокартах с последующей перфорацией отверстия прорезались непосредственно в ходе кодирования информации, как правило специальной машиной-перфоратором.

В механических и полуавтоматических перфокартотеках использовались перфокарты с краевой перфорацией (см. рис. 1) (содержащие один или два ряда отверстий по краю). Отверстия нумеровались. В центральной части перфокарты можно было поместить традиционное описание документа.

Щелевые или шлицевые перфокарты содержали десять и более рядов отверстий в нижней части карты. При перфорировании щели соединяли находящиеся рядом отверстия.

В перфокартах этих видов на каждой карте кодируется один документ, дело или элемент информации (в зависимости от вида ИПС). Часть карты, лишенная отверстий, служила для традиционного описания и (или) указания архивного шифра. Например, в ИПС ЦГАНХ СССР по материалам Госплана основную часть занимала карточка систематического каталога. Перфорированная часть использовалась для кодирования дескрипторов, соответствовавших информации документа. На одной карте пробивались отверстия, соответствовавшие всем вопросам содержания документа.

Суперпозиционные или просветные карты (рис. 2) содержали таблицы из обозначенных номерами квадратов. Каждая перфокарта соответствовала не документу, а дескриптору (например, понятию «высшее образование»), а отверстие на месте квадрата обозначало номер документа, содержанию которого соответствовал данный дескриптор. Например, на одной карте пробивались отверстия на месте всех квадратов, соответствовавших номерам документов, в которых упоминалось о высшем образовании. Поиск осуществлялся путем визуального просмотра напросвет наложенных друг на друга перфокарт. Такие перфокарты использовались исключительно для ручного поиска в массиве не более тысячи карточек. К этому же виду относились карты-решетки, где были пробиты все отверстия, кроме соответствующих поисковым признакам.

Рейтерные карты применяли цветовое кодирование для фиксирования меняющихся и взаимоисключающих признаков.

Наконец, в счетно-перфорационных машинах применялись особые машинные перфокарты. В отличие от человекочитаемых перфокарт, машиночитаемые карты почти не содержали свободного места для традиционного описания документа. Все пространство карты занимали вертикальные колонки из цифр от 0 до 9 или от 0 до 12. Каждая колонка имела свой номер.

К.Б.Гельман-Виноградов считает, что впервые машинные перфокарты в нашей стране применялись еще в 189710году для обработки массива анкет первой Всероссийской переписи населения. Инициатором механизации демографического учета старший редактор Центрального статистического комитета В.О. Струве. Тогда использовались 22-колонные перфокарты. Массив из 122 миллионов карт (по числу переписанного населения) обрабатывали 110 электрических счетных агрегатов американской фирмы «Холерит». Увы, заморская техника не осилила русскую бюрократическую машину – результатов переписи пришлось ждать восемь лет, из-за чего в перфокартах сильно разочаровались. Впрочем, в оправдание усилий Струве можно сказать, что результаты переписи населения 1897 года до сих пор бесценный источник, который историки считают весьма достоверным, в то время как результаты переписи населения 2002 года, подсчитанные на суперсовременных компьютерах, вызывают сомнения у многих.

Позднее в 1960-е годы получили распространение 45-ти (с круглыми пробивками) и 80-тиколонные машинные перфокарты (с прямоугольными пробивками) (см. рис. 3).

К общим достоинствам всех перфокарт относится то, что порядок расположения карт в массиве не имеет никакого значения. Не желательно только переворачивать карты «вверх ногами». Поэтому верхний правый угол у большинства перфокарт был срезан для верного расположения карт в массиве.

К матричным носителям информации относились также рулонные перфоленты, считываемые машиной и кодексы (книги с перфорационной пробивкой).

Перфоленты (трех- и пятидорожечные) появились еще ранее перфокарт. Их использовали с XVIII века для управления ткацким процессом в типографских наборных машинах - монотипах; а также, главным образом, во второй половине XIX века – для передачи сообщений по телеграфу. К.Б. Гельман-Виноградов считает, что перфоленты использовались для передачи оперативной информации. А для долговременного хранения более ценной информации применялись перфокарты.11

Каким же образом с помощью отверстий в бумаге или ленте можно было выразить все многообразие содержания архивных документов? Процесс этот был длительным, трудоемким и включал в себя следующие этапы:

  1. Создание схемы классификации, кодовой таблицы, макета перфокарты.

  2. Кодирование информации на матричных носителях информации.

  3. Механизированный поиск в массиве матричных носителей информации.

  4. Декодирование информации на найденных носителях с помощью классификаторов, кодовых таблиц.

Наиболее важен для эффективности поиска первый этап, на котором создавалась семантическая основа информационно-поисковой системы - информационно поисковый язык (ИПЯ).

В практике информатизации на первых этапах применялись ИПЯ классификационного, дескрипторного и комбинированного типов.

Классификационные системы основаны на последовательном делении всех понятий, встречающихся при описании документной информации, «раскладывании их по полочкам» схемы классификации. После этого производилось индексирование – замена понятия классификационной схемы символическим индексом (буквенным, цифровым или смешанным). Применялись различные системы индексации. В нумерационных системах все подразделения классификационной схемы рассматривались как равнозначные единицы и нумеровались в алфавитном порядке. К нумерационным можно отнести библиотечную классификацию Гарриса. Логическая или ступенчатая классификация отражала подчиненность и соподчиненность понятий. Наиболее известна универсальная десятичная классификация Дьюи, применяющая в библиотечном деле. Мнемоническая индексация передавала сочетания букв в виде цифр или букв.12Однако эти поисковые системы имеют один недостаток - каждую единицу описания можно соотнести только с одним, основным признаком классификации. Это создает трудности при описании многоаспектной информации архивных документов.С ростом объемов информации одноаспектные системы поиска (к которым относились и архивные справочники, построенные согласно жесткой схеме классификации информации) стали играть роль путеводителей, предоставляющих огромные блоки информации для сплошного перебора. В результате целенаправленный поиск превращался в трудоемкое занятие с непредсказуемым результатом, и выражение «архивное открытие» стало весьма распространенным.13Кроме того, не только поиск, но и непрерывное усовершенствование громоздких универсальных схем классификации было очень трудоемким.

В начале 1960-х годов получили распространение многоаспектные поисковые системы – так называемые свободные дескрипторные языки. Системы дескрипторного типа представляют собой списки ключевых слов (дескрипторов), отражающих содержание документов, сгруппированных по тематическим таблицам. Например, в ИПС на основе анкет абитуриентов вуза, могут быть таблицы: общие вопросы, состав абитуриентов, образование абитуриентов, возраст абитуриентов, национальность абитуриентов, профессия абитуриентов. Таблица «образование абитуриентов» может содержать следующие дескрипторы: начальное, среднее, среднее специальное, незаконченное высшее, высшее. Системы дескрипторного типа использовались для описания информации по узким отраслям знаний.

Наконец, в начале 1970-х годов получили широкое распространение системы комбинированного типа, которые основывались на сочетании классификационного и дескрипторного принципов описания. Они предполагали создание локальных десятичных классификаций, не претендующих на универсальность и таблиц дескрипторов. На носителе проставляется и индекс по классификационной таблице и индексы по спискам дескрипторов.

Вопрос:

В Схеме единой классификации документной информации в систематических каталогах государственных архивов СССР (СЕК) индексация производилась по основной таблице, построенной по отраслевому принципу и вспомогательным таблицам общих и специальных определителей аспекта, групп, населения, языка, места. Они использовались для описания многоаспектной информации. К какому типу ИПЯ относится СЕК?

После того, как ИПЯ был наполнен лексическими единицами (рубриками классификатора или дескрипторами) необходимо было установить соответствие между этими лексическими единицами и отверстиями на перфокарте, выполнявшими роль кодов. Для этого составляли макет перфокарты, соотнося каждую терминологическую группу ИПЯ с определенной зоной перфокарты. Например, под таблицу дескрипторов «образование» достаточно отвести зону краевой перфокарты из 6 отверстий или 6 цифр одной колонки машинной перфокарты. На макете перфокарты графически размечались и подписывались зоны, соответствующие таблицам «возраст», «социальный состав» и другим.

Поскольку количество отверстий и колонок цифр на карте ограничено, следовало верно выбрать тип кода. Для этого надо было сопоставить количество лексических единиц ИПЯ с емкостью кода. Емкость кода – максимальное количество возможных кодовых комбинаций. Если количество дескрипторов превышает емкость кода, не все вопросы содержания документов можно будет отразить на перфокарте. При кодировании применялись прямые и комбинационные коды с основанием 10 и 12 (имело ввиду количество цифр в колонке машинной перфокарты), а также алфавитные коды. Прямой цифровой код - тупое однозначное соотнесение каждое единицы ИПЯ с цифрой. Например, начальное образование – 1; среднее образование –2; среднее профессиональное образование - 3 и т.д. Такое кодирование осуществлялось автоматически в счетно-перфорационных машинах. При таком кодировании емкость кода равнялась количеству цифр во всех колонках перфокарты. Если на ней 80 колонок по 10 цифр в каждой, емкость прямого цифрового кода – 800 единиц. Если емкость ИПЯ более 800 дескрипторов, использовался алфавитный комбинационный код, при котором каждая лексическая единица соотносилась с комбинацией из двух пробивок. Например, начальное образование – 1 и 2; среднее образование – 1 и 3; среднее профессиональное образование - 1 и 4 и т.д. Таким образом в каждой колонке из 10 цифр можно было закодировать уже не 10, а 32 дескриптора. Для удобства каждую комбинацию из двух пробивок соотносили с буквой русского алфавита, поэтому такой код назывался алфавитным. Например, 0 и 1 - а; 0 и 2 - б и др. Таким образом, на 80-ти колонной перфокарте можно закодировать уже не 800, а 2560 лексических единиц.

Наконец, для дальнейшего увеличения количества кодовых комбинаций прибегали к комбинационным кодам – цифровым и алфавитным. Для этого для кодирования лексических единиц использовали комбинации пробивок из разных цифровых колонок перфокарты. В таком случае количество возможных лексических единиц рассчитывалось по следующей формуле:

N = Ak

где N – количество возможных кодовых комбинаций;

A – основание кода (10, 12, 32).

K - число колонок в терминологической зоне.14

Перед составлением макета составлялись специальные таблицы поисковой емкости зон перфокарты.

При составлении макета перфокарты достаточно сложной задачей было оптимальное разделение кодового поля между дескрипторными группами. В ИПЯ, разработанных для описания архивных документов, группы поисковых признаков соответствовали основным элементам описания дела или документа (номинальная – вид документа, авторская, предметно-вопросная, хронологическая, географическая и другие.) Затем группы делились на подгруппы и далее, до определения значения каждого дескриптора.

Результаты всей этой работы фиксировались в кодовой таблице, которая имела примерно такой вид (при цифровом комбинационном коде).

Классифицируемые данные

колонки

перфокарты

Отдел классификатора

Разделы, (подразделы), темы, термины.

1. Вид документа

1

2

1.1 Приказы

0

0

<№№ позиций, в которых должны быть сделаны пробивки в данных колонках

1.1.1. Приказы по основной деятельности

0

1

<№№ позиций, в которых должны быть сделаны пробивки в данных колонках

1.1.2.Приказы по личному составу

0

2

<№№ позиций, в которых должны быть сделаны пробивки в данных колонках

1.2.Протоколы и т.д.

0

3

<№№ позиций, в которых должны быть сделаны пробивки в данных колонках

2. Автор

3

4

2.1.Министрество образования

0

0

<№№ позиций, в которых должны быть сделаны пробивки в данных колонках

2.2. Главное архивное управление и т.д.

0

1

<№№ позиций, в которых должны быть сделаны пробивки в данных колонках

После того как все возможные дескрипторы были отражены в кодовой таблице, приступали к кодированию перфокарт, т.е. к пробивке отверстий в соответствующем содержанию документа месте ( ручным или автоматизированным путем). Когда массив перфокарт был готов, наступал час машин и механизмов для их обработки.

Техническое обеспечение ИПС можно разделить на устройства последовательного или параллельного действия.15Все поисковые механические устройства подразделялись на устройства параллельного и последовательного действия. Устройства параллельного действия позволяют осуществлять поиск одновременно по нескольким признакам.Устройства последовательного действия поочередно просматривают отдельные элементы информации и производят сравнение характеристик заданного вопроса с характеристиками просматриваемых материалов. Еще в 1950-е годы архивисты ставили вопрос о создании «экономически рентабельного промышленного образца счетно-учетного механического устройства и поисковой машины».16

В зависимости от роли человеческого труда при работе устройства, они делились на средства малой и, видимо, большой механизации.

К средствам малой механизации, предполагавшим относительно большую долю человеческого труда относились ручные (механические) перфокартотеки (См. рис. 4). Первые устройства этого вида были спроектированы в нашей стране в 1920-е годы – «ЦИТ», «Динамоучет», «Орга-индекс». Поиск в простейших системах осуществлялся путем пропускания металлической спицы через отверстие, соответствовавшее нужному понятию (дескриптору) сквозь массив перфокарт. После подъема спицы «улов» падал вниз, так как карты, соответствующие запросу, имели вместо круглого отверстия щель (См. рис. 5). Поскольку архивисты никогда не отличались особо атлетическим сложением и поднимать тонны перфокарт им было тяжело, изобрели перекидные селекторы, где зафиксированный массив перфокарт со вставленной селекторной вилкой (заменителем спицы) переворачивался над подносом, на который и падали искомые карточки (См. рис. 6).

Для поиска по нескольким признакам пытались использовать несколько спиц одновременно или последовательно, но это удавалось не всегда, поскольку карточки «зависали». Для ИПС с объемом перфокарт более нескольких тысяч вместо ручных перфокартотек использовались полуавтоматические селекторы с электровибратором. Они производили с массивом перфокарт маленькое землетрясение, после чего «зависшие» карточки все же отделялись от массива. В 1960-е годы использовали полуавтоматические селекторы, которые позволяли за один час просмотреть 25 тысяч перфокарт под одному краю или около 6000 по всему периметру. Они расчитаны на ИПС, включающие не более 10-12 тыс. элементов информации.17

Наконец, к средствам, очевидно, самой большой механизации относились счетно-перфорационные машины. Например, электромеханические сортировальные машины. В них перед началом поиска несколько парных электрических контактов устанавливались в положение, соответствующее поиску. Между парой контактов последовательно пропускались перфокарты. Если в месте контакта перфокарта содержала пробивку (отверстие), цепь замыкалась, что включало механизмы, отсортировывающие данные карты от массива перфокарт. После чего исполнительные механизмы печатали на бумаге отчет – например, закодированные архивные шифры.

Например, в конце 1950-х годов в ВИНИТИ проводились научно-исследовательские работы по созданию механизированной системы поисков информации на базе экспериментальной информационной машины (ЭИМ). ЭИМ обрабатывала 80-ти колонные перфокарты со специальным кодом. При этом применялась достаточно гибкая система кодирования с помощью специально спроектированного кодировочного устройства. В состав комплекта также входил контроллер, наборное и просматривающее устройства, устройство для отбора карт, устройство для печати отчетов.18

Проблемой совершенствования оргтехники занимались Наркомат рабоче-крестьянской инспекции (НК РКИ), Центральный институт труда ВЦСПС, Институт техники управления (ИТУП), общества научной организации труда. Первоначально в 1920-е годы применялись устройства тех же американских фирм, что и в конце XIX века – «Холлерит» и «Пауэрс». Однако, вскоре были внедрены комплекты отечественного оборудования САМ.

На первом этапе механизация касалась, в основном, делопроизводства и ведомственных архивов. Применение средств «малой механизации» было эпизодическим и ограничивалось использованием матричных носителей информации (перфокарт, перфолент, кодексов) и ручных перфокартотек, счетно-перфорационных устройств (механического, электромеханического и других способов действия). Все это находило применение в работе совнархозов, отделениях личного состава некоторых наркоматов, на предприятиях (например, на заводе сельхозмашиностроения «Серп и Молот» в Харькове), предприятиях торговли (например, ЦУМе), финансовых учреждениях (например, Госбанке СССР), статистических органах (например, ЦУНХУ-ЦСУ СССР). Сфера применения механизированных устройств в 1920-е годы ограничивалась решением конкретных задач в области учета материальных ценностей, учета кадров, учета населения (переписи населения), планирования, отчетности на производстве, расчета заработной платы, в банковском деле и статистике перевозок на транспорте, обработке материалов партийной статистики. Мощным импульсом для разработки средств малой механизации стало в 1920-е годы движение за научную организацию труда (НОТ). Во второй полове 1930-х годов в СССР началось применение перфокарт для научно-технических вычислений в астрономии.19

Какое отношения все эти процессы имели к автоматизации архивного дела? Дело в дом, что уже на этом этапе пришлось столкнуться с проблемой хранения машиночитаемых документов. Были созданы первые хранилища машиночитаемых данных - машиносчетные станции ЦСУ СССР, фабрики механизированного счета в крупных городах, которые обрабатывали материалы статистических обследований и переписей населения. Перфокарты хранились временно и, по мере выполнения хозяйственных задач, уничтожались. Одним из первых хранилищ МЧД стал на данном этапе архив Научно-исследовательского института аэроклиматологии. Институт был создан в 1943 г. как Центральный Научно-исследовательский гидрометеорологический архив (ЦНИГМА) с целью механизации обработки данных метеорологических наблюдений, которые собирались в виде полевых книжек, лент самопишу­щих приборов, таблиц, синоптических карт в технических архивах территориальных управлений гидрометеорологиче­ской службы (УГМС). При институте была создана машинно-счетная фабрика. С 1957 года на институт возложена задача организации Единого Гидрометеорологиче­ского фонда СССР, ставшего впоследствии одним из государственных отраслевых фондов. Вся поступающая информация переносилась на 80-ти колонных машинные перфокарты. Каждая колонка перфокарты (или несколько колонок) закреплялась за определенными элементами наблюдений (температура, давление, влажность, осадки и т. д.). Перфокартотеки создавались по каждому виду наблюдений и по каждой станции ежегодно. Перфокарты обрабатывались с помощью счетных машин. Уже к началу 1960-х годов в институте была механизирована не только статистическая обработка данных, но и учет поступающих перфокартотек, создание сдаточной описи осуществлялось с помощью перфораторов.20

Следующий этап автоматизации архивного дела (1960-первой половины 1970-х годов) ознаменовался дальнейшим развитием технического и программного обеспечения, а также изменением роли автоматизации в теории и рактике архивного дела.

В 1960-е годы происходит дальнейшее развитие и дифференциация матричных носителей информации. Помимо перфокарт с краевой перфорацией и суперпозиционных карт применяются совмещенные карты (суперпозиционные с краевой перфорацией), позволяющие ускорить поиск документов, рандовые карты, которые перфорировались по нижнему краю.

Используются дуаль-карты, на которых от руки графические отметки, считываемые специальным перфоратором. Эти отметки затем пробивались в ту же карту.

В 1960-е годы был поставлен вопрос о возможности создания полнотекстовых баз данных - поисковых систем, которые позволяли бы получать доступ сразу к тексту документа, а не к его поисковым данным. Тогда не было сканеров для введения изображения документа в память ЭВМ, и проблему пытались решить с помощь микрофильмирования. Так появились апертурные и кляссерные перфокарты. Апертурные перфокарты содержали вставленный в карту (как правило, с краевой перфорацией) микрофильм документа. Кляссерные перфокарты содержали специальный карман (кляссер), в который вкладывался микрофильм. На таких картах можно было разместить несколько документов с разными поисковыми образами.

Для информационных поисков начинают применяться пленочные и оптические носители информации – микрокарта и рулонная микропленка. Они представляли собой микрофишу или микрофильм, на котором вторичная информация обозначается в виде различных комбинаций черных и белых прямоугольников, уменьшенных путем микрофотокопирования. Микрокарта могла создаваться как микрофильм, отпечатанный на листах плотной фотобумаги. Пленочные носители рекомендовалось использовать для хранения ПК с целью уменьшения их объема - перфокарты снимались на 16-ти миллиметровую пленку. Для хранения пленки требовалось в 200-250 раз меньше объема, чем для хранения оригинальной перфокартотеки. С пленки перфокарты можно было снова распечатать выборочно или полностью. А.Д.Николаев приводил в качестве примера опыт Германии по переводу 100 тыс. чертежей на микрофильмы, которые были вмонтированы в апертурные перфокарты. Стоимость работ при этом составила половину стоимости шкафов для хранения оригиналов. Не ясно, однако, как долго сохранилась информация на пленочных носителях, весьма недолговечных в то время.21Интересно, что микропленки использовались для «вечного хранения» информации, предназначенной далеким потомкам. Так, в 1940-м году в США были заложены в землю «снаряды времени» с микропленками, которые должны были сохранить информацию о землянах до 70 века.

Магнитными носителями информации называют носители, в которых информация фиксируется намагничиванием специальных дисков, барабанов, магнитных лент, дисков, замыканием строго определенных участков системы электроцепей.

К смешанным типам носителей относились киноленты с микрофильмом, микрофильмовые карточки, барабаны и диски с микрофильмов.

С эволюцией носителей связана эволюция технического обеспечения. Применяются устройства для микрокопирования и считывания микрокарт и микропленки. Например, в ВИНИТИ АН СССР были созданы экспериментальные модели устройства типа «Поиск», считывающие 35 мм рулонную микропленку.

Для работы с машинными перфокартами требовался не один агрегат, а целый набор оборудования разного назначения:

  • перфораторы, осуществляющие автоматизированное кодирование (пробивку отверстий в перфокарте);

  • контрольники, осуществлявшие в автоматизированном режиме проверку правильности кодовых обозначений, то есть расположения тех же отверстий на карте;

  • сортировальные машины (для поиска и отбора перфокарт, отвечающих запросу), раскладочно-подборочные машины .

  • табуляторы - для суммирования и вывода результата поиска (отчета) на рулонной бумаге.

Сортировальные машины, применяемые в 1960-е годы, типа С 45-5/С80-5 пропускали до 30 тысяч перфокарт (45-ти колонных и 80-ти колонных) в час22. Но все это оборудование было дорогостоящим, поэтому сочли целесообразным использование счетно-перфорационных машин на основе кооперирования нескольких учреждений. Еще в 1960-е годы отмечалось, что будущее в создании НСА архивов - за «элекронно-логическими» машинами.

С конца 1950-х годов применялись более широко средства малой механизации в ряде учреждений (например, ВИНИТИ АН СССР, Всесоюзном институте по переработке нефти и газа). К середине 1960-х годов в СССР применялось около 10 тыс. ИПС, основанных на ручных перфокартотеках. В то же время только в ведении ЦСУ СССР было около 600 машиносчетных станций, использовавших машинные перфокарты.23Число ведомственных хранилищ машиночитаемых данных продолжает множиться благодаря созданию централизованных машиносцетных станций, например, отраслевых бухгалтерий.

Механизация затронула и государственные архивы. Одной из первых в 1960-е гг. была создана механизированная ИПС Центрального государственного архива народного хозяйства СССР (ныне РГАЭ) по протоколам Президиума Госплана СССР, содержащих многоаспектную информацию о планировании различных отраслей экономики страны в 1923 года.

К 1966 г. АИПС ЦГАНХ СССР включала 14 тысяч перфокарт. Основу ИПЯ в данном случае составила Схема единой классификации документной информации, упоминавшаяся выше, а также более подробная схема классификации отраслей промышленности. Но классификатор был доработан и детализирован применительно к информации протоколов Госплана. Список дескрипторов содержал 15 таблиц: десять тематических («Государственное строительство, государственная власть, государственное управление, общественное устройство», «Народное хозяйство», «Промышленность», «Сельское хозяйство», «Транспорт» и др.), хронологическую, географических наименований, персоналий, видов документов. Поиск осуществлялся с помощью механической перфокартотеки.

В методическом кабинете ГАУ СССР в 1960-е годы применялась механическая ИПС для поиска архивоведческой литературы.

Более совершенные ИПС с применением счетно-перфорационных машин использовались в ведомственных архивах, лучше обеспеченных техникой.

В частности, в архиве Министерства обороны СССР (ЦАМО) действовала АИПС с данными о 12 тысячах героев Советского Союза, созданная на основе описания наградных листов. Лингвистическое обеспечение АИПС включало в себя 24 таблицы дескрипторов («воинское звание», «должность», «вид вооруженных сил», «род войск», «национальность», «год рождения», «дата подвига» и др.). Техническое обеспечение АИПС – перфоратор, контрольник, сортировщик и табулятор. Носители информации - 80 -ти колонные машинные перфокарты. В архиве Министерства обороны СССР также создавалась АИПС по истории боевой деятельности различных родов войск в годы Великой отечественной войны.

АИПС внедрялись в государственном историческом архиве Эстонской ЭССР, государственном архиве Курской области.

Механизация применялась и для учета архивных документов. Например, в архиве Научно-исследовательского института климатологии осуществлялся учет поступления машиночитаемых документов (перфокарт) с материалами климатологических наблюдений. Механизированный учет избавлял от составления вручную сдаточных описей. Уже в 1960-е годы высказывались идеи о возможности осуществления в будущем автоматизированного централизованного учета архивных документов.

Данный этап автоматизации архивного дела (1960-первой половины 1970-х годов) был связан не столько с развитием технического и программного обеспечения, применяемого в архивах, сколько с бурным развитием информатики в нашей стране и ее влиянием на историческую науку и архивоведение. Первые теоретические труды, в которых обосновывалась возможность распространения на ретроспективную документационную информацию законов накопления, старения и рассеяния информации принадлежат отечественным теоретикам информатики - Г.Г.Воробьеву, А.И. Михайлову, А.И. Черному, Р.С. Гиляревскому и другим24. Исследователями делались попытки выработки классификации машиночитаемых документов, исходя из их технических и поисковых характеристик.25Ставились вопросы адаптации машиночитаемых документов к существующим документальным системам и нормам докуменатлистики26. На этот же период приходится становление такого направления исторической науки как "количественные методы и ЭВМ в исторических исследованиях" (историческая информатика), в развитие которого внесли вклад и представители архивоведения27. Основным итогом этого этапа стало формулирование теоретических основ создания информационных систем, классификации документной информации в архивах, хотя практически автоматизация еще не оказала сколько-нибудь значительного влияния на развитие архивного дела28. Однако именно на базе междисциплинарных исследований 1960-х годов, сблизивших архивоведение и теорию информации, получил развитие«информационный подход в архивоведении», представленный трудами 1970-х -80-х гг. - В.Н.Автократова, К.Б.Гельмана-Виноградова, К.И.Рудельсон, Р.Н.Ефименко и др. Это направление архивоведческой мысли во многом определило современные представления о теории классификации и фондирования, научно-справочном аппарате, анализе интенсивности использования РДИ. Теория системы НСА, в которой АИПС заняли свое место. Разработка АИПС виделась как завершение работ по описанию фонда (но не замена описанию).

Несомненным признанием значения автоматизации архивного дела уже на данном этапе стала специальная глава, посвященная этой проблеме, в учебнике «Теория и практика архивного дела в СССР» (1966 г.)29.

Следующий этап автоматизации архивного дела - второй половины 1970-х годов - первой половины 1980-х годов - был временем накопления эмпирического опыта в области создания локальных и межархивных автоматизированных информационно-поисковых систем - АИПС.

Но сначала несколько слов об изменении технологий. В 1970-е годы наряду с матричными носителями информации (машинными перфокартами и перфолентами) получили более широкое распространение оптические и магнитные носители информации. К оптическим относят рулонные и форматные микропленки (с матричной оптической записью), к магнитным – ленты, карты, диски (с матричной магнитной записью) и специальные бланки ( с матричной графической и магнитной записью). В 1980-е годы емкость стандартной магнитной ленты (длиной 730 м.) достигала 28 МБ, магнитного диска - 29 и 400 МБ.

Эволюция технического обеспечения проявилась в повсеместном растпространении электронно-перфорационных машин, применении ЭВМ, появлении микро-ЭВМ. Серийное производство ЭВМ с хранимой программой началось в мире еще в 1950-е годы: американские «УНИВАК» (1951 г.), IBM-701 (1953 г.), советские МЭСМ и БЭСМ (1953 г.), «Стрела» (1953 г.). Из истории науки и техники Вам хорошо известно, что в 1950-70-е годы сменилось пять поколений ЭВМ, которые прошли эволюцию от громоздких ламповых машин к полупроводниковым, машинам на интегральных схемах и оптико-электронных элементах. В архивном деле нашли применение вычислительные комплексы, созданные в рамках действовавшего в странах СЭВ в 1970-е годы стандарта на вычислительную технику – единая система электронно-вычислительных машин (ЕС ЭВМ). Так, базовым оборудованием в НИЦ ТД служил универсальный комплекс единой серии ЕС 1022 с накопителями на магнитных дисках ЕС-5061. В Чехословакии для реализации межархивной системы «Архаис» использовались машины ЕC 1033. Для решения боле локальных задач, например, обработки фотоизображений - 16-ти разрядные мини-ЭВМ с накопителями на магнитной ленте. Интересно, что ввод информации осуществлялся не с клавиатуры, а с помощью читающего оптического устройства, считывавшего рабочие листы (предмашинный формат) и записывающего их на магнитный носитель. Для поиска в диалоговом режиме использовался дисплейный комплекс ЕС-7920, снабженный телеэкраном. Локальный диалоговый поиск предполагал удаление дисплея, с которого поступает запрос, на расстояние до 800 м. от ЦПУ. Печать отчетов справочников осуществляли обычные алфавитно-цифровые печатающие устройства (они, как правило, распечатывали ответы на тематические запросы) или фотонаборные устройства «Дигисет-50Т1», «Дигисет–40Т2» (с их помощью создавались оригинал-макеты архивных справочников методом фотонабора).

На развитие программного обеспечения повлияло распространение системного программирования. От самостоятельной разработки программ пользователями для каждой конкретной АИПС перешли к использованию типовых программных средств - пакетов прикладных программ (ППП) и систем управления базами данных. Для создания архивных АИПС использовался пакет прикладных программ «АИДОС» фирмы «Роботрон» (ГДР). Входной формат программы допускал использование до 100 реквизитов, объем описания был значительным, мог достигать 3600 символов. Это, с одной стороны, ускорило внедрение АИПС, повысило качество и снизило стоимость программного обеспечения. С другой стороны, архивисты отстранились от разработки ПО, которым занимались математики специализированных институтов и ВЦ или производители ЭВМ, и не уделяли должного внимания форматам представления данных в архивных АИПС. Это грозило потерей данных при технологических рывках и революционной смене технологий. Впрочем, локальные проекты (например, ИПС «Архив», созданная в ИАИ в конце 1970-х годов) по-прежнему создавались как «штучный товар» на языках программирования COBOL , ASSEMBLER и других.

Получила дальнейшее развитие и теория информационного поиска, а также лингвистическое обеспечение АИПС. Архивная АИПС должна была обеспечивать однократный ввод информации и ее многократное, многоцелевое использование. Информационно-поисковые системы, создаваемые в архивах, разделялись на документальные и фактографические.

Документальные АИПС в качестве объекта поиска содержали описание документа и его поисковые данные (архивный шифр). В перспективе предполагалось включение в такие АИПС и самих текстов документов, то есть создание полнотекстовых баз данных. Документальные АИПС представляли собой автоматизированные аналоги информационно-поисковых архивных справочников – путеводителей, каталогов, описей.

Фактографические (справочные ) АИПС в качестве объекта поиска предлагают пользователю конкретные сведения. К такого рода АИПС относятся календари памятных дат, справочники административно-территориального деления, справочники с параметрами оборудования. На запрос о дате события документальная АИПС выдает ссылку на документы о событии (на основе которых дату следует определить путем сравнительного анализа), а фактографическая - конкретную дату. Считалось, что фактографические АИПС имеют более сложную технологию обработки данных.

АИПС работали в режимах ретроспективного поиска (по разовым тематически запросам); или избирательного распространения информации (когда поиск производился периодически через равные промежутки времени и сведения об обновлениях базы данных за определенный промежуток времени рассылались абонентам системы). Время исполнения запроса зависело от того, общался ли пользователь с системой через оператора, который кодировал запрос, или без посредников - в так называемом диалоговом режиме «человек-машина», формулируя запрос в ответ на вопросы системы. Для диалогового режима, существенно ускорявшего процесс поиска информации, требовалось специальное оборудование теледоступа, о котором было сказано выше и телепроцессорные программы обработки запросов. Помимо исполнения запросов архивные АИПС широко использовались для подготовки к изданию традиционных архивных справочников.

Уже в 1980-е годы осознали, что необходима преемственность традиционного и автоматизированного НСА архивов.

В результате развития искусственных языков в основу лингвистического обеспечения АИПС в 1980-е гг. были положены информационно-поисковые тезаурусы. Под информационно-поисковым тезаурусом понимают особым образом организованный словарь-справочник, предназначенный для индексирования документов и/или информационных запросов, в котором перечислены в алфавитном порядке все дескрипторы и синонимичные им ключевые слова, а также явно выражены важнейшие парадигмические отношения между дескрипторами. Рассмотрим компоненты этого определения.

«Нормативный словарь-справочник» означает, что термины тезауруса подвергаются лексикографическому контролю, то есть приводятся к единой морфологической форме. Как правило, это именительный падеж единственного числа. Словосочетания указываются в инверсном порядке:

ПОЛК ПЕХОТНЫЙ;

СНК МАЛЫЙ

Исключением являются устоявшиеся понятия:

КРАСНАЯ ПЛОЩАДЬ

БОЛЬШОЙ ТЕАТР.

В искусственном языке, в отличие от естественного, каждая фраза иметь только одно толкование. Поэтому при создании тезауруса устраняется лексическая и грамматическая омонимия (многозначность слова). Каждый термин искусственного языка, называемый еще лексической единицей, должен иметь только одно значение. И наоборот - один и тот же предмет, явление в искусственных языках может быть обозначен только одним термином. Поэтому в искусственных языках исключается синонимия – множественность словоформ для обозначения одного понятия.

Использование многозначных слов (омонимов) создает информационный шум при поиске информации, пользователю предоставляется избыточная информация, не относящаяся к теме. Для устранения омонимии и полисемии (многозначности выражений) применяется система ограничительных помет:

Дескриптор

Помета

ГЛАВА

ГЛАВА

Часть книги

Руководитель

ДОМ

ДОМ

Здание

Династия

УСТАНОВКА

УСТАНОВКА

Оборудование

Процесс

Использование при поиске терминов без указания на синонимы приводит, наоборот, к потере части информации и снижению полноты поиска. Поэтому синонимы объединяются в одну группу, где выделяется главный термин-дескриптор и аскрипторы (его синонимы).

Дескриптор

Аскрипторы

Музей Румянцевский

Музей публичный румянцевский

Библиотека румянцевская

Отдел земельный

Отдел земледельческий

Секция земельная

Крестьяне

Труженики села

Поселяне

Жители сельские

Опытное хозяйство

Опытная станция

Питомник

Кроме того, в тезаурусах, как следует из определения, должны быть отражены «парадигмические отношения» между дескрипторами: отношения типа «выше-ниже» и ассоциативные. Они отражают логические связи между терминами и позволяют избежать потерь информации при поиске. Под отношениями «выше-ниже» понимают отношения «часть-целое» или «род-вид»:

Дескриптор

Дескрипторная группа

Отношение

Фабрики

1. Фабрики пивоваренные

2.Фабрики бумагоделательные

3. Фабрики кожевенные

«Род-вид»

Кооперативы сельскохозяйст-венные

1.Товарищества по совместной обработке земли (ТОЗ).

2. Артели.

3. Коммуны.

«Род-вид»

Черная металлургия

1.кокса производство

2.железной руды добыча

3.чугуна выплавка

4.сталеплавильное производство

«Часть-целое»

Под ассоциативными отношениями понимают отношения между дескрипторами «причина-следствие», отношение сходства, близкое в синонимии, «антонимию» - противоположность по смыслу. Все дескрипторы, связанные этими отношениями, включаются в единую дескрипторную группу:

Дескриптор

Дескрипторная группа

Отношение

Неисправность

1. Авария

2. Сбой

«причина-следствие»

Каталог

1. Картотека

2. Указатель

3. Тематический перечень

«сходство»

Урбанизация

Деурбанизация

«антонимия»

(противополо-жность по смыслу)

Парадигмические отношения могут использоваться как при индексировании описания документов, так и при индексировании запросов.

Таким образом, информационно-поисковый тезаурус – сложное структурированное поисковое средство, в котором на основе анализа состава лексики данной ИПС отражены многообразные взаимоотношения между лексическими единицами. Тезаурус, как правило, состоит из нескольких указателей.

Основным является лексико-семантический указатель – алфавитный перечень дескрипторов. Кроме того, могут создаваться пермутационные указатели типа KWIC, состоящие из словосочетаний. В качестве основы для указателей использовался анализ описаний (заголовков) публикаций (дел и документов) по теме из которых извлекаются все ключевые слова и выстраиваются в алфавитном порядке. Поскольку ключевые слова включаются в указатель вместе с окружением («контекстом»), т.е. в составе словосочетаний, такие указатели получили название KWIC – «key word in context» - «ключевое слово с контекстом». Существует и другой вид указателей – KWOC- «key word out of context» - ключевое слово без контекста. В этих указателях, как ясно из названия, ключевые слова приведены без словосочетаний, в состав которых они входят, в алфавитном порядке. Все ключевые слова снабжены ссылками на соответствующий заголовок публикации.

Тезаурус мог создаваться двумя способами - априорным и аналитическим. В первом случае тезаурус создавался еще до начала индексирования описаний документов ИПС – на основе анализа лексики справочников, монографий, указателей по данной теме. Во втором случае ИПТ создавался в ходе индексирования документов, периодически пополняясь за счет новой лексики, встречающейся в описаниях.

В середине 1980-х годов приступили к автоматизированному индексированию терминов с помощью специального пакета прикладных программ АИД.

В АИД применялись

  • словарь понятий тезауруса;

  • словарь словоформ тезауруса;

  • словарь окончаний;

  • словарь общих слов;

  • словарь предлогов;

  • словарь сокращений.

Для каждого тематического комплекса описаний создавался собственный тезаурус. Создавался он вручную, путем вычленения из описания документа ключевых слов – дескрипторов. Тезаурус состоит из двух основных массивов – списка понятий, в который включаются все ключевые слова, и списка словоформ, в который включаются родовые понятия. Например, словоформе «заводы» соответствуют понятия: «заводы тракторные», «сталеплавильные» и др. Все прочие словари использовались программой АИД для анализа текста описания документа. На каком-то этапе, накопив нужное количество ключевых слов в тезаурусе, приступали к автоматизированному индексированию. Программа производила «расчленение» заголовка дела или документа на предложения и слова, маркировала предлоги и общие слова, проводила морфологический анализ немаркированных словоформ с помощью словаря окончаний и заносила в память значимые словоформы. Затем выявленные словоформы сравнивались с уже занесенными в тезаурус. Неопознанные словоформы можно было использовать для пополнения тезауруса.

Однако к концу 1980-х годов наступило некоторое разочарование в тезаурусах как в поисковых средствах. Выяснилось, что разработать тезаурус можно только для ограниченной тематической области и определенного комплекса документов. Но для архивов характерна многоаспектность и универсальность содержания ретроспективной документной информации. Отразить все многообразие которой с помощью дескрипторов достаточно сложно.

Лингвистическое обеспечение тематических АИПС 1980-х годов можно рассмотреть на примере АИПС НИЦ ТД на фотокинодокументы. Описание производилось в несколько этапов. Прежде всего это аннотирование и реферирование в процессе заполнения графы «содержание документа» на рабочем листе. Это традиционное архивное описание, применяемое при формулировании заголовка дела. Далее производилось индексирование документов – выделение ключевых слов (существительных, прилагательных, имен собственных, словосочетаний в именительном падеже), отражающих содержание документа и внесение их в специальное поле рабочего листа. Ключевые слова делились на дескрипторы и квазидескрипторы. Дескрипторы – ключевые слова, которые уже были в составе тезауруса системы. Квазидескрипторы - ключевые слова, передающие содержание данного документа, которых не было в тезаурусе, но которые следовало туда включить, поскольку они отражали содержание документов. Таким образом, происходило пополнение тезауруса. Связи между дескрипторами тезауруса и записями базы данных с описанием конкретного документа, в которое были включены данные дескрипторы, отражались в так называемом инверсном файле, формируемом системой. Наконец последний уровень описания – это тематическое классифицирование и систематизация данных. Помимо тезауруса АИПС содержала еще и тематический классификатор (рубрикатор). Рубрикатор был построен по иерархической схеме (5 уровней) и позволял осуществлять классификацию как документов широкой тематики, так и специфической узкотематической научно-технической документации. Рубрикатор состоял из 20 разделов, ряд верхних уровней был приближен к рубрикатору РЖ ВИНИТИ. Процесс рубрицирования состоял в проставлении в соответствующем поле рабочего листа цифрового индекса рубрики, наиболее точно соответствующей содержанию документа.

Взаимосвязь автоматизированных технологий и архивного дела в данный период, на наш взгляд, развивалась по двум основным направлениям. Первое из них – лавинообразный рост машиночитаемых документов и, соответственно, проблема их постоянного хранения, остро вставшая перед государственной архивной службой. Второе направление - создание межархивных АИПС в государственных архивах.

Что способствовало накоплению значительных массивов машиночитаемых документов именно в этот период? Прежде всего, процессы, происходившие в экономике. Это сейчас на 1970-е годы потомки прочно навесили ярлык «эпохи застоя». Тогда же с передовиц газет не исчезало словосочетание «экономическая реформа». Управленческие структуры сотрясали непрерывные перестройки. От территориальных совнархозов – к отраслевым министерствам, от предприятий - к производственным и научно-производственным объединениям. Попытки в ограниченной и извращенной форме привнести в централизованную государственную экономику отдельные элементы рынка в виде расширения хозяйственной самостоятельности регионов, хозрасчета и самоокупаемости предприятий, внедрения «нормативно-чистой продукции» для измерения объемов производства, увы, не увенчались успехом. От 8 к 11 пятилетке темпы экономического роста неуклонно снижались. Страна снова скатывалась к стадиальному отставанию от США и Западной Европы, вступающих на постиндустриальную стадию развития. Руководители страны не могли этого не понимать. Поэтому, одним из «заклинаний» экономической политики того времени был «научно-технический прогресс», и, как его составляющая, автоматизация управления производством. На автоматизацию, согласно решениям XXIY съезда КПСС, возлагалась миссия по ликвидации чуть ли не всех проблем развития социалистической экономики. Значительное влияние на автоматизацию архивного дела в этот период оказал также процесс создания Общегосударственной автоматизированной системы сбора и обработки информации для учета, планирования и управления народным хозяйством (ОГАС) с 1972 г. Следует оговориться, что автоматизированные системы управления (АСУ) создавались на предприятиях еще в 1960-е г. в различных отраслях хозяйства. Но в 1970-е годы ОГАС строилась не снизу вверх (от предприятия к министерству), а сверху вниз, от ведомства к предприятию. Это способствовало унификации и стандартизации как технического и программного обеспечения, так и средств информационного поиска. ОГАС должна была иметь следующую структуру (см. рис. 7). Мы видим, что система имеет несколько уровней - отрасли (ОАСУ), региона (РАСУ), предприятия (АСУП). Ключевую роль в системе играли отраслевые АСУ, которые и решали задачу организации и унификации документооборота в пределах ведомства с учетом взаимодействия ОАСУ и АСУ предприятий и организаций (АСУП) данного ведомства, а также взаимодействия с другими ОАСУ. Базой создания ОГАС должны были стать отраслевые и межотраслевые АСУ, объединенные в общегосударственную систему. Количественные характеристики результатов внедрения ОГАС впечатляют:

1966-1970гг.30

1971-75 гг.

1976- 1980 гг.31

1983 г.32

К 1985 г.

Всего внедрено АСУ:

417

236333

или

181534

4370

около 5000

824835

Отраслевые АСУ союзного масштаба

19

18536

240 (все союзные и треть республиканских министерств)

288

АСУП

АСУТП

и другие АСУ

151

174

163037

2700

2600

Из таблицы видно, что уже к 1975 году общегосударственные отраслевых АСУ (ОАСУ) охватывали все союзные и союзно-республиканские министерства и ведомства.

Это повлияло, в свою очередь, на развитие документоведения, стимулировав разработку единой государственной системы делопроизводства - ЕГСД (1966-73 гг.), унифицированных систем документации, стандартов по терминологии, общесоюзных классификаторов технико-экономической информации (ОКТЭИ). Унификации предмашинных и послемашинных форматов документов способствовала и автоматизация отдельных делопроизводственных процессов (создание автоматизированных систем контроля и исполнения документов – АСКИД; АСУ-жалоба). Этот опыт унификации создаваемых систем автоматизации документооборота следует признать достаточно ценным. Тем более что в 1990-е годы, по мнению документоведов, наблюдалось забвение тех положительных результатов, которые были достигнуты в 1970-80-е годы в деле разработки стандартов. К сожалению, стандарты создавались без учета международных классификаторов информации, поэтому в 1990-е годы встала задача их гармонизации с соответствующими международными стандартами.

Важным шагом в автоматизации делопроизводства, а значит накоплении массивов машиночитаемых документов, стало создание проекта Типовой системы документационного обеспечения управления (ТСДО) в начале 1980-х годов. В отличие от ЕГСД, ориентированной, в основном, на традиционные технологии делопроизводства, ТСДО была направлена на создание автоматизированной системы центрального аппарата министерства или ведомства на основе единой системы документационного обеспечения управления, государственных стандартов на унифицированные системы документации и других нормативно-методических документов. ТСДО предусматривала выполнение в автоматизированном режиме всех основных функций аппарата управления по работе с документами. Что касается техники, то ТСДО предполагала применение мини-ЭВМ и персональных компьютеров на базе индивидуальных рабочих мест или локальных сетей. Увы, внедрение отдельных элементов ТСДО носило эпизодический характер.38

Процессы стандартизации и унификации документной информации нашли отражение в историографии, прежде всего в диссертационных исследованиях А.Н. Соковой и Л.В. Санкиной. Нам же целесообразно задуматься над вопросом, почему гора родила мышь? Почему столь массовое и щедро финансируемое внедрение АСУ не привело к росту эффективности производства и управления?

С одной стороны, это связано с особенностями экономической системы - ЭВМ обсчитывали завышенные и «раздутые» цифры выполнения плановых заданий и итоги анализа были, по этой причине, недостоверны. С другой стороны, при внедрении АСУ конечный результат часто отходил на второй план, чиновники спешили отчитаться об освоенных средствах и приобщении к научно-техническому прогрессу. Но внедрение АСУ, как правило, приводило к увеличению трудозатрат. Процесс введения массива АСУ был весьма сложным. Сначала данные о документе, подлежащем контролю, вносились в карточку, рекомендованную ЕГСД, или перфокарту для механизированной системы. Далее проводилось ручное индексирование и заполнение машиноорентированной формы (предмашинного формата). На ВЦ данные с предмашинного формата пробивались на перфокарты и вводились в ЭВМ. Далее все операции с данными проводились оператором ЭВМ, специалистом по программному обеспечению. Таким образом, многостадийность обработки информации, наличие «посредника» (оператора) между АСУ и службой ДОУ, ограничение выполняемых задач формальным контролем из-за отсутствия текстовой информации в машинных документах, превращало АСУ в лишнее звено управленческой цепи, которое не оправдывало трудовых и материальных затрат. В 1980-е годы в ведомствах стали внедряться системы автоматизированного контроля документов, основанные на диалоге «человек-машина», которые позволяли проводить немедленную обработку запросов на специальных дисплеях39. Однако, из-за ненадежности носителей информации автоматизированная и традиционная, картотечная системы документооборота существовали параллельно. Более того, М.В. Ларин пишет о существовании одновременно трех документопотоков: традиционного – через канцелярию; автоматизированного (МЧД и машинограмм) – через ВЦ и «смешанного» – непосредственно в структурных подразделениях.40Внедрение АСУ происходилозачастую без рационализации традиционного документооборота и делопроизводства, его унификации. Объем бумажного документооборота также при этом возрастал41за счет сопроводительной документации, машинограмм42, табуляграмм. Такой подход встречается и сейчас, когда дорогая и мощная компьютерная техника используется как пишущая машинка. Однако в 1970-80-е годы архивисты уделяли значительное большее внимание проблемам внедрения АСУ различных ведомств.

Еще одну печальную аналогию мы можем обнаружить в отношении к машиночитаемым документам. Еще в 1970-е годы был поставлен вопрос о возможности перехода к безбумажному документообороту, однако проблеме сохранения машиночитаемых документов не было уделено должного внимания.

Создание и внедрение АСУ способствовало развитию новых способов документирования, привело к созданию автоматизированных банков данных и, следовательно, непрерывному росту массивов документов на машинных носителях. К.Б. Гельман-Виноградов считает, что только для периода 1917-41 гг. можно говорить о миллиардах перфокарт, использовавшихся в различных областях экономики и управления. Все это способствовало формированию сети архивов машиночитаемых данных в нашей стране. Эти архивы создавались в рамках ведомственных систем: вычислительные центры (ВЦ) на предприятиях и производственных объединениях, а также главные вычислительные центры (ГВЦ) при министерствах и ведомствах. Отделы ВЦ, хранившие МЧД, назывались по разному: технический архив, магнитотека, лентодискотека, биб­лиотека машинных носителей, справочно-информационный фонд. Объем хранилищ ГВЦ и ВЦ предприятий постоянно увеличивался. В перспективе ставилась задача сделать ГВЦ при помощи каналов связи «центрами коллективного пользования». Первые хранилища были созданы в ЦСУ и воссозданных в 1965 году промышленных министерствах (приборостроения, радипромышленности, электронной промышленности и других), а также в производственных объединениях в области того же машиностроения. Кроме того, были созданы архивы машиночитаемых данных в области метеорологии и аэроклиматологии, о котором говорилось выше, медицинской диагностики, патентные фонды. Создавали массивы МЧД и другие автоматизированные системы, действовавшие в учреждениях и на предприятиях.

Так, в конце 1970-начале 1980-х годов в вузах Москвы, Ленинграда, Кишинева, Киева и других городов, в том числе и в Московском государственном историко-архивном институте (МГИАИ) действовала автоматизированная система «Абитуриент», которая позволяла перевести на машинные 80-ти колонные перфокарты заявления абитуриентов и осуществлять поиск с последующим анализом информации о составе абитуриентов МГИАИ (возрасте, трудовом стаже, специальности и других данных). Эта система была типовой и составной частью общегосударственной базы данных «Население-кадры».

Архивы ГВЦ и ВЦ комплектовались документами и с кратковременными, и с долговременными сроками хранения. Машиночитаемые документы образовались в большом количестве и в сфере органов научно-технической информации (НТИ). В состав Государственной автоматизированной системы научно-технической информации (ГАСНТИ) входила сеть автоматизированных центров и распределенных банков данных. ГАСНТИ входила в состав ОГАС наряду с автоматизированными системами управления.

В процессе деятельности органов НТИ (Центрального научно-исследовательского института патентной информации и технико-экономических исследований, Государственной публичной научно-технической библиотеки, Всесоюзного института научной и технической информации и др.) на магнитных лентах издавались выпуски библиографической информации, каталоги, сигнальные информации и реферативные журналы43. Положительный опыт работы органов НТИ состоял в первых шагах к стандартизации форматов представления данных. ГОСТ 7.114-78 вводил единый государственный коммуникативный формат библиографической записи, что позволяло совмещать ресурсы, созданные разными центрами НТИ.

С 1970-х началось создание автоматизированной системы научно-технической информации по документоведению и архивному делу. Частью ее стала АСНТИ по документам государственного архивного фонда СССР (АСНТИ ГАФ СССР), основу которой составляли подсистемы тематического поиска данных, распространения и анализа информации. Об АСНТИ будет подробнее сказано ниже. Головной организацией АСНТИ стал отдел научно-технической информации (ОНТИ) ВНИИДАД, в систему органов НТИ архивной отрасли входили также подразделения НТИ в главных архивных управлениях при Советах Министров союзных и автономных республик и архивных отделах краевых и областных исполко­мов. В 1979 г. отдел научно-технической информации был преобразован в отраслевой центр НТИ - ОЦНТИ ВНИИДАД.44ОЦНТИ с целью внедрения достижений научно-технического прогресса в отрасль создает свою информационную базу – справочно-информационный фонд (СИФ), который комплектуется зарубежной и отечественной литературой: научной, производственно-технической, основ­ной общественно-политической и экономической, а также информацион­ными и документальными материалами (периодикой, депонированными рукописями) по проблемам документоведения, архивного дела, археографии. Функции ОЦНТИ и других отраслевых органов НТИ - выявление источников комплектования, планомерное пополнение СИФ и доведение информации до сведения потребителей – архивных учреждений. Формы работы ОЦНТИ – проведение периодических дней информирования, издание и распространение информационных изданий - как правило, библиографического характера. К 1999 г. в составе СИФ ОЦНТИ ВНИИДАД хранилось 1744 перевода, 190 депонированных рукописей, 6939 неопубликованных материалов и 1151 стандарт.

Задание и вопрос:

Изучите статью Б.С.Илизарова45.

  1. Какова функции ОЦНТИ?

  2. Какова структура отраслевой службы НТИ и ее взаимоотношения с республиканскими, областными центрами НТИ?

  3. Какие проблемы стояли перед службой НТИ архивной отрасли?

Изучите статью В.Д. Банасюкевича, Ю.В. Грум-Грыжимайло, Э.А Чернина.46

  1. Какие новые задачи стоят перед ОЦНТИ ВНИИДАД на современном этапе? Как создается полнотекстовая база информационного обслуживания отрасли?

Наконец, локальные коллекции МЧД стали создаваться историками. Создание этих коллекций было связано с дальнейшим развитием исторической информатики в нашей стране благодаря трудам таких историков как В.А. Устинов, Ю.Л.Бессмертный, И.Д. Ковальченко, В.З. Дробижев, Ю.Ю. Кахк, Л.И. Бородкин и других. Центрами развития количественных методов в исторических исследованиях стала Комиссия по применению математических методов в исторических исследованиях при институте истории АН СССР, лаборатория математических методов исторического факультета МГУ и исследовательские группы в Ленинградском университете, Эстонии, Белоруссии, Украине.47Историки создавали машиночитаемые версии, как правило, массовых исторических источников для изучения с помощью математических методов таких проблем как историясоциально-экономических процессов (индустриализация, коллективизация, история предпринимательства, аграрная политика), роль обще­ственно-политических организаций и движений в социальной и политической жизни, демографическое развитие, социальное расслоение, проблемы быта и жиз­ненного уровня, экология, заболевания и т. д. В 1980-е годы для исторических исследований за рубежом было создано специализированное программное обеспечение – статистические пакеты OSIRIS, SAS, CLOG, SPSS, программы для компьютерного анализа текста (Anaconda, Textpack, Eva, Forcod) и др. В СССР была создана «База данных по истории советского общества», включающая данные по сведениям анкет делегатов Всероссийских (1918—1922 гг.) и Всесоюзных съездов Советов. В 1987 г. был создан Банк социологических данных. Однако объем баз данных, создаваемых историками в исследовательских целях, конечно, не мог сравниться с количеством МЧД, образующихся в деятельности АСУ.

Результатом всех этих процессов стал тот факт, что к началу 1980-х годов перед архивами впервые встал вопрос об отборе на государственное хранение машиночитаемых документов, отложившихся в деятельности отраслевых государственных вычислительных центров (ГВЦ и ВЦ). Согласно положению о Государственном архивном фонде СССР от 4 апреля 1980 г. в состав государственного архивного фонда были включены программы, алгоритмы, машинно-ориентированные (механографические) документы.48Появилась необходимость в теоретических и методических разработках в области архивоведения.

В 1970-е-начале 1980-х годов начали складываться научно-методические основы направления, которое можно назвать «архивоведением машиночитаемых документов». Хотя практика создания и накопления МЧД в данном случае намного опережала теорию и, по этой причине, методические разработки49 преобладали над теоретическими работами. Вместе с тем мы можем утверждать, что совместными усилиями Главархива, ВНИИДАД, архивов и исследователей - К.Б. Гельмана-Виноградова, А.В. Мирошниченко, В.В. Цаплина, И.И.Даниленко, А.Т.Черешни50и других были намечены основы классификации, экспертизы ценности, системы научно-справочного аппарата МЧД. Изучались труды зарубежных архивистов - Дж. Роудса, Дж. Тестона, Ч. Доллара, М.Керрола и других. К сожалению, в конце 1990-х исследовательская работа в этом направлении была приостановлена, хотя ВНИИДАД планирует возобновление исследовательской темы по электронным документам.

В 1970-80-е годы велись дискуссии о том, можно ли рассматривать машиночитаемые документы как документы или они являются лишь техническими средствами обработки информации (по другой версии - разновидностями носителей информации).51Вопрос далеко не праздный, так как он напрямую связан с вопросом об их ценности как исторических источников. Еще в 1960-е гг. утвердилось определение машиночитаемых документов, как документов, приспособленных для автоматического считывания содержащейся в них информации. Но являются ли перфокарты, перфоленты, магнитные диски документами? Отрицательный ответ подкреплялся аргументами о том, что МЧД не имеют юридической силы, а также являются копиями массовых традиционных источников. Но еще в 1981 г. были введены общеотраслевые правила придания юридической силы машиночитаемым документам.52Органы Госарбитража СССР могли рассматривать их в качестве доказательств наравне с традиционными. Копийность МЧД также подвергалась сомнению, так как появились комплексы первичных машиночитаемых документов. Например, массивы штриховых бланков переписи населения СССР 1979 г., материалы социологических обследований.53

В 1980-е годы К.Б. Гельман-Виноградов обобщил все имеющиеся подходы к классификации машиночитаемых документов. Интересно, что исследователи скрупулезно выявляли технические характеристики всех существующих носителей информации, однако не оценивали существующие виды документов с точки зрения возможностей долговременного хранения. Сам Гельман-Виноградов предлагает развернутую классификацию МЧД исходя из критерия повторяемости информации (разделение на первичные по отношению к традиционным документам и копийные документы, производные документы АСУ – машинограммы, полученные с помощью печатающего устройства). Этот подход увязывает классификацию МЧД с проблемой ценности массивов МЧД по принципу повторяемости информации, которую они содержат, и, казалось бы, сходен с современным – Концепция информатизации архивного дела в РФ 1995 года также предлагает хранить ограниченное число массивов ДМН, не имеющих аналогов в традиционной документации. Однако, в 1970-е годы не подходили так однозначно к решению проблемы ценности МЧД. Опираясь на разработки источниковедения массовых источников еще 1960-х годов (работы Б.Литвака и других), утверждалось, что машиночитаемая версия традиционного массива источников не является его разнозначным аналогом. МЧД составляют особую разновидность массовых источников - «динамического» характера, позволяющих преодолеть пороговые пределы органов чувств человека при обработке значительных массивов информации. К.Б. Гельман-Виноградов образно назвал эту особенность машиночитаемых документов «ускорительной функцией»54, поскольку они обеспечивают скорость обработки и агрегирования данных, значительно большую, чем традиционные массовые источники. Поэтому они заслуживают хранения, не взирая на «вторичность» информации. Конечно, при условии, что автоматизированная система будет действовать, и входящие в нее МЧД не будут лежать мертвым грузом. Этот теоретический подход на практике проявлялся в том, что на хранение отбиралисьфайлы данных, необходи­мых для неоднократных анализов и пересмотров итоговых результатов. Ценность данных состояла не в содержании, а в машиночитаемой форме, позволявшей многократно проводить подсчеты.

Впрочем, К.Б. Гельман-Виноградов отметил и такую негативную особенность МЧД, как отсутствие в них данных об изучаемом объекте, которые плохо поддаются формализации. Это может привести к некоторой схематичности в интерпретации явлений и событий.

Исходя из критерия повторяемости выделяли также различные копии одного и того же МЧД, последовательно получаемые в ходе обновления данных. Разные «поколения» одного итого же массива данных получили названия – «дед», «отец» и «сын». «Младшие» поколения представляли собой основную, а «старшие» - страховые копии массива МЧД, которые можно было бы использовать для из восстановления.

«Положение о порядке отбора, приема на архивное хранение и выдачи потребителям документов, созданных средствами вычислительной техники», разработанное ЦГАНХ в 1983 г., разделяло документы, образующиеся в деятельности АСУ на машиночитаемые и человекочитаемые (машинограммы). Хранение машинограмм может осуществляться на тех же основаниях, что и традиционных документов, поскольку они ничем не отличаются от документов на бумажной основе.

Задание и вопрос:

Изучите классификации МЧД, существовавшие в 1970-80-е годы.

(См.: Гельман-Виноградов К.Б. Машиночитаемые документы в СССР. Вып. 1 Области применения. Классификация. М., 1980. С.48-82; Мирошниченко А. В. О классификации и экспертизе ценности документов АСУ.// Советские архивы. 1979. № 6. )

  1. Какие подходы и признаки использовались при разработке различных классификаций МЧД?

  2. Учитывали ли существовавшие классификации ценность МЧД и перспективы их долговременного хранения?

Значительное внимание в этот период было также уделено комплектованию государственных архивов МЧД и экспертизе их ценности. Важным шагом в данном направлении стала подготовка ряда методических разработок Главархивом СССР и Центральным государственным архивом народного хозяйства СССР (ныне – РГАЭ), к профилю которого относилась документация большинства отраслевых АСУ.55Кроме того, над темой «Научные основы комплектования государственных архивов документами, образующимися в условиях функционирования отраслевых АСУ» работали ЦГАОР СССР (ГА РФ), главархивы Грузинской, Узбекской, Молдавской, Литовской ССР. В методических рекомендациях ЦГАНХ СССР, подготовленных на основе материалов работыГВЦ и центрального аппарата Министерства приборостроения, средств автоматизации и систем управления СССР, ЦСУ СССР и других ведомств, был предложен следующий подход к комплектованию государственных архивов МЧД. Документы ВЦ предприятия относятся к фонду предприятия и поступают в тот же государственный (областной, краевой) архив, что и «традиционные» документы фонда. Документы ГВЦ министерства и ведомства поступают в тот же центральный архив СССР, где хранится фонд министерства. Подробнее схема процесса комплектования ГВЦ и государственных архивов МЧД изображена стрелочками на рисунке 8. Этот подход, оптимальный с точки зрения сохранности МЧД, недробимости фондов и доступа к документам, требует больших затрат на хранение. Ведь он предполагает создание в каждом государственном архиве центра хранения МЧД, оснащенного соответствующей аппаратурой и специалистами. Между тем даже в странах США и Европы шли по пути создания единого национального центра для постоянного хранения МЧД, жертвуя недробимостью документальных комплексов в пользу концентрации средств.

И.И. Даниленко, В.В. Цаплин предложили оставить в числе источников комплектования ГАФ только главные вычислительные центры (ГВЦ), действующие на союзном и республиканском уровнях. Таким образом, комплектоваться МЧД должны были только центральные архивы СССР и центральные республиканские архивы. Поскольку документы отраслевого ГВЦ тесно связаны с документами министерства и ведомства, они должны были поступать в тот же центральный архив, к профилю которого относится фонд министерства и ведомства. Приступить к комплектованию МЧД, по мнению исследователей, могли ЦГАОР, ЦГАНХ и даже ЦГАЛИ СССР. Что касается ВЦ предприятий, то их документы должны были поступать в кустовые ВЦ, кустовые пункты связи и кустовые информационные пункты. Эти организации непосредственно не передают документы на госхранение и осуществляют лишь промежуточное хранение МЧД до передачи их в республиканские и общесоюзные ГВЦ. (См. рисунок 9.) Кроме того, исследователи считали возможным создание отдельной сети специализированных республиканских архивов МЧД и единого центрального архива для хранения МЧД СССР. В таком случае фонд организаций республиканского и общесоюзного уровня все же раздроблялся на две части. Документы на традиционной основе поступали в центральный республиканский архив или центральный архив СССР, а документы на машинном носителе – в специализированный архив МЧД. (См. рис. 10.) Однако оставалось неясным, куда же должны поступать машинограммы, которые являлись составной частью комплекса документов, образующихся в АСУ.56

Комплектование МЧД предлагалось организовать в два этапа. Первоначальная передача документов из структурных подразделений в ВЦ (ГВЦ) предприятия (ведомства) осуществляется сразу после решения функциональной задачи или ее автономной части. А через год осуществлялась передача МЧД из ВЦ в государственный архив. Впрочем, по Положению о ГАФ СССР (1980 г.) разрешалось хранить МЧД в ведомствах 5 лет до передачи на государственное хранение. Интересно, что уже в 1980-е годы было установлено, что периодическое обновление некоторых баз данных не является препятствием для принятия на государственное хранение. Следует только установить нормативно прерывание процесса обновления в определенные сроки (например, раз в год). Между тем до сих пор в некоторых учреждениях «незавершенность» регулярно обновляемого массива данных служит препятствием для передачи машиночитаемых документов в архив. Ускорить процесс комплектования государственных архивов материалами отраслевых АСУ, по мнению архивистов, могло также создание единых общесоюзных классификаторов информации.

Проблема комплектности поступающих на хранение МЧД связана с требованиям, чтобы МЧД поступали в двух экземплярах (рабочий и страховой), с программой управления (на магнитной ленте и бумаге) и описью. Закрепленный позже57порядок передачи МЧД на хранение предполагал обязательное сопровождение программного обеспечения (оформленное в соответствии с ГОСТ 2 8399-89). Таким образом, удостоверяющий документ обязательно должен быть традиционным, хотя сами МЧД могли поступать в архив по каналам связи.

В нашей стране в 1980-е годы экспериментальное комплектование МЧД осуществляли ЦГАНХ СССР и НИЦ ТД СССР. На учете ЦГАНХ СССР в 1985 г. находилось около 70 вычислительных центров, обеспечивающих функцио­нирование отраслевых и межотраслевых АСУ, в том числе Госплана СССР и ЦСУ СССР. Однако на государственное хранение были приняты МЧД только двух ведомств - Государственного комитета СССР по внешнеэкономическим связям и Министерства приборостроения, средств автомати­зации и систем управления («АСУ-прибор III»). ЦГАНХ целенаправленно проводил паспортизацию и обследование архивов ГВЦ, на основе этого опыта были разработаны «Примерное положение об архиве вычислительного центра отрасли» и «Паспорт архива главного вычислительного центра». Архив также проводил исследования по ряду тем, связанных с архивоведением МЧД. 58

При определении ценности документов следовало изучать в комплексе документы фонда – машиночитаемые, традиционные, машинограммы. Отбор МЧД на хранение планировалось осуществлять в два этапа. На первом этапе документов определялся состав функциональных задач, документы которых поступали на постоянное хранение. На втором этапе осуществлялась выборка данных по конкретным задачам и подготовка сопроводительной документации. С этой целью планировалось создать экспертные комиссии на ГВЦ. Их описи утверждала ЭПК Госархива. Разработанные ЦГАНХ СССР перечни документов, образующихся в деятельности ОАСУ, имеют значение для унификации и классификации МЧД, возникающих в ходе решения различных функциональных задач во всех отраслях59. Однако тщетно архивист искал бы в перечне ЦГАНХ указания на сроки хранения документов – против большинства статей стоит указание «ДМН». Акцент при определении сроков хранения МЧД делался на ведомственные перечни документов.

Документы, создаваемые в ходе функционирования ОАСУ разделялись на управленческие и технические. Собственно машиночитаемые документы относились к техническим документам. Документы АСУ разделялись на первичные (поступающие на ВЦ от организаций министерства или ведомства), входные документы, внутренние и выходные документы. Архивисты считали, что приоритетное значение имеют «внутренние документы», составляющие банк данных. Банк данных рассматривался как важнейшая составная часть информационного обес­печения автоматизированной системы. В нем накапливается и хранится информация, а также осуществляется ее обновление, поиск, обработка и выдача сведений. Предлагалось рассматривать именно банки данных в качестве источников комплектования государственных архивов.60При этом сократить объем поступающих на хранение документов предполагалось следующим образом. Банк данных АСУ состоял из следующих частей:

  • справочно-информационный фонд отрасли (нормативно-правовые, методические, информационные материалы);

  • информационные массивы данных системы;

  • система управления базой данных (СУБД).

Если создать единый справочно-информационный фонд для всей отрасли и единую СУБД, то эти части банка данных могут поступать на хранения в составе материалов ГВЦ министерства один раз. Что касается основного массива данных АСУ каждого ВЦ, то часть данных, видимо, также поступают на ГВЦ отрасли для обработки, поэтому стоит выявить массив первичных данных каждого ВЦ, который не дублируются в массиве ГВЦ.

В каждой из этих групп (первичные, входные, выходные и внутренние) документы разделялись по видам носителей - на перфокартах, на магнитных лентах, на магнитных дисках. На государственное хранение должны были поступать только документы на магнитных носителях (лентах, дисках). В ходе работы АСУ информация записывалась на магнитные диски (рабочий фонд) и на магнитные ленты (страховой фонд).

При экспертизе ценности преобладал так называемый «аналоговый подход», при котором оценка МЧД проводилась по тем же критериям, что и традиционных документов. При этом определяющее значение при оценке документов имело их содержание, а не технические характеристики («читабельность» данных, формат, требования к системному обеспечению). Правда, в методических рекомендациях ЦГАНХ СССР выделены специфические критерии оценки МЧД, но «специфика» их выражена слабо. К таким критериям оценки МЧД отнесены важность решаемой с их помощью функциональной задачи для отрасли61и уровень первичности, а также степень агрегирования информации. Причем агрегирование информации (например, в машинограмме) не служит, так же, как и для традиционных документов, причиной для уничтожения первичных документов. Наоборот, при отборе МЧД приоритет должна была получать первичная информация, а не сводные документы, поскольку на ее основе можно получить различные группировки данных, в том числе тот же самый сводный документ. Предлагалось принимать на государственное хранение МЧД, создан­ные на основе первичной информации, которые были использованы вычислительным центром для подведения итогов работы за определенный хронологический период (квартал, год и более длительный промежу­ток времени) по объектам, видам производства, в территориальном раз­резе; для расчетов, послуживших основанием подготовки управлен­ческих решений (постановлений, приказов, указаний), предложений в руководящие органы, планов, а также первичную информацию нор­мативного характера.62Проблема несовпадения формата данных, создаваемых АСУ разных ведомств в методических рекомендациях решалась просто – предполагалось принимать МЧД в государственные в едином отраслевом формате, определяемом Главархивом СССР. В условиях плановой централизованной экономики, когда не существовало конкуренции производителей программного обеспечения, осуществить унификацию форматов всех машиночитаемых данных в стране не представлялось особенно сложной задачей. Архивисты предлагали также сделать общеотраслевым формат какого либо ведомства, например, Госплана СССР.

Кроме того, учитывалась повторяемость информации и степень поглощенности информации в различных АСУ, а также на­личие дублетности машиночитаемых документов и их выходных машинограмм. Критерий использования МЧД предполагал не только отбор на хранение тех документов, к которым постоянно обращаются пользователи. Рекомендовалось также ориентироваться на прием машиночитаемых дублетов особо ценных документов, которые могут рассматриваться в качестве фонда пользования.

В области научно-справочного аппарата были выделены различные виды справочников по учету и раскрытию содержания МЧД. К ним относились межархивные справочники - перечни автоматизированных систем, создаваемых в разных ведомствах, которые велись Комиссией по документалистике Научного совета по комплексной проблеме «Кибернетика» АН СССР и другими учреждениями. К учетным справочникам архива относились журналы или картотеки учета первичных комплексов МЧД, технологические карты комплектования машиночитаемых документов для выполнения расчетов на ЭВМ, журналы или карты выдачи МЧД из архива. К информационно-поисковым справочникам архива относились табулярограммы-описи перфокарт массива, картотеки файлов на магнитной ленте или диске. В связи с разработкой типологии справочников встал вопрос о разграничении понятий единицы хранения и единицы учета для МЧД. Единица хранения – единица количественного измерения МЧД. Для перфокарт за единицу хранения принимался тематический «массив», в который они группируются для использования и хранения. Для магнитных носителей информации возникло понятие «тома» – физически обособленного рулона магнитной ленты или отдельного фрагмента магнитной ленты, один диск. За единицу учета принимался файл – тематически обособленный целостный комплекс информации, который мог размещаться на нескольких единицах хранения (рулонах, дисках). В сопоставлении с традиционным архивоведением единицу хранения МЧД как раз можно определить как единицу учета, то есть установления количественных характеристик массива МЧД. А единица учета (файл) в традиционном архивоведении - объект описания, который берется за основу при раскрытии содержания документов.

В 1970-80-е годы в связи с перспективами перехода к безбумажному документообороту были приняты первые нормативные документы по вопросу юридической силы МЧД. Особенно значимым событием было принятие ГОСТа 6.10.4-84.63ГОСТ разграничивал понятие подлинника, копии и дубликата применительно к МЧД и устанавливал обязательные реквизиты, удостоверяющие юридическую силу МЧД (наименование организации-создателя документа; местонахождение организации-создателя документа или почтовый адрес; наименование документа; дату изготовления документа; код лица, ответственного за правильность изготовления документа на машинном носителе или машинограммы или, как правило, код лица, утвердившего документ). Подлинником документа на машинном носителе является первая по времени запись документа на машинном носителе, содержащая указание, что этот документ является подлинником. Однако, в случае внесения изменений организацией-создателем МЧД в подлинник документа, его юридическая сила заверяется сопроводительным письмом, которое фиксирует реквизиты (печать, подпись фондообразователя). Это ГОСТ не только не отменен, но и принял в настоящее время статус межгосударственного стандарта стран СНГ. Порядок оформления МЧД закрепил ГОСТ 28 388—89 «Документы на магнитных носителях данных. Порядок выполнения и обращения».

Проблема обеспечения сохранности МЧД тогда связывалась почти исключительно с проблемой физической ненадежности магнитных носителей информации и решалась путем резервного копирования и периодической перезаписи информации (по аналогии с архивами звукозаписи), передачи на государственное хранение двух экземпляров комплекта МЧД (дубликат и рабочая копия), созданием страхового фонда и совершенствованием технологии создания магнитных лент и дисков64. В принятом в 1984 году стандарте содержалисьметодические указания о порядке хранения документов на машинных носителях, разработанные ВНИИДАД, НИЦТД СССР и ЦГАНХ СССР, которые предусматривали особый режим хранения для этих документов65. Следует отметить, что никто не предвидел того фактора, который на самом деле стал «могильщиком» всего массива созданных МЧД – несовместимости форматов данных на различных этапах технологической революции. К.Б. Гельман-Виноградов, указывая на опасно быструю смену поколений вычислительной техники, утверждал, что это не станет препятствием для хранения МЧД. Ведь не стало бурное развитие кинотехники препятствием для использования хроникальных и художественных лент, созданных на заре кинематографии. А эстонский историк Х.Э. Палли, высказывал мнение, что МЧД, которые откладываются на предприятиях, в министерствах и ведомствах, станут через два-три десятилетия ценнейшим источником.66

Увы, эти надежды не оправдались. Оглядываясь в прошлое и оценивая первый опыт создания хранилищ МЧД в нашей стране, который принес много ценных находок и в практике, и в теории, следует признать все же, что он закончился грандиозной неудачей. Когда на смену ЕС ЭВМ пришли персональные компьютеры, программное обеспечение изменилось столь кардинально, что почти ничего из созданных АСУ 1970 – п.п.1980-х годов миллиардных массивов перфокарт, перфолент, магнитных лент и дисков не удалось сохранить. И это служит грозным предостережением архивистам XXI века, о котором следует помнить на пороге эры безбумажного документооборота.

Другое направление автоматизации архивного дела было связано с применением автоматизированных технологий в работе государственных архивов (как правило, создании научно-справочного аппарата). Автоматизированные информационно-поисковые системы в архивах создавались двух видов – тематические и универсальные. Тематические АПИС включали документы по определенной теме, которая считалась значимой и пользовалась с просом у исследователей. По типу справочников это были, как правило, межархивные каталоги. Универсальные АИПС стремились включить описания всех документов государственного архивного фонда. По типу справочников это были, как правило, межархивные путеводители или краткие справочники.

Тематические каталоги создавались в СРР в соcтаве румынской архивной автоматизированной поисковой системы SARIAS. В 1970-80-е гг. большая часть каталогов румынских архивов была перезаписана на магнитные носители. В Венгрии на магнитный носитель переводились 300 тысяч регестров (описей) средневековых документов для обработкки их с помощью ЭВМ.67

В качестве унифицированной информационной системы можно рассматривать опыт китайских архивистов. В КНР еще в 1970-е годы были созданы отраслевые автоматизированные системы, включавшие в себя как «текущую» информацию, так и документы долговременного хранения. АИПС включали в единую поисковую систему документы, хранящиеся в архивах и в отраслевых институтах информации.

В ЧССР с 1974 г. было начато создание архивной информационной системы «АРХАИС», которая представляла собой промежуточный вариант между тематической и универсальной системой, поскольку строилась «агрегатным методом» - путем соединения в единую АИПС различных тематических банков данных. В основу проектирования данной системы был заложен принцип ее «открытости». В состав «Архаис» входили как тематические банки данных (построение социализма в СССР, история рабочего движения, сельскохозяйственные и лесные исследования, охрана окружающей среды), так и описания массивов научно-технической, статистической, картографической документации (документация по метеорологии, патентам, геологии и картографии, демографии). Отчетами АИПС служили реестры описей, тематические справки и каталоги, обзоры и статистические данные. Планировалось сделать систему полнотекстовой, включив в нее микрокопии документов. Интересно, что лингвистическое обеспечение «Архаис» было скоординировано с международными стандартами. Так, для создания картографического банка данных использовался многоязычный картографический словарь Международного совета архивов (МСА). 68

В нашей стране создание архивных АИПС было начато с тематических каталогов. Этот подход был избран потому, что полная автоматизация поиска до уровня документа считалась экономически и социально неоправданной.69

Установленный в НИЦ ТД СССР (РНИЦ КД, ныне РГА НТД) вычислительный комплекс EC ЭВМ и пакет прикладных программ АИДОС фирмы РОБОТРОН (ГДР) послужили базой для реализации грандиозных по тем временам межархивных проектов - АИПС «Победа Великой Октябрьской революции и борьба за установление и упрочение советской власти» («Документы Великого Октября»), «История памятников архитектуры и градостроительства Москвы, Ленинграда и пригородов». Работа была начата в 1980 г., и к 1985 году было введено 100 тысяч записей70. Обе системы представляли собоймежархивные тематические каталоги. При их создании применялось групповое, поединичное и подокументное описание архивных документов.

В создании первой системы – «Документы Великого Октября» - участвовали 200 архивов-соисполнителей. На первом этапе, завершившимся в 1982 году, в систему были введены описания опубликованных документов по теме. Затем приступили к выявлению всех документов, датируемых с 25 октября 1917 г. по июнь 1918 г. В официальной советской историографии данный период рассматривался как «триумфальное шествие советской власти». В современной историографии большинство исследователей склоняются к его трактовке как начального этапа гражданской войны. Выбор темы для первой АИПС обуславливался не только очевидной политической конъюнктурой, но и большим количеством исследователей (историков партии, пропагандистов), использующих архивные документы по данному периоду. Головной организацией, осуществлявшей исторический и археографический контроль за выявлением документов по теме, стал Центральный государственный архив Октябрьской революции и высших органов государственной власти СССР – ЦГАОР СССР (ныне – ГА РФ). Пополнение системы было организовано следующим образом. Архивы–соисполнители выявляли документы и переносили их на тематические карточки. ЦГАОР редактировал эти карточки и переносил информацию на специальный предмашинный формат – рабочий лист. Заполненные рабочие листы поступали в НИЦ ТД СССР (РНИЦ КД), где размещалась техническая база системы. НИЦ ТД вводил данные в память системы, осуществлял индексирование документов, ведение тезауруса, поиск информации и создание архивных справочников на основе АИПС (тематический и топографический каталоги).71

Важным опытом при создании данной АИПС было построение тезауруса, лексические единицы которого охватывали широкий круг проблем – экономику, политику, гражданскую войну, интервенцию, армию, флот, государственное строительство, социальные слои. Первоначальный состав лексических единиц тезауруса был сформирован на основании анализа лексики описаний 21 тысячи рабочих листов. Лексика была сгруппирована по идентификаторам - географических понятий, промышленных предприятий, учреждений и организаций, профсоюзов, партий, социальных групп, войсковых формирований. Для дополнения лексики каждой группы использовалась литература по теме. Еще одной особенностью лексики, кроме ее многоаспектности, было обилие «историзмов» (ВРК, СТО, РВСР, Комуч, ВСЮР, « белочехи» и др.), а также вариативность в передаче названий учреждений, организаций, воинских частей, порождавшая специфическую синонимию (комиссариат мусульманский, комиссариат по мусульманским делам, комиссариат по делам мусульман внутренней России). Тезаурус, первый вариант которого к 1982 году состоял из 6 729 терминов, пополнялся по мере индексирования документов в среднем примерно на две тысячи терминов в год и постепенно превратился в многотомный массив. 72

Вторая межархивная АИПС – «Архитектура и градостроительство» - охватывала комплекс документов, хранящихся в семи архивах Москвы и Ленинграда. Выбор темы был обусловлен ростом количества запросов и исследователей в связи с принятием в 1976 г. Закона СССР «Об охране памятников истории и культуры». Среди постоянных потребителей информации были архитектурно-планировочные управления, реставрационные организации, Государственная инспекция охраны памятников, местные отделения ВООПИК, музеи. В тематический каталог включались описания графических и текстовых документов – чертежей, проектов, гравюр, литографий, поэтажных планов и фасадов зданий, докладов, записок и других. Хронологические границы комплекса - с XVII века до 1917 года. Головной организацией, контролировавшей сбор информации, был Центральный государственный исторический архив СССР – ЦГИА (ныне – РГИА, г. Санкт-Петербург). В отличие от «Документов великого Октября» при создании данной системы перевод документов в предмашинный формат (на рабочие листы) осуществлялся непосредственно архивами-исполнителями. ЦГИА редактировал рабочие листы, а НИЦ ТД СССР производил ввод и обработку информации в АИПС. Функционирование системы началось с ввода сведений о памятниках такого «архитектурного заповедника» как Невский проспект Санкт-Петербурга. На базе данной АИПС создавались именной, географический топографический и объектный каталоги (т.е. каталог, в котором информация систематизирована по объектам – памятникам архитектуры).73

Лексическое обеспечение данной АИПС составляли рубрикатор административного деления Московской и Петербургской губерний и тезаурус.74Если тезаурус для АИПС «Документы Великого Октября» отличался многоаспектностью, то в данном случае составители столкнулись с проблемой выявления узкоспециальной лексики. В ключевых словах стремились отразить сведения об объекте архитектуры, его местонахождении и авторе (архитекторе, строителе). Кроме того, в тезаурус были включены термины, связанные с организацией и технологией строительных работ. Пришлось столкнуться со специфической синонимией и омонимией при передаче названий объектов. Синонимия связана с изменением названий одного и того же объекта в разные периоды:

ул. НИКОЛЬСКАЯ - ул 25 ОКТЯБРЯ – ул. НИКОЛЬСКАЯ;

больница ПОЧТАМТСКАЯ – больница ПОЧТОВО-ТЕЛЕГРАФНОГО ВЕДОМСТВА;

СУХАРЕВА башня- ШКОЛА МАТЕМАТИЧЕСКИХ И НАВИГАЦКИХ НАУК - башня ЗЕМЛЯНОГО ГОРОДА.

Омонимия была связана с тем, что один и тот же объект (храм Преображения Господня, дом Юсупова) мог встречаться в разных городах. Первоначальный массив составлял 5 тыс. терминов.

По мере разработки АИПС совершенствовалась методика описания документов. Рабочий лист системы «Документы Великого Октября» включал в себя следующие элементы информации:

  • порядковый номер записи;

  • вид документа;

  • заголовок (не разделенный на элементы информации);

  • дата документа;

  • индекс по классификационной схеме;

  • номер фонда, описи, дела (для неопубликованных документов);

  • индексы названий изданий (для опубликованных документов);

  • дескрипторы, составляющие поисковый образ документа.

В АИПС «Архитектура и градостроительство» рабочий лист был более детальным. Помимо заголовка документа и дела были предусмотрены поля «вид документа», «способ воспроизведения», «указание на подлинность и копийность», «тип объекта», «улица», «часть», «номер дома», «название постройки», «имя владельца». Были разработаны инструкции по заполнению рабочих листов. 75

Эти первые автоматизированные каталоги выдержали испытание временем и функционируют до сих пор уже на ПЭВМ.

Однако тематический подход к созданию АИПС не мог удовлетворить информационные запросы всех пользователей. Архивисты задумались о создании универсальной автоматизированной поисковой системы, которая могла бы охватить все богатство содержания документов Государственного архивного фонда. Это привело к созданию общеотраслевой автоматизированной системы научно-технической информации (АСНТИ) на основе Центрального фондового каталога (ЦФК) государственного архивного фонда СССР.

Вопросы:

1) Что такое ЦФК и ФК?

2) Каким образом они формируются?

  1. На уровне какого документального комплекса описывается информация в ЦФК и ФК?

К сожалению, карточка фонда является учетным справочником и содержит мало поисковой информации о фонде (переименования фондообразователя, названия описей). Поэтому была разработана новая редакция карточки фонда – своего рода предмашинный формат – которая заполнялась наряду с традиционной и содержала такие поля как «аннотация» и «поисковый образ фонда» (дескрипторы тезауруса) (См. рис. 11).

Задание. Сравните традиционную карточку фонда (см. «Основные правила работы государственных архивов») и предмашинный формат АСНТИ (рис.11). Какие дополнительные поля были введены в предмашинный формат для увеличения поисковых возможностей карточки?

Специальные форматы были разработаны для фоно, фото, кинодокументов (см. рис. 12). В АСНТИ успели ввести данные 70 тыс. карточек фондов государственных архивов СССР. Система была реализована на базе вычислительного комплекса ВНИИДАД. Обслуживание пользователей осуществлялось по письменным запросам, направляемым через архивные учреждения. Запрос можно было заполнить с помощью сотрудника архива в читальном зале. Срок исполнения обычного запроса составлял один месяц, срочного - 2-3 дня.76Пользователю выдавались машинограммы – распечатки с записями о найденных фондах. Существовал и более оперативный способ обслуживания пользователей – с помощью дисплея, когда информация отображалась на экране. Его опробировали в ЦГАДА77.

Вопрос:

К какому виду архивных справочников относилась АСНТИ?

Судьба АСНТИ, в отличие от каталогов «Документы Великого Октября» и «Архитектура и градостроительство», сложилась печально. Данные не смогли своевременно конвертировать в формат, который можно было бы прочесть с помощью программного обеспечения для ПЭВМ. Когда в 1994 г. последний терминал комплекса ВНИИДАД вышел из строя, данные остались на магнитной ленте в виде «линейного» файла мертвым грузом. И все попытки «реанимировать» АСНТИ не дали результата.

В реализации этих проектов архивисты приобрели важный опыт решения вопросов технического, программного и лингвистического обеспечения архивных ИПС, экспорта данных на стареющих носителях78. Особенно важен для последующего развития автоматизированных архивных технологий был опыт создания тематических тезаурусов, изданных в 1980-е годы79.

В этот же период зародилось такое направления архивной информатики как применение автоматизированных систем обработки изображений для реставрации документов (АСОИЗ), начало которому положили разработки НИЦ ТД в области реставрации фото и фонодокументов80.

Во второй половине 1980-х годов в НИЦ ТД была предпринята попытка комплексной автоматизации процесса информационного поиска в архиве. Были созданы АИПС на фотодокументы и кинодокументы архива.81Кино и фотодокументы описывались предварительно на рабочих листах – предмашинном формате, с которого данные вводились непосредственно в память ЭВМ. Источником для описания кинодокументов послужило дело фильма (аннотации, монтажные листы), для описания фотодокументов – контрольные отпечатки и книги учета фотодокументов. По виду архивного справочника данные АИПС представляли собой совмещение описи и каталога. АИПС позволяла формировать в качестве отчетов систематический каталог, объектный (каталог технических объектов, подвергшихся съемке) и именной каталог.

В архиве также были разработаны фактографическая АИПС «Оборудование», выполнявшая запросы о технических паспортных характеристиках оборудования СССР (ЭВМ, фото-, киноаппаратура контрольно-измерительные приборы и др.); АИПС по контролю за физико-химическим состоянием фонда документов на пленочных носителях «Сохранность» и другие системы.

НИЦ ТД также выполнял заказы других учреждений. Например, там была разработана АИПС на фотодокументы фотохроники ТАСС, в 1986 году – автоматизированная система контроля за исполнением правительственных постановлений, решений коллегии Главархива СССР, приказов по отрасли для ГАУ при СМ СССР (реализована на микро ЭВМ «Эпл-3»). Кроме того, архивом была разработана ИПС на фонодокументы ГАФ СССР, которая с 1986 года внедрялась в Центральном государственном архиве звукозаписи (ныне - ГАРФ)82.

К 84 гг. все тематические АИПС НИЦ ТД насчитывали 80 тыс. описаний документов. 83

Интересно, что в 1970-е годы архивисты обратили внимание на необходимость автоматизации работы не только государственных, но и ведомственных архивов. В 1978 г. на заводе «Красный треугольник» (г. Ленинград) была внедрена разработанная МГИАИ ИПС «Архив», выполнявшая функции учета поступления и описания документов ведомственного архива. Система позволяла распечатать опись документов архива. Сейчас созданием специализированного программного обепечения для архивов организаций занимаются лишь немногие ведомства (архивы Государственной Дум, Центрального аппарата Банка РФ). Только в 2000 г. было начато распространение о продукта ВНИИДАД - «Архив организации».

С начала 1980-х годов архивном деле стала применяться новая разновидность технического обеспечения – оптико-механические сканирующие устройства ввода-вывода изображений. Предшественники современных сканеров были устройствами барабанного типа, которые считывали изображения с фотонегатива или фотопозитива со скоростью 100 см/с. Эти устройства осуществляли оцифрование документов - ввод изображения в память ЭВМ, при котором «картинка» автоматически раскладывалась на мельчайшие участки, затем измерялась оптическая плотность каждого участка (количество точек (пикселей) на дюйм) и записывалась в виде числа в двоичной системе счисления. После чего данные сохранялись в оперативной или внешней памяти ЭВМ. Оцифрование применялось в архивном деле для создания страхового фонда, а также для реставрации фотодокументов и восстановления угасающих текстов. Экспериментальные работы в этом направлении проводились в НИЦ ТД с начала 1980-х годов. С этой целью создавалась особая разновидность прикладного программного обеспечения, которая, в совокупности с аппаратными средствами входила в состав автоматизированных систем обработки изображений (АСОИЗ).

Архивисты упорно искали более совершенные технологии создания страхового фонда, чем микрофильмирование. Ведь при создании копий архивных документов фотографическим способом неизбежно снижается качество изображения (снижается резкость, увеличивается зернистость). Оцифрование имеет ряд преимуществ перед фотокопированием – возможность не только не терять качество сканируемого изображения, но и улучшить его посредством реставрации, возможность неограниченного воспроизведения копий без ущерба для оригинала. Оцифрование сделало возможным прием на государственное хранение и цветных фотографий. Если черно-белое изображение создавалось зернами фотографического серебра, то цветное состояло из красителей, которые разлагались в течение 10-15 лет, что делало невозможным долговременное хранение цветного изображения.

Процесс создания страхового фонда путем оцифрования состоял из следующих операций:

- прием и учет фотодокумента;

- преобразование изображения в цифровую форму (оцифрование),

- запись изображения на магнитную ленту;

- вывод контрольного негатива;

  • возврат исходного фотодокумента и передача его страховой копии на архивное хранение.

При оцифровании фотодокументов очень важны такие параметры как «шаг дискретизации» и оптическая плотность. От них зависит качество получаемого изображения. Шаг дискретизации - размер элемента изображения (который мог составлять от 25 мкм до 100 мкм в зависимости от размера фотографий). Оптическая плотность изображения – количество элементов (точек, пикселей) на единицу площади изображения (см. кв., дюйм). Чем меньше значение шага дискретизации, тем выше качество получаемого изображения. Существующие приборы позволяли настроить шаг дискретизации в зависимости от размера фотонегатива или фотопозитива. При оцифровании на дисплее создавалась гистограмма – график распределения оптической плотности по поверхности изображения.

После оцифрования документа возможна была дальнейшая работа с полученным изображением (имиджем) – его реставрация. Этот процесс включал в себя:

машинный анализ дефекта;

выбор или разработка алгоритма и программы для его устранения; исправление дефекта имиджа;

визуальная оценка результата исправления на дисплее;

обратное преобразование имиджа фотографического изображение документа;

оценка результата реставрации по фотоотпечатку.

В зависимости от того, насколько результат удовлетворителен, реставрацию либо прекращали, либо возвращались к начальной точке – анализу дефекта и выбору алгоритма его разработки.

Реставрация с помощью методов оцифрования была трудоемким процессом, поскольку еще не было специальных программ – графических редакторов, позволяющих изменять изображение в режиме «WISIVIG», когда на экране монитора сразу видишь результат. На основе анализа гистограммы изображения или статистического анализа дефектов необходимо было описать математически выявленный дефект, классифицировать его, выбрать математическую модель устранения, найти программу, содержащую алгоритм его устранения. Если этой программы не было в пакете, входящем в состав АСОИЗ, ее надо было написать. Все это осуществляли, поочередно просматривая объекты изображения размером 256 на 256 элементов.

К 1985 году в НИЦ ТД СССР было разработано около 100 прикладных программ для реставрации изображений. Среди них были специальные программы для устранения градационных дефектов (коррекция контрастности, искажений в передаче полутонов); программы для исправления частотно-контрастных дефектов (искажения в передаче мелких деталей, нерезкость изображения); программы для устранения дефектов типа помех (зернистость, растровая структура изображения, пятна, царапины и другие дефекты); программы для устранения цветовых дефектов для коррекции цветного изображения, программы для статистического анализа изображения и его дефектов, программы для автоматического выделения на изображении дефектов типа помех; прослеживания границ дефектов; программы диалоговой работы с изображением, позволяющие выделять произвольные области и изменять их с помощью произвольных параметров; программы для перемещения и преобразования (поворота, растяжения, сжатия) изображения.

К отрицательным чертам технологии оцифрования относилось трудоемкоемкость, дороговизна технологии, большой размер получаемых графических файлов, «поглощающий», соответственно, большое количество носителей информации. О трудоемкости можно судить по тому, что только на оцифрование черно-белого изображения затрачивалось в среднем 1 час, на оцифрование цветного изображения - 3 часа (цветное изображение требовало в три раза больше времени, так как создавался не один, а три файла, получаемые с помощью различных цветоделительных фильтров – красного, синего и зеленого). На обработку (реставрацию) изображения в автоматическом режиме уходило до 2 часов на одно изображение, в диалоговом режиме – до 20 часов на изображение.84Время, затраченное на разработку дополнительного программного обеспечения, естественно, сюда не входит.

При этом на одну магнитную ленту можно было записать не более 5-10 черно-белых или 2-3 цветных изображений.

Интересно, что тогда считалось, что полученный с помощью оцифрования имидж можно хранить бесконечно. Проблема формата записи графического изображения, его открытости и старения в связи со старением программного обеспечения еще не рассматривалась.

Однако все эти трудности не остановили специалистов НИЦ ТД, которые провели интереснейшие экспериментальные работы по реставрации фотографий В.И. Ленина из фондов Центрального партийного архива. В эпоху «военного коммунизма» вместо фотопленки использовалось фотостекло, которое часто разбивалось, покрывая образ вождя мирового пролетариата малопривлекательными трещинами и царапинами. Все эти дефекты удалось ликвидировать. Совместно с лабораторией консервации и реставрации документов АН СССР НИЦ ТД также проводил экспериментальные работы по восстановлению угасающего текста документа. Восстановлению текста в диалоговом режиме способствовало применение пакета прикладных программ «Диалог». Экспериментальной обработке с целью восстановления были подвергнуты угасающие газетные и рукописные тексты, а также водяные знаки и греческие пергаменты (палимпсесты) 10-11 веков, содержащие записи в несколько слоев (один поверх другого). В основе технологии восстановления текста лежало сравнение элементов поврежденного текста с так называемыми «эталонными знаками». Результаты были вполне убедительными.

Рассматривая зарубежный опыт информатизации архивного дела, можно выделить три аспекта:

  • изучение и обсуждение архивистами теоретических и методических основ автоматизации архивного дела и рассмотрение вопросов информатизации на конгрессах МСА;

  • опыт хранения машиночитаемых документов и создание исторических архивов машиночитаемых данных, развитие архивоведения машиночитаемых документов;

  • автоматизация работы архивов с традиционными документами (прежде всего, создание автоматизированного НСА).

В области создания АИПС в архивах, хранящих традиционные документы, лидерами также были США.

Еще в 1948 г. Национальный архив США (NARS) выпустил путеводитель по архиву на магнитной ленте в виде отдельных томов с классификацией по названиям ведомств-фондообразователей. В 1970-е годы в Национальном архиве были разработаны и внедрены поисковые системы SPINDEX-II (для подготовки путеводителей по различным видам документов); NARS A-I (для подготовки топографического указателя о размещении групп документов и объединения описаний серий документов85в единый файл стандартизированного формата). В системуNARS A-I ежегодно водилось 6000 серий описаний документов. Система была реализована на мини-компьютерах. В 1980-е гг. в описании документов получил распространение библиографический формат MARC, введенный в библиотеке Конгресса США еще в 1966 г. К концу 1980-х годов в основном здании NARS была создана сеть на 200 автоматизированных рабочих мест. Всеобщая система насчитывала 468 пультов доступа с емкостью основной памяти 170 МБ и 4,8 ГБ на дисковых запоминающих устройствах. Разрабатывались проекты хранения и преобразования цифровой информации на оптических дисках (ODISS). Назначение системы - суммировать данные о физическом состоянии документов, сделать более эффективным поиск документов и их реставрацию документов.86

В странах Западной Европы архивные АИПС также получили распространение, хотя и позже, чем в США.

В Государственном архиве Великобритании (PRO) была внедрена поисковая система PROSPEC и автоматизированная система контроля выдачи документов PROMT, которая печатала требования на документы, осуществляла проверку запросов, которые пользователи вводили с терминалов в специальном справочном зале. Архив Нидерландского информационного центра, хранящий кинодокументы, имел автоматизированный НСА, построенный на базе пакета прикладных программ STAIRS (АИПС создавалась с 1978 г.).

При создании архивных АИПС в странах Западной Европы и США уделялось значительное внимание стандартизации описания и форматов представления данных. В США был разработан специальный формат для архивных описаний – GSA 6710A. В Нидерландах форматы отчетов строились в соответствии с международным стандартом описания некнижных материалов (ISBD).

Рост объемов машиночитаемых документов в делопроизводстве87правительственных учреждений привел к созданию архивов машиночитаемых данных (АМЧД).

Историю подобного рода хранилищ начинают с Роуперовского центра по изучению общественного мнения (США, 1947 г.) В 1968 г. был создан отдел машиночитаемых документов в Национальном архиве США88, в 1973 г. – в составе Государственного архива Канады. С 1968 г. МЧД комплектуется Государственный архив Англии, в Швеции при Министерстве культуры и образования создается Комитет архива данных.В структуре Нацио­нального архива Франции в Фонтенбло создан Центр хранения ДМН. Осуществляют работу с ДМН и их прием национальные архивы Швеции, Дании, Нидерландов, Финляндии.

Зачастую архивы машиночитаемых данных возникали не в учреждениях государственной архивной службы, а при университетах и научных учреждениях по инициативе исследователей. Например, Международный консорциум по социальным и политическим исследованиям в Анн-Арборе (Мичиган, США), созданный в 1962 г. как сообщество исследовательского центра Мичиганского университета и 21 других университетов США. Историю создания АМЧД этой категории можно кратко представить следующей таблицей89:

Год создания

Название архива

Состав документов

Хронологические границы.

1961 г.

Центральный архив эмпирических социальных исследований в Кельне (Германия) - ZA.

Социальные науки, в

том числе история

1962

Международный консорциум по социальным и политическим исследованиям в Анн-Арборе (Мичиган, США) - ICPSR

МЧД организаций и личного происхождения по экономике, социологии, истории, управлению, психологии, политологии. .

Данные о выборах с 1789 г; данные о

голосованиях в Конгрессе США с 1790 г., данные французских переписей XIX –нач. XX века.

1967 г .

Британский архив Совета по экономическим и социальным исследованиям при университете Эссекса (Великобритания) –

ESCR DA

Экономика, социология

1971 г.

Норвежский центр машиночитаемых данных по социальным наукам при Бергенском университете (Норвегия) -NSD

Социологическе опросы (с 1964 г.), демографические сведения, базы данных об организациях, политической элите Норвегии с 1814 г.

Материалы переписей населения с 1769 г.

1972 г.

Архив Штейнмеца (Амстердам, Голландия) - STAR

Социальные науки.

1973 г.

Датский архив данных (Копенгаген/Оденсе, Дания) - DDA

Данные социологических обследований, демографические материалы, итоги выборов, сведения по промышленной социологии, криминологии, социальной медицине. законодательство, документы от средств массовой информации; сведения регионального масштаба — по географи­ческим и административно-территориальным единицам. Значительная доля ДМН — статистические источники, образованные в деятельности Датского статисти­ческого управления и Датского национального института по социальным иссле­дованиям.

Документы, начиная с Королевского финансового статуса 1660 г. (демография).

1980 г .

Шведский центр машиночитаемых данных по социальным наукам при университете Гетеборга (Швеция) - SSD.

Социальные науки, материалы социологических обследований, выборов, база данных о членах профсоюзов, библиографическая база данных газетных статей (1938-45 гг.).

Статистика выборов с 1911 г.

1989 г.

Нидерландский архив исторических данных при Лейденском университете (Голландия) - NHDA

Первый специализированный архив машиночитаемых данных по исторической науке в Европе. Банк данных по истории великих географических открытий, статистика торговли, демографическая статистика.

C XVI по XX век.

К 1990-м годам архивов такого рода было около 30 – помимо США, Канады и европейских государств они появились в Австралии, Израиле, Индии90. Из стран Восточной Европы первым стал архив социальных исследованийTARKI в Венгрии. В 1993 г. создан Центральный архив ДМН республики Беларусь. Первоначально эти хранилища создавались для нужд социологов и экономистов, специфика исторических МЧД не осознавалась. Однако, со временем в этих архивах стали создаваться исторические отделы. Изучению МЧД как исторического источника способствовало создание в 1986 г. международной ассоциации «History and Сomputing» (АНС), широко обсуждавшей эти вопросы на своих конференциях.

В странах США и Европы еще в 1970-е годы приступили к реализации программ по изучению проблем экспертизы ценности, отбору, описанию, учету и классификации МЧД, анализу носителей информации. Результатами этой работы стали несколько основополагающих рекомендаций по работе архивов с МЧД.

В области экспертизы ценности МЧД ученые США пришли к выводу, что экспертиза МЧД значительно отличается от отбора традиционных документов. К дополнительным, «техническим» критериям экспертизы они относили проверку читабельности магнитного носителя (ленты), проверку наличия сопроводительной документации к файлам. При экспертизе ценности МЧД в США имело значение степень агрегированности информации. Зав. отделом машиночитаемых данных Национального архива США Ч. Доллар предложил следующую четкую формулу: информационная ценность машиночитаемых документов обратно пропорциональна уровню их обобщения.91 Это значит, что данные переписи населения на уровне семьи более ценны, чем данные на уровне района и округа. Объясняется это просто - итоговые данные невозможно разложить на составляющие, в то время как первичные данные (данные микроуровня) - всегда можно свести при помощи ЭВМ до желаемого итога.

В Англии процесс отбора МЧД был разработан более детально и проходил в два этапа: информационный и системный анализ. В ходе информационного анализа проводилась обычная оценка содержания документов. Интересно, что информационный анализ проводился еще на стадии проектирования системы, когда оценивалось ее назначение, состав массива данных, функции и др. В ходе системного анализа на основе изучения технической документации оценивался основной файл системы, порядок его ввода и обслуживания, и, что самое важное, возможность перевода файла в единый отраслевой формат, принятый для МЧД государственным архивом Англии (Public Recods Office). Единый формат был принят для унификации данных и должен был облегчить перевод данных в новые версии (миграцию) по мере устаревания программного обеспечения. Единый стандартный архивный формат был принят также в США, Англии, Швеции.

Например, в одном из первых АМЧД – DDA (Danish Data Archives) созданном в 1973 г. (Копенгаген/Оденсе) существовал такой порядок комплектования. МЧД, созданные в различных пакетах программ конвертировались в единый формат архива (в начале 1990-х - OSIRIS). В этом формате данные хранились, а при выдаче пользователю переводились в формат той программы, с которой работал пользователь. Поскольку в DDA работали высококвалифицированные программисты, архив предоставлял пользователям за соответствующую плату вместе с копиями ДМН программное обеспечение для адаптации данных к конкрет­ным пользовательским программам.92В архиве Международного консорциума по социальным и политическим исследованиям - ICPSR (Анн-Арбор, США) единым форматом был SPSS.

При этом в некоторых архивах были установлены пределы стоимости для перевода данных в единый формат.93

Идея единого формата стала результатом «горького опыта» работы архивов МЧД на Западе, которые вступили в полосу кризиса во второй половине 1970-х - п.п.1980-х гг. Особенно обострила ситуацию «микрокомпьютерная революция» начала 1980-х г. (распространение ПЭВМ). В результате выяснилось, что революционная смена информационных технологий не влечет за собой их преемственности и документы, записанные ранее, не могут быть воспроизведены с помощью новых программных средств. Многие массивы данных были таким образом утрачены. Начались поиски выхода. Архивисты предлагали различные меры – от жесткого контроля архивной службы за системами делопроизводства в учреждениях и форматами данных до полного отказа от какого бы то ни было контроля за форматами (принимать в архив все без обиняков, а как это прочитать – проблема исследователя). Специалисты по информационным технологиям предложили свой выход – «программно независимый формат». Так, числовые данные записывались в так называемый «плоский файл» путем удаления любых ие­рархических или реляционных отношений, полей с переменной длиной, спе­циальных кодов формата и т.п.94 Это позволяло впоследствии переводить данные в различные форматы. Все 1980-е годы архивисты обсуждали различные национальные и международные форматы. Однако, единый формат не смог стать панацеей от всех бед, и в конце 1980-х годов архивы МЧД вступили в новый кризис.

За единицу учета принимался файл данных.

В области обеспечения сохранности МЧД главное внимание архивистов было обращено на носители информации. Еще в середине 1970-х было принято хранить документы на магнитных носителях. На начальных этапах автоматизации архивного дела предпочтение отдавалось магнитным лентам, а не дискам. Это не значит, что архивы отказались от комплектования документами на матричных носителях. Просто при поступлении в архив МЧД с перфокарт и перфолент они переводились на магнитные ленты. Были разработаны стандарты хранения, обращения магнитных лент, установлены сроки резервного копирования данных.

Были разработаны специальные формы для сопроводительной документации и описания МЧД. В 1981 г. отдел машиночитаемых документов Государственного архива Канады издал каталог материалов о файлах машиночитаемых данных. При использовании МЧД разрешалось их копирование пользователем за определенную плату.

Решались вопросы кадрового обеспечения архивов МЧД. Кроме архивистов в их штате были высококвалифицированные программисты.

Опыт архивов обобщался и осмысливался на конгрессах МСА. Вопрос о механизации и автоматизации работы архивов впервые был поставлен на V Брюссельском международном конгрессе архивов в 1964 г. На конгрессе было предложено создать комиссию МСА по автоматизации архивов95. Рабочая группа по автоматизации МСА была создана в 1972 г. В 1974 г. рабочая группа была преобразована в Комитет по автоматизации (ICA Committee on Automatization). С 1972 г. выходит информационный бюллетень «Автоматизация, архивы и компьютерная техника»96. В 1990-е годы КВТ разделился на два: Комитет электронных документов, изучавший проблемы комплектования архивов МЧД и Комитет по вопросам архивно-информационной техники. Комитеты занимались изданием литературы теоретического и прикладного характера, обучением архивистов и даже разработкой планов сдачи машиночитаемых документов в архивы ряда стран.

На международной конференции круглого стола архивов (МАККС) в Лондоне в 1965 г. была признана эффективность применения ЭВМ для каталогизации документов. В 1970-е годы в выступлениях архивистов зазвучали тревожные нотки. Так, в 1971 г. в докладе Баутиера на XIII заседании МАККС было высказано предположение, что если архивы безотлагательно не разработают политику применения компьютерной техники в архивах, хорошо оснащенные компьютерные подразделения фирм и предприятий придут на смену архивам и сами станут хранить наиболее важную информацию. А исследовательские центры и ВУЗы создадут для них научно-справочный аппарат. Таким образом, по мере роста числа электронных документов, государственные архивы превратятся в некомплектующиеся «хранилища древних актов». В 1972 г. на VII Международном конгрессе архивов в Москве в докладе Дж. Роудса (США) «Новая техника в архивах» указывалось, что ЭВТ и автоматизированные процессы являются главными факторами, влияющими на методику архивного дела. В докладе Э. Калифано (Италия) указывалось на необходимость международной организации, которая стала бы координирующим центром по работе с машиночитаемыми документами. В 1976 г. на конгрессе МСА в Вашингтоне проблемам хранения МЧД был посвящен специальный доклад. Автоматизированные архивные технологии рассматривались как замена человеческого труда в условиях нехватки кадров и материальных средств. Автоматизированные технологии, освободив труд архивиста от «рутинных», механических операций, призваны были сделать его более эффективным. В 1988 г. на конгресс МСА в Париже главной темой стали «Архивные документы на новых носителях». Конгресс положил конец сомнениям о том, стоит ли хранить машиночитаемые документы. В докладе Питерсона отмечалось, что работа с МЧД не вызывает потребности переосмыслить традиционную теорию архивоведения. 97Однако, практика 1990-е годов показала, что это не так.

Вместе с тем, несмотря на накопленный опыт, автоматизированные технологии не вызвали существенных изменений в методике архивного дела и на данном этапе. Такие изменения связаны с наступлением микрокомпьютерной революции. Массовое распространение с начала 1980-х годов сравнительно дешевых персональных компьютеров, интенсивная разработка программного обеспечения для ПЭВМ, совершенствование пользовательского интерфейса этих программ, появление удобных и простых для освоения непрофессионалом оболочек операционных систем, систем управления базами данных, текстовых и графических редакторов, емких и сравнительно надежных носителей информации (магнитных и оптических) сделало электронно-вычислительную технику в большинстве стран мира неотъемлемой принадлежностью рабочего места специалиста любой отрасли. Этот процесс, пусть с опозданием почти на десятилетие, затронул и отечественные архивы.

Итак, подводя итоги истории автоматизации архивного дела в нашей стране, можно сделать следующие выводы:

- процесс внедрения ААТ начался в 1920-е годы с механизации делопроизводства и ведомственных архивов. С 1960-х годов происходила механизация, а с 1980-х годов и автоматизация работы государственных архивов;

- автоматизация архивного дела затронула такие направления работы ведомственных и государственных архивов как учет документов и создание научно справочного аппарата. Особенно ценным следует признать опыт создания АИПС, их математического, программного и лингвистического обеспечения, в частности, разработку и внедрение классификаторов и тезаурусов;

- автоматизация архивного дела до 1990-х годов в большей степени затронула теорию, нежели методику архивоведения. Это проявилось в развитии информационного подхода в архивоведении под влиянием информатики с 1960-х годов и становлении теоретических основ архивоведения машиночитаемых документов, появлении междисциплинарных исследований по источниковедению МЧД;

- с 1960-х годов в нашей стране наблюдался лавинообразный рост объемов МЧД; в 1970-е годы их накоплению способствовало внедрение ОГАС и системы НТИ как части ОГАС;

- в 1970-80-е годы в отечественном архивоведении под влиянием данного процесса были разработаны научные труды и нормативного методические документы по вопросам классификации, юридической силы, комплектования и экспертизы ценности, обеспечения сохранности и описания МЧД. Но приступить к планомерному комплектованию государственных архивов МЧД не удалось.

К позитивным результатам автоматизации архивного дела можно отнести:

высокий уровень унификации делопроизводства при внедрении АСУ, чему способствовало введение ЕГСД; разработка общесоюзных классификаторов и унифицированных систем документации – все это должно было способствовать успешному решению проблемы комплектования государственных архивов МЧД;

изучение зарубежного опыта автоматизации архивного дела и возможности его применения в нашей стране, в частности идеи общеотраслевого формата;

высокий уровень теоретических разработок отечественных архивистов по вопросам автоматизации, основанный на междисциплинарном подходе, синтезе методов архивоведения, информатики, источниковедения и исторической информатики.

К печальным урокам можно отнести:

  • недостатки в техническом обеспечении информатизации архивного дела, значительное отставание в этой области от стран Европы и США;

  • недостаточное участие ГАУ при СМ СССР в разработке нормативов по делопроизводству и классификаторов, игнорирование при разработке классификаторов требований международных стандартов;

  • главной неудачей данного периода можно счесть гибель большого количества массивов МЧД, созданных в 1960-80-е годы. Причины этого, на наш взгляд, кроются в увлечении аналоговыми подходами, постулировавшими единство методов традиционного архивоведения и архивоведения МЧД, недооценка специфики МЧД, в частности технических критериев экспертизы ценности документов и революционного изменения технологий.