Г. Г. Воробьев ,
ДОКУМЕНТ: информационный анализ
ИЗДАТЕЛЬСТВО «НАУКА» МО,СКВА 1973
Ш^оьч
fcV?
Воробьев Г. Г. Документ: информационный анализ. М «Hav ка», 1973. • у
Рассматриваются природа и свойства документальной информации, информационные характеристики документов, типы и функции составляющих традиционного вспомогательного аппарата. Говорится о формализации предсшвляемых в документах сведений. Рассмотрен непрерывный классификационный ряд документов по уровням формализации, начиная от произвольных анкетных данных и кончая матричными документами. Книга рассчитана на широкие круги читателей. Таблиц 8. Иллюстраций 66. Библиогр. 262 назв.
Ответственный редактор
М. Л. колчинскии
cf К
В
042(02)—73
1077~~73
0
Издательство «Наука», 1973 г.
0. ВВЕДЕНИЕ
0.1. Проблема информации.— 0.2. Проблема документа.— 0.3. Науки об информации и документах.— 0.4. Новые специальности: информационные работники и документалисты
0.1. Проблема информации
Одна из особенностей нашей эпохи —популярность слова ин.- | формация, которое существовало и ранее почти во всех европейских языках, но применялось крайне редко. В переводе с этих языков «информация» означает: новости, сведения, данные, т. е. здесь нет ничего такого, что требовало бы применения специального термина. Однако такую популярность не следует считать простой данью моде. За этим кроется большая общественная проблема, которой раньше не существовало, и поэтому не было необходимости в специальном термине.
Проблема информации: возросшие объемы сведений, которые люди должны собирать, хранить, извлекать из накопленных массивов других данных, перерабатывать и передавать друг другу [60]. В 60-х годах выражения «информационный кризис», «информационный взрыв» встречались в печати особенно часто и сопровождались внушительными цифрами объемов зафиксированной информации и прироста этих объемов.
По опубликованным данным [159, 189, 192, 200, 206, 210, 214, 229, 238, 244, 247], например, ежегодно химики открывают сотни тысяч новых химических соединений, ботаники — тысячи видов растений, геохимики делают до 200 млн. анализов горных пород. Каждый год во всем мире выпускаются сотни миллиардов листов деловых бумаг, миллиарды страниц печатного текста, в том числе десятки миллионов страниц научных публикаций, сотни тысяч технических отчетов и такое же количество каталогов фирм и патентных описаний.
Число научных и технических журналов приближается или уже превысило 100 тыс. названий. При этом, как впервые установил Д. Прайс [95], прирост их происходит по экспоненциальному закону, с удесятерением количества в среднем через каждые 50 лет. Характерно, что такие же темпы прироста имеют другие
виды документальных материалов — книги, корреспонденция и даже почтовые марки. Прошоз на 2000-й год в области научной информации: 2 млрд. страниц научных изданий (в том числе приблизительно 30 млн. страниц по биологии и почти столько же по химии) [159, 192, 206]; ежегодные ассигнования на научную информацию во всем мире приблизятся к 1 млрд. долл. [210, 241].
Такие перспективы, естлствен-но, не могут не волновать специалистов. По известным словам Дж. Бернала, «во многих областях создается такое положение, когда по сути дела легче открыть новый факт или создать новую теорию, чем удостовериться, что они еще не были созданы или выведены» [60]. По мнению экономистов, скоро мы будем тратить еще больше времени на дублирование тех работ, о существовании которых не знали, или же усиленно заниматься поисками информации, не оставляя достаточно времени на проведение новых исследований. Полагают, что из-за дублирования работ тратится впустую до 85% времени ученых и инженеров [189], причем по этой и другим причинам к. п. д. труда инженерных работников вообще не превышает 10% [60]. Многие специалисты стали нелестно называть библиотеки и архивы складами листованного целлюлозного сырья. При этом они считают, что беда состоит не в том, что пишется слишком много деловых бумаг и печатается много литературы, а в том, что людям приходится читать не самое главное, в то время как до них не доходит материал, с которым важно ознакомиться [109].
Обрисованное положение заставляет обратиться к анализу режима работников умственного труда. Было подсчитано, что ученые-химики почти 45% рабочего времени тратят на сбор информации и только 6% —на обдумывание и обработку получаемых данных [203]; при этом, не удовлетворяясь существующим положением в области документации, они в 40% случаев предпочитают личные контакты, чем знакомство с литературой [136]. У руководителей научных лабораторий США на информационные процессы тратится в целом 28% рабочего времени, в СССР у начальников отделов НИИ и КБ — 42%, начальников секторов— 29%, руководителей групп — 27% [136]. До введения автоматизации и механизации в административном управлении в начале 60-х годов в США на бесполезную, «бумажную» работу тратили 600 млн. долл. ежегодно [19]. Во всех высокоразвитых странах угрожающе растут штаты канцелярских служащих (8—10% к занятым в народном хозяйстве [75]) и никакие волюнтаристские действия не в состоянии приостановить этот процесс.
В связи с этим возникает ряд важных вопросов: каково должно быть оптимальное соотношение между различными информационными процессами (письмо, чтение, разговор, коллективные встречи) у различных категорий работников умственного труда, каково значение организации и механизации в их работе и какова во всем этом роль носителей информации— документов?
0.2. Проблема документа
С повышением роли информации стал быстро эволюционировать более старый термин документ. Он возник от латинского слова documentum (доказательство, поучительный пример) и был введен в русский язык Петром I, который перевел это слово как «письменное свидетельство» [37]. Таким образом, с самого начала документы имели сугубо правовое значение и к ним причислялись разные деловые бумаги, имеющие юридическую силу. В «Энциклопедическом словаре» Ф. Павленко (СПб., 1913) мы читаем: «Документ—1) всякая бумага, составленная законным порядком и могущая служить доказательством прав на что-нибудь или выполнение каких-либо обязанностей, 2) вообще всякое письменное доказательство». Постепенно это понятие распространилось на все «важные деловые бумаги» (Толковый словарь живого великорусского языка. М., 1956, т. 1) и приобрело два дополнительных оттенка: узкий, бытовой (паспорт, удостоверение личности) и широкий, публицистический (исторический документ). В «Малой советской энциклопедии» 1959 г. (т. 3) впервые из документов (в «праве») были выделены «служебные документы» (приказы, инструкции), а в «Большой советской энциклопедии» 1962 г. (т. 15) появился самостоятельный термин: «Документ счетный — документ, служащий основанием для осуществления хозяйственных действий... и последующих бухгалтерских записей...» — в отличие от государственно-правовых, административно-правовых, су- дебно-правовых, «земельно-правовых и финансово-правовых документов.
С развитием техники, особенно вычислительной техники и кибернетики, появились новые типы материальных носителей информации: перфокарты, перфоленты, магнитные записи, фотографии, некоторые из которых приняли на себя функции административных, финансовых, научных документов. Поэтому понятие «документ» стихийно еще более расширилось. При этом de facto стали считать документами и всю печатную информацию (публикации): книги, журналы, брошюры и пр. В 1964 г. в «Терминологическом словаре по теории и практике научной информации» впервые появилось такое определение: «Документ — материальный объект, содержащий информацию в закрепленном виде». Дальнейшие толкования и уточнения [37,90,91,113] позволяют дать следующее окончательное определение документа как любого материального носителя с закрепленной информацией на любом языке и любым способом.
1 Еще в 1951 г. С. Брие на вопрос: можно ли назвать документом звезду, является л и документом камень в канаве, живой зверь — документ или нет?—отвечала: «Нет. Но документами являются фотографии и каталоги звезд, образцы в минералогическом музее и животные, занесенные в реестр и выставленные в зоопарке» [170]. Ее определение документа — это любые зафиксированные знания, которые могут быть использованы для справок, изучения и доказательства. і Такое столь широкое толкование включает в состав документных фондов не только архивы и библиотеки, но также музеи и выставки. Но специалисты в своей работе еще- не могут охватить столь широкий диапазон.
Характерным примером при рассмотрении данного вопроса являются машинные перфокарты, которые сначала получили распространение только как удобный способ фиксации промежуточных и окончательных результатов в сложных вычислительных процессах. Со временем в вычислительных центрах и на машинно-счетных станциях стали накапливаться огромные архивы таких перфокарт, которые явочным порядком приобрели значение документов, если не штучно, то в совокупностях. Еще позже на перфокарты стали часто наносить многочисленные цифровые данные о тех или иных объектах, подвергая их последующей вычислительной обработке, и в ряде случаев такие перфокарты стали гыполнять роль не вторичных, а первичных документов — счетов, нарядов, ордеров, чеков, учетных карт. Поэтому на вопрос: какую перфокарту не формально, а фактически следует считать документом? — можно ответить: ту, которая является достаточно емкой (в информационном отношении), долговечной и ценной, чтобы подвергаться достаточно продолжительным процессам обработки— хранению, поиску, дублированию, передаче и т. п.
Проблема документа продолжает волновать нас еще в одном— юридическом отношении. Существует мого нерешенных вопросов: права первичных документов на новых носителях, права копий документов на новых носителях и связанные с этим вопросы хранения и уничтожения подлинников [249], ответственность ЭВМ за правильность автоматически составленной документации [190], а также стандартизация .форм и методов обработки 'документов в связи с их обращением во многих перекрывающихся информационных системах [37].