Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Веревченко.doc
Скачиваний:
11
Добавлен:
17.08.2019
Размер:
943.62 Кб
Скачать

Раздел 4: особенности открытого потока информации

Разрушение существовавшей в СССР системы информационного обеспечения привело к существенному снижению качества и объемов общедоступных информационных ресурсов.

Большинство пользователей связывают этот процесс, в основном, с резким повышением стоимости информации, что существенно ограничило для большинства специалистов доступ к информационным ресурсам.

Остальные факторы, как правило, выпадают из анализа. Это обусловлено широко распространенным и "общепринятым" мнением (точнее, часто повторяемым утверждением), что на основании анализа открытых источников можно получить 80-90 процентов информации, необходимой для принятия решений.

Данное мнение обычно преподносится в качестве безапелляционных утверждений типа:

  1. Как и в области военного шпионажа, 95% промышленной информации может быть получено путем простого чтения прессы.

  2. Автор убежден, что изучение книг, прессы и других источников в мирное время может обеспечить получение до 80 процентов всей информации, необходимой для проведения внешней политики. [Хилсмэн Р. Стратегическая разведка и политические решения. -М.: Изд.Иностранной литературы, 1957,-192 с.]

  3. По самым грубым расчетам 80 процентов разведывательной информации добывается в результате изучении обычных, всем доступных источников-книг, газет, журналов (адмирал Роскоу Хилленкеттер).

Попытка выявить "первооткрывателя" этой "общеизвестной" истины привела к источникам, относящимся к началу нашего века. Следовательно, те, кто придерживается этого тезиса при обосновании приемов вскрытия и анализа реальной информационной ситуации в большинстве областей науки, техники, производства и управления, должны сначала доказать, что в распространении информации за последние почти сто лет не произошло никаких изменений. Но такой ответственности никто на себя не берет.

Более того, большинство исследований реальных информационных потоков свидетельствует об иных тенденциях. Например, из отчета ВНТИЦентра [Информационные процессы и их автоматизация.-М.: ГКНТ СССР, 1984,208 с.] следует, что:

  1. Более 80% сведений, заключенных в патентных документах, впоследствии НЕ ПУБЛИКУЮТСЯ в каких-либо информационных источниках. Это при условии, что ряд патентных ведомств владеет огромными массивами патентной информации, размеры которых достигают 20-30 млн. документов с ретроспективой до 50 лет, а по некоторым странам - до 100 лет.

  2. Большая часть отчетов, НИОКР, диссертаций, (70-80% по различным оценкам), никогда не публикуется, а публикуемые сведения появляются в научной печати со значительными (до нескольких лет) запаздыванием, причем эти публикации, как правило, не дают необходимой подробной информации.

Ознакомление с исследованиями о доступности информационных ресурсов, позволяет утверждать, что реальные возможности доступа к информации более правильно оценивать следующим образом:

  1. Анализ открытых источников позволяет выявить порядка 60-70 процентов информации, относящейся к общетеоретическим и общетехническим вопросам и составляющей исходную базу при решении научных, технических и производственных проблем. Условно назовем этот уровень "базовым". Базовый уровень позволяет иметь представление лишь о том, какие задачи и на какой общетехнической базе могут решаться, но не позволяет ответить на вопрос: как будет решена та или иная конкретная проблема. Эта информация относится к знаниям, обеспечивающим необходимый "средний" уровень подготовки кадров любой квалификации, но не раскрывает наиболее важных и перспективных разработок, методов и приемов работы, особенностей технологий и т.п. Базовый уровень нашего знания наиболее полно обеспечен открытым потоком публикаций.

  2. При переходе к изучению конкретных применений научно-конструкторских разработок в любой области открытые публикации становятся все менее надежным источником информации. Они охватывают не более 10-30 процентов информации, полученной в ходе выполнения НИОКР. Это, как правило, разрозненные данные, не позволяющие проводить необходимые обобщения и реконструкцию истинных направлений разработок.

  3. Переход к оценке и изучению производственно-экономических вопросов, определяющих состояние и технологию промышленного производства конкретных видов продукции, еще более снижает долю открытых источников (она не превышает 10-15 процентов, а по вопросам рынка и политики предприятий, фирм, исследовательских групп и организаций и т.п. снижается до долей процента).

Приведенные данные характеризуют предельные возможности по полноте потока открытых публикаций. Реальное положение, определяемое наличием открытых зарубежных публикаций в фондах ГСНТИ и коммерческих структурах, свидетельствует, что имеющийся поток значительного числа типов научно-технических документов (НИОКР, конструкторско-технологическая документация и экономическая информация) в настоящее время не позволяет достигнуть указанных выше величин.

Далее, необходимо иметь в виду, что процессы, происходящие в стране после августа 1991 г., еще сильнее обострили ситуацию информационного обеспечения. Ибо в результате развала всей инфраструктуры информационных ресурсов произошло катастрофическое снижение возможности доступа ко всем видам информации и засорение информационных потоков информацией малой надежности и достоверности.

До 1991 г. СССР в целом обеспечивал поступление в страну от 30 до 50 процентов зарубежных научно-технических документальных ресурсов и их широкое распространение через Государственную систему научно-технической информации. При этом высокая степень централизации и специализации информационных технологий позволяла существенно сокращать затраты на основные операции обработки всех потоков информации.

В 1991-1992 гг. фактически прекратилось комплектование зарубежной научно-технической литературой, вызванное прекращением валютного финансирования крупнейших (бывших союзных) центров научно-технической информации.

Кроме этого, принципиально изменился состав организационных единиц, создающих все виды информационных ресурсов в стране.

Россия, в лучшем случае, может рассчитывать на те информационные ресурсы, которые сохранились на территории РСФСР.

По данным "Концепции научно-технологической политики Российской федерации" на территории России по состоянию на 1 января 1991 г. было 58,3% от всех организаций СССР, осуществлявших научно-технические работы. Они выполняли 78,8% всех НИР бывшего Союза; 74,7% конструкторских и технологических работ; 75,2% опытных работ; 73,8% строительного проектирования; 70,0% научно-технических услуг. Но это при условии, что все организации выполняли свои работы в тесном взаимодействии с другими республиками, и уровнях финансирования, существовавших до 1991 г.

Но ныне этот уровень недостижим, ибо произошло сокращение числа научно-исследовательских организаций, изменилась система связей между ними, существенно сокращено финансирования, произошли значительные кадровые сокращения в системе организаций, осуществляющих научно-технические работы, нарушена вся система научно-технических изданий, распалась Государственная систем научно-технической информации.

Все это позволяет с высокой степенью вероятности предполагать, что в ближайшее время количество и качество информации в открытых потоках будет только снижаться. Тем более что на государственном уровне не осуществляется сколь-нибудь действенных мер по защите и сохранению информационных ресурсов страны.

Надеяться же на то, что "запад нам поможет, в лучшем случае, ГЛУПО.

Утверждение о существенной неполноте открытых потоков информации свидетельствует лишь о том, что наиболее важная информация недоступна большинству потенциальных пользователей. БОЛЕЕ ВАЖНЫМ является то, что в открытом потоке велик процент информации, не позволяющей принимать эффективные информационные решения.

Это вызвано тем, что документы открытого информационного потока имеют следующую особенность, с одной стороны, они сообщают некоторую информацию, цель которой привлечь внимание к данной проблеме, методу, объекту исследования, утвердить свое авторство (приоритет), иногда вызвать обсуждение и дискуссию по неясным, труднорешаемым проблемам, но, с другой стороны, в них содержится лишь некоторый минимум данных, как правило, исключающий использование приводимой информации без привлечения дополнительных документов, доступ к которым ограничен, либо необходимо приглашение самого автора, ибо только он обладает теми недостающими сведениями, которые позволяют повторить результат. Иначе повторение разработки потребует значительных дополнительных затрат на исследования.

Даже в патентах и других документах, выполняющих функцию защиты экономических интересов "субъектов права", информация представляется таким образом, "чтобы она была научно правильной, но незаконная реализация изобретения на основании опубликованных данных оказалась намного дороже, чем приобретение патентной лицензии".[7,с.11]. "Патентные эксперты хорошо знают, что подлинная ценность изобретения и изобретателей определяется некоторым неуловимым, во всяком случае, пока мало изученным свойством - ценностью идей. В связи с этим возникла целая система приемов "упаковки" духовных ценностей в области науки при их патентовании. СКРЫТАЯ ЦЕЛЬ ЛЮБОГО БЮРО ПАТЕНТОВ СОСТОИТ В ТОМ, ЧТОБЫ КАК МОЖНО БОЛЕЕ ЗАМАСКИРОВАТЬ ЦЕННУЮ ИДЕЮ ПОД РЕАЛИЗУЮЩЕЕ ЕЕ (А, ЗНАЧИТ, ОСУЩЕСТВИМОЕ), НО ПО ВОЗМОЖНОСТИ МАЛОЦЕННОЕ УСТРОЙСТВО. ТАКОЕ УСТРОЙСТВО ВСЕГДА ОПИСЫВАЕТСЯ С СОЗНАТЕЛЬНЫМ НАМЕРЕНИЕМ МАКСИМАЛЬНО ЗАВУАЛИРОВАТЬ ПРИНЦИП, ЛЕЖАЩИЙ В ЕГО ОСНОВЕ, ДА И САМО УСТРОЙСТВО, ПО КРАЙНЕЙ МЕРЕ, В ОГРОМНОМ ЧИСЛЕ СЛУЧАЕВ, ВЕСЬМА ДАЛЕКО ОТ САМОЙ СУЩНОСТИ ИЗОБРЕТЕНИЯ. Ведь идею, как таковую, отличает именно то, что она допускает большое разнообразие конкретных реализаций" [7,с.95]. Поэтому даже патенты, значение которых при решении ряда задач прогнозирования обычно оцениваются очень высоко, требуют более тщательного анализа при оценке описанных в них технических достижений. Об этом свидетельствует появление таких определений, присоединяемых к патентам: "бумажный", "отпугивающий", "заградительный", "дезинформирующий". [14,с.25].

Засорение информационных потоков недостоверными, непроверенными данными значительно усложняет работу по использованию опубликованных документов. Например, имеются сведения о строительстве завода по производству брома, стоимостью около 30 млн. долларов, который в результате использования недостоверных данных, заложенных в технологические процессы, не смог выдавать запланированной продукции. Значительное число примеров преднамеренной фальсификации приведено в работе[9], там же указывается, что плохих данных больше, чем хороших. Существует много областей экономики, где о качестве информации мы имеем лишь слабое представление, поскольку по ним вообще отсутствуют данные.

Все это показывает, что утверждения о высокой степени достоверности данных в открытых публикациях также требует критической оценки.

Это обусловлено следующими причинами:

  1. Выводы о достоверности делаются на основании многочисленного числа источников информации за длительный промежуток времени, включающий как первые публикации об объектах, так и публикации, относящиеся к моменту поступления объекта в эксплуатацию, а иногда и снятия объекта с производства. Т.е. производится ретроспективная оценка прошедшего опыта, когда объект заменяется новым и становится объектом критики, а не объектом, данные о котором подлежат сокрытию.

  2. Рассматриваются данные об объекте без оценки важности различных групп данных с точки зрения решаемых задач. Так значительное число данных по геометрическим и весовым характеристикам и их сравнительно высокая точность скрывает отсутствие данных по другим характеристикам (назначению объекта, принципам функционирования, особенности технологии производства и эксплуатации, недостатки, недоработки, слабые места, неудачные решения и т.д.). Например, в одной из работ проанализировано 4895 характеристик и параметров авиационной, ракетной и космической техники, из них 2144(41%) - геометрические и весовые, 784(около 16%) - летно-тактические, 400(около 8%) - вооружение.

  3. Не всегда уточняется, что понимается под достоверным значением исследуемого параметра и какая степень совпадения с достоверным значением принимается за совпадение. Например, в одной из работ одни и те же данные, отличающиеся друг от друга не более чем на 10% учитываются один раз и считаются достоверными, а в другой - за "истинное значение" принимается первое по дате появления.

  4. Ряд исследований, проводившихся органами НТИ в 70-х годах, показывают, что около 50% всех публикуемых за рубежом данных - это разрозненные данные, кроме этого имеется большое число "белых пятен", для маскировки которых используются пустые (фиктивные) данные.

  5. Наличием за рубежом разработанной системы "обезличивания" информации и "целевого" регулирования информации в совокупном потоке публикаций.

Анализ достоверности данных по двум классам объектов (ЭВМ и запоминающие устройства, проведенный вмассиве 7000 параметров, взятых из различных источников [10], выявил следующие основные группы причин, порождающие отклонения в значениях параметров: различная мера точности, варьирование данных (указывается либо диапазон, либо минимум, либо усредненная величина и т.п., но характер величин не оговаривается); различные размерности (в ряде случаев пересчет к единой размерности не возможен); изменение данных в результате модернизации, изменении технологии выпуска, различия в конфигурации объекта; опечатки; наличие нескольких фирм изготовителей (приводит к множественности вариантов, наименований и т.п.); отсутствие единых схем описания объектов; тенденциозный подбор данных; сознательная дезинформация; неопознанные причины, вызванные недостаточной информацией по объекту.

Уже сам перечень групп показывает, что выявление достоверной информации из документов требует разработки широкого спектра специальных мер, приемов и методов оценки пригодности данных и использованию их к принятию решений.

Начавшийся процесс накопления фактографических данных в памяти информационных систем показал, что ни одна из характеристик не может считаться достоверной пока не проведена ее проверка на достоверность. При создании массивов фактографических данных, в них должны накапливаться ВСЕ данные, встречающиеся в доступных пользователю источниках информации, а не только "достоверные", ибо только в этом случае создаются предпосылки для выявления противоречивых данных, исключаются случаи исключения "неудобных" данных и пропуска сложных ситуаций.

Под сложной ситуацией понимаются данные о "необычном", "невозможном" использовании известных средств и методов, "принципиально невозможных" явлениях и действиях, т.е. все то, что не укладывается в тезаурус отдельного исполнителя и/или целого коллектива исполнителей.

"Дезинформационный взрыв" породил ряд сложных проблем, решение которых невозможно без разработки специальных методов изучения и выявления фальсифицированных, скрытых или искаженных данных. При использовании недостоверных данных обесцениваются или вообще становится бесполезной другая информация, обладающая высокой степенью точности. При этом особое внимание должно уделяться достоверности СОВОКУПНОСТИ СИСТЕМЫ ДАННЫХ, что является в ряде случаев более важным фактом, чем достижение высокой точности отдельных групп данных.

Особо следует подчеркнуть, что некритическое использование публикуемых данных может привести к серьезным последствиям при принятии решений. Необходимо постоянное отслеживание достоверности данных и эффективности, принимаемых на их основе решений, т.е. при использовании данных должна сохраняться возможность восстановления "прошлых" решений на основе имеющихся данных, ибо только сохранение "цепочек оценки данных" позволяет отслеживать причины неправильных решений и источники недостоверных данных, используемых при принятии решений.

Выявление недостоверной и устаревшей информации, циркулирующей в документах, становится одной из важнейших задач, так как публикуемые в документах данные, в ряде случаев, позволяют подтвердить и обосновать "даже противоречивые решения и научные гипотезы, построить теоретические модели, дающие противоположные результаты".

Наиболее простым, но достаточно надежным и эффективным методом локализации некачественной информации, является издание перечней документов, содержащих устаревшие и недостоверные данные.

Более действенным методом обеспечения науки, техники и производства достоверными данными является осуществление сложных, комплексных государственных и международных программ, направленных на сбор, оценку и нормализацию различных видов данных. Например, Государственная служба стандартных и справочных данных и др.

Для повышения эффективности использования открытого потока информации используются следующие методы:

  1. Анализ тематической направленности открытого потока публикаций и динамики публикаций по всем областям науки и техники. При этом особое внимание должно уделяться вновь появившимся направлениям исследований и тем областям знаний, в которых происходит колебание числа публикаций.

  2. Выявление из открытого потока публикаций, ранее подлежавших засекречиванию, и формирование из этих публикаций самостоятельного массива. На базе ранее засекреченных публикаций необходимо проводить ретроспективные сравнения (независимо от сроков давности) тематики открытых и закрытых работ. Это позволит проводить оценку ранее принятых решений, а также уточнять связи между закрытыми и открытыми публикациями и выявлять причины рассекречивания документов (исследований).

  3. Получение сводных перечней научных кадров по странам, областям знаний, фирмам, научным коллективам. Отслеживанию должны подвергаться авторы, имеющие хотя бы одну открытую работу по тематике, которая представляет интерес при оценке. Кроме перечней необходимо выявлять связные совокупности авторов по: тематикам и проблемам; взаимным публикациям; местам работы, совместному участию в научных конференциях, симпозиумах; по принадлежности к научным школам и коллективам; участию во взаимосвязанных разработках и исследованиях; ученым степеням и оценкам научной квалификации ("гамбургский счет"), а также степени самостоятельности в решении научно-технических задач и уровню их новизны, оригинальности подходов и проектных решений и т.д.

  4. Сопоставление открытых и закрытых источников информации по одной и той же тематики с целью выявления: аспектов информации, по которым идет закрытие; направлений дезинформации; определение предмета засекречивания (истинное наименование и/или специфическая функция, выполняемая объектом, и/или значение характеристики, и/или принцип действия, и/или ресурсы, необходимые для производства и т.д.); определение сопутствующих признаков (несекретных), по которым могут быть выявлены открытые разработки, связанные с той или иной частью закрытых исследований.

  5. Выявление отечественных исследований, к которым проявляется повышенный интерес зарубежных исследователей. А также сбор и анализ негативных и нейтральных оценок в отношении разработок, имеющих приоритетные оценки внутри страны.

  6. Выявление недостоверных и устаревших публикаций и связанных с ними исследований, разработок, проектов. Составление перечней недостоверных данных.

  7. Выявление взаимосвязанных множеств публикаций, на базе которых могут быть подготовлены сводные обзоры, а также выявлены перечни тематик, проблем, по которым отсутствуют публикации (имеются информационные "белые пятна").

  8. Построение сравнительных ранжированных (по уровню информированности, изученности и проработанности) тематических перечней раздельно по отечественным и зарубежным публикациям и их сопоставление. В ряде случаев необходимо вести не совокупный анализ, а анализ по схемам: "предприятие-предприятие", "предприятие-группа предприятий", "страна-страна" и т.п. Хорошим и эффективным примером анализа по подобным схемам являются сопоставительные анализы, проводимые Гарфилдом для выявления степени участия различных стран в решении конкретных проблем.

  9. Составление перечней труднодоступных документов и массивов, существующих в конкретных странах и содержащих информацию по интересующим проблемам, с целью направленного поиска требуемой информации. Указанное направление работ недостаточно проработано, а это приводит к тому, что затрачиваются значительные усилия на получение, оценку и анализ второстепенных источников, вместо того, чтобы осуществлять целенаправленный поиск исходного документа.

При проведении анализа необходимо учитывать, что существуют специальные методы, обеспечивающие "обезличивание" информации, что значительно затрудняет аналитическую обработку открытых источников информации.

Различают две группы методов:

  • методы, используемые на уровне единичной публикации;

  • методы "обезличивания" информации на совокупности публикаций. Для единичных публикаций наиболее распространены методы уже упоминавшиеся выше: изложение общей идеи и соображений по предмету исследований, демонстрация методов и результатов исследований с потребительской стороны, т.е. излагается выгода, возможное применение, общая схема, но не дается углубленного изложения, позволяющего повторить полученные результаты, вскрыть заложенные в объекте новые идеи, решения, принципы; изложение проводится применительно к предмету представленному в публикации без связи с основными целями проводившихся исследований.

Например, анализ значительного числа публикаций по методам закрытия информации в автоматизированных системах позволяет сделать вывод о необходимости разработки систем защиты, получить перечень основных методов защиты, но, практически, отсутствуют подходы, реализация которых позволяет реализовать надежную систему закрытия, либо средств "взлома".

Закрытие на уровне отдельной публикации не решает проблемы, необходим комплекс мероприятий по "обезличиванию" нформации на уровне совокупности публикаций.

В основе методов обезличивания информации лежат следующие основные принципы:

  • Разделение публикации на несколько групп данных, каждая из которых имеет различный уровень засекречивания (от несекретно до самых высоких грифов).

  • Формирование нескольких каналов информирования об одной и той же публикации (т.е. одна и та же публикация, в зависимости от того, какая группа данных включается в информационное издание, может сообщать различную информацию о публикации). Это позволяет привлекать к информационному документу различные группы пользователей, не разглашая определенных групп сведений.

  • "Электронная цензура" всей совокупности данных, включаемых в информационные издания, на основе максимально нормализованной терминологии. Это полностью исключает "утечку" новой, неразрешенной к публикации информации. При этом осуществляется разрыв связей между совокупностью документов (для несанкционированного пользователя) за счет выделения указанных связей в группу закрытых данных.

  • Выделения из общей совокупности групп данных, которые не публикуются в печатных изданиях, а отражаются только на машинных носителях и доступных только в автоматизированном режиме, и доступ к которым строго регламентирован за счет реализации процедур защиты. Такие массивы никогда не публикуются в обобщенном виде.

  • Обмен массивами только по каналам связи между строго регламентированными категориями пользователей.

  • Публикация только библиографических описаний документов с представлением самих документов на особых условиях.

  • Сосредоточение результатов обработки в автоматизированных центрах. На запрос выдаются только конкретные данные, массивы - не передаются. Это создает следующую ситуацию:

    • обеспечивается защита от серии запросов, каждый из которых несекретен, но по совокупности позволяет получить закрытую информацию;

    • перед выдачей возможно любое редактирование результатов (данных), в зависимости от уровня допуска;

    • система аккумулирует запросы и на их основе вскрывает интересы пользователя;

    • контроль за всеми ссылками, указанными в публикациях, с целью выявления "неучтенных" в системах информации документов. Однако следует обратить внимание на все более широкое распространение новых видов публикаций (например, индексные издания), в которых полностью отсутствуют ссылки на используемую литературу, информацию о которой пользователь может получить только за дополнительную оплату и только к заказанной статье. Это полностью исключает работу по схеме SCI.

Подобные методы закрытия позволяют, при необходимости, формировать у конкретных пользователей "ИСКАЖЕННОЕ ИНФОРМАЦИОННОЕ ОТРАЖЕНИЕ" исследуемых проблем.

Все это ведет к жесткому регулированию ("невидимому" для большинства пользователей) открытого потока информации.