- •10.1. Назначение документальных ис
- •10.2. Особенности представления и использования документальной информации
- •10.2.1. Концентрация и рассеяние информации
- •10.3. Типология документальных бд (Слайд 10.8)
- •10.4. Типология поисковых задач и режимы обслуживания
- •10.5. Основные процессы обработки и хранения документальной информации
10.2. Особенности представления и использования документальной информации
Требования к полноте, точности и достоверности информации, характеру процесса поиска, а в большей степени – к выбору типов и набора информационных ресурсов, а также последующей обработке найденного зависят от характера задачи (и текущего этапа жизненного цикла). Действительно, когда задача сформулирована в сложившейся предметной области и её актуальность не вызывает сомнений, цель поиска очевидна: найти полноценное изложение метода решения задачи данного типа (например, отчет о НИР, статью, учебник и т.д., достоверность которого не подлежит сомнениям). Во многих случаях (обычно, когда мы ищем уже известный человечеству метод) это можно сделать, не прибегая к «сложным» процедурам, использующим разнообразные, но вспомогательные средства: указатели, реферативно–библиографические БД и т.д. Достаточно «просто» пролистать разделы соответствующих учебников или монографий или, в крайнем случае – подшивку специальных журналов. Предложения библиотек и информационных служб использовать специальные справочно-поисковые средства, к тому же не содержащих полных текстов, кажутся многим современным пользователям абсурдными. Их использование становится неизбежным, когда собственные «подручные» ресурсы не позволяют найти решение, а характер ОД предполагает реальную ответственность (экономическую или юридическую) за принятие решения. Общеизвестными примерами являются задачи патентного поиска, позволяющего подтвердить приоритет изобретения, или научного поиска, доказывающего новизну решения.
Существенно другая роль вторичной информации на начальном и заключительном этапах ОД, в бизнес-планировании и в задачах управления качеством. Например, при определении направления деятельности, выборе решения при неполной информации, принятии решения о начале или завершении деятельности, оценке эффективности и применимости, оценке новизны и конкурентоспособность найденного решения. Очевидно, что искать документ, содержащий ответ, можно, если мы сознательно повторяем работы, выполненные кем-то ранее. То есть, информация такого рода – общее заключение (отдельное, «дискретное» решение), может быть только синтезирована на основе многоаспектного содержательного и статистического анализа «непрерывного» потока публикаций, отражающего не только разные подходы к решению, но и разные этапы жизненного цикла идеи.
Таким образом, можно сказать, что, в отличие от задач нахождения отдельной публикации о методе решения частной проблемы, своей конкретностью предопределяющих требование точности информационного представления, задачи ОД управленческого типа (выделение отдельных типов ОД здесь достаточно условно, поскольку при принятии «управленческого» решения мы обобщаем «частные» решения, а при поиске и выборе «частного» решения мы должны ориентироваться на общие направления и использовать общепринятые критерии) предполагают широту и вариантность анализа возможных решений, что предопределяет требование полноты и многоаспектности информационного обеспечения.
Библиографический поиск обеспечивает выявление публикаций по их выходным данным, например, по именам авторов, датам публикаций и т.д. Основополагающей предпосылкой здесь является фиксированная для конкретной базы данных модель представления информации, в соответствии с которой обеспечивается нормализованная (единообразная) запись элементов данных. Все это требует от пользователя далеко не очевидных знаний определенных соглашений. Кроме того, практика показывает, что подобные соглашения не всегда соблюдаются не только для различных баз данных, но иногда даже и в рамках одной базы данных.
Тематический поиск обеспечивает отбор документов по семантическим признакам, обобщенно представляющим его содержание. Здесь концептуальным положением является то, что содержание документа может быть представлено некоторой совокупностью понятий, характеризующих основной объект. Это позволяет достаточно эффективно использовать запросы в виде компактных комбинации терминов, обычно двух-трех слов естественного или естественно-научного языка. Такое представление информации хорошо соответствует теоретико-множественным моделям поиска, однако для многих пользователей создает ситуации непонимания поискового языка и самого процесса получения результата.
Отдельным направлением в развитии информационного поиска является полнотекстовый поиск, основная цель которого – обеспечить точный отбор за счет применения критериев, основанных на семантических категориях. Но здесь, не смотря на достаточно серьезные достижения в области анализа текста и появление промышленных полнотекстовых поисковых систем (в основном в сфере СМИ), ожидать скорого широкого внедрения систем полнотекстового поиска, в том числе и в область научной информации, не приходится уже хотя бы потому, что выявить и воспринять смысл (и тем более новые идеи) в научных публикациях может не всегда и не всякий естественный интеллект. И уж тем более сомнительно автоматически построить понятийную, точно отражающую смысл, структуру по тексту запроса из трех-четырех терминов.
Также важным, но часто не замечаемым фактором является реальная ограниченность полноты представления информации в конкретном массиве (точнее, источников информации, которые используются для формирования массива). Это особенно существенно при поиске в Internet: глобальная сеть сетей физически объединяет компьютеры практически всех крупнейших библиотек мира, однако вход пользователя в сеть не приводит автоматически к возможности использовать электронный каталог какой-либо из таких библиотек. То есть, подключение к сети обеспечивает физическую доступность вычислительного комплекса хранящего ресурс, но доступность собственно информационного ресурса – обычно совокупности баз данных (документальных и фактографических массивов) и информационных технологий, часто ограничена технологическими, организационными, финансовыми или какими либо другими условиям.
