
- •Управление информационными ресурсами
- •Кафедра информационных технологий
- •Оглавление
- •Глава 1. Экономика знаний. Рынок информации и знаний и его роль в управлении экономикой и в развитии общества.................................................. 9
- •Глава 2. Состояние мирового рынка информации............................................. 47
- •Глава 4. Информационные образовательные ресурсы.................................. 137
- •Глава 5. Международные и российские
- •Глава 6. Зарубежный и российский рынки знаний............................................. 180
- •Глава 7. Технологии доступа к информационным
- •Предисловие
- •Глава 1 экономика знаний. Рынок информации и знаний и его роль в управлении экономикой и в развитии общества
- •1.1. Основные понятия
- •1,2. Роль информации в развитии общества
- •Число персональных компьютеров и число подключений к Интернету для стран "Большой восьмерки"
- •1.3. Роль информации в экономике
- •1.4. Государственное управление информационными ресурсами
- •1.4.1. Государственные информационные ресурсы
- •1.4.2. Представление информации в государственные информационные ресурсы
- •1.4.3. Категории доступа к информации
- •1.4.4. Ограничения на содержимое средств массовой информации
- •1.4.5. Авторское право
- •1.5. Управление информационными ресурсами на предприятии, фирме
- •1.5.1. Информационные потребности при планировании деятельности предприятия
- •Менеджмент:
- •1.5.2. Бизнес-план и выявление требований к информационному обеспечению
- •1.5.3. Внешнеэкономическая деятельность и выявление требований к информационному обеспечению
- •1.5.4. Методика решения задач кредитования в банке и выявление требований к информационному обеспечению
- •Требования к информации на первом этапе
- •Вопросы для самопроверки
- •Глава 2 состояние мирового рынка информации
- •2.1. Этапы развития мирового рынка информации
- •2.2. Профессиональные базы Информационная корпорация
- •("Дан энд Брэдстрит")
- •Информационная корпорация QuestelOrbit
- •Информационное агентство LexisNexis
- •2.3. Деловые ресурсы Интернета
- •2.4. Виды информации в Интернете и профессиональных базах
- •Вопросы для самопроверки
- •Глава 3 состояние российского рынка информации
- •3.1. Справочная правовая информация
- •3.1.1. Государственные системы справочной правовой информации
- •3.1.2. Коммерческие системы справочной правовой информации
- •"КонсультантПлюс"
- •Консорциум "Кодекс"
- •Юридическое информационное агентство intralex
- •Компания "арбт"
- •3.2. Биржевая и финансовая информация
- •3.2.1. Основные зарубежные производители информационных продуктов и услуг на биржевом и финансовом рынках
- •Агентство Рейтер
- •Агентство Телерейт
- •Агентство Тенфор
- •Агентство "Блумберг"
- •3.2.2. Российские информационные агентства и службы в сфере биржевой и финансовой информации Информационное агентство РосБизнесКонсалтинг
- •Акционерное общество ак&м
- •Информационная коммерческая система "Международные информационные рынки" (икс мир)
- •Информационное агентство "Финмаркет"
- •Компания Парк.Ру
- •Агентство экономической информации "прайм-тасс"
- •Общество с ограниченной ответственностью мфд "ИнфоЦентр".
- •Состав информации и ее стоимость в пакете
- •Агентство "Интериндекс"
- •Агентство Интерфакс
- •3.3. Коммерческая информация
- •Агентство деловой информации (ади) Бизнес-Карта
- •Агентство "асу-Импульс"
- •"ИнформСистема"
- •Инфогруппа Компас
- •Институт промышленного развития (Информэлектро) Министерства экономического развития и торговли Российской Федерации
- •Информационное агентство "Норма"
- •Информационно-консультативный центр "Мосвнешинформ"
- •Информационное агентство Вдохновение
- •Агентство социум инфополис
- •Вопросы для самопроверки
- •Глава 4 информационные образовательные ресурсы
- •4.1. Виды информационных образовательных ресурсов
- •Образовательные порталы
- •Образовательные порталы
- •4.2. Уровни интеграции информационных ресурсов в образовании
- •4.3. Использование электронных информационных ресурсов в учебном процессе
- •4.3.1. Информационная грамотность
- •4.3.2. Обучение на базе мировых информационных ресурсов
- •Вопросы для самопроверки
- •Глава 5 международные и российские статистические ресурсы
- •5.1. Система международной статистики
- •5.2. Национальные системы статистики
- •5.3. Использование статистической информации в экономике и социологии
- •5.4. Федеральная служба государственной статистики (Росстат)
- •5.5. Статистические ресурсы в Интернете
- •Вопросы для самопроверки
- •Глава 6 зарубежный и российский рынки знаний
- •6.1. Зарубежный рынок знаний
- •6.2. Российский рынок знаний
- •6.2.1. Библиотечная сеть
- •Перечень библиотечно-информационных организаций, получающих из Российской книжной палаты обязательный бесплатный федеральный экземпляр изданий
- •6.2.2 Электронные библиотеки
- •6.2.3. Система научно-технической информации
- •Информация, предоставляемая федеральными органами нти
- •6.2.4. Система патентной информации
- •Взаимный обмен патентной документацией
- •Вопросы для самопроверки
- •Глава 7 технологии доступа к информационным ресурсам и ресурсам знаний
- •Выбор информационных ресурсов
- •Поиск информации в профессиональных базах
- •7.3. Технологии доступа к деловым ресурсам Интернета
- •Поисковые машины
- •Каталоги в Интернете
- •7.4. Технологии доступа к информации в электронных библиотеках
- •Процессы аналитико-синтетической обработки
- •Классификация информационных продуктов и услуг библиотек
- •7.5. Сравнительные характеристики эффективности поиска в различных системах и оценка достоверности
- •Вопросы для самопроверки
7.5. Сравнительные характеристики эффективности поиска в различных системах и оценка достоверности
Первые полнотекстовые информационно-поисковые системы (Full Retrieval System) появились в начале компьютерной эры. Назначением этих систем был поиск в библиотечных каталогах, архивах, массивах документов, таких, как статьи, нормативные акты, рефераты, диссертации, монографии. Первоначально информационно-поисковые системы применялись преимущественно в библиотечном деле и в системах научно-технической информации.
В начале 1970-х гг. уже коммерческие компьютерные службы начали предоставлять возможность интерактивного поиска в тематических базах данных. Некоторые из тех служб существуют и сегодня — основанная еще в 1965 г. система "Диалог", входящая в настоящее время в корпорацию Thomson, сегодня обеспечивает своим клиентам доступ к 900 базам данных и является одной из наиболее эффективных информационных служб.
Из наиболее важных показателей эффективности информационных систем, содержащих текстовую информацию, можно отметить семантические показатели, которые основаны на оценке релевантности между документами и запросами.
Релевантность — объективно существующее смысловое соответствие между содержанием документа и запроса. Объективность оценок релевантности обеспечивается тем, что они устанавливаются экспертным путем, а не автором запроса.
Семантическими показателями являются полнота выдачи (потери информации) и точность выдачи (информационный шум).
Введем следующие обозначения:
а — множество релевантных и выданных системой документов;
б — множество нерелевантных, но выданных системой документов;
в — множество релевантных, но не выданных системой документов;
Другой группой показателей оценки эффективности документальных информационных систем являются прагматические показатели. Эти показатели можно определить только в процессе эксплуатации информационной системы. Прагматические показатели определяют абоненты системы на базе оценок пертинент- ности выданных документов.
Пертинентность — это субъективно оцениваемое соответствие содержания документов или текстов информационным интересам потребителя. Пертинентность может оценить только автор запроса, работающий с информационной системой. Оценки пер- тинентности, как правило, отличаются от результатов, полученных на основе оценок релевантности.
Рассмотрим вопросы оценки эффективности поиска в профессиональных базах и деловых ресурсах Интернета.
Анализ содержимого профессиональных баз за последние 15 лет показывает неуклонный рост доли текстовой информации в общем объеме информации. Если в 1985 г. доля текстовой информации составляла 47%, то в 2000 г. эта доля была уже 84%. Представляется, что основная информация в Интернете также является текстовой. Эти обстоятельства позволяют сделать вывод о том, что подходы к оценке эффективности поиска в документальных системах в полной мере распространяются и на профессиональные базы, и на информационные ресурсы Интернета.
Рассмотрим специфику информационных ресурсов Интернета и имеющихся в среде Интернета поисковых средств, которые оказывают существенное влияние на эффективность поиска в этой среде.
1.Основными поисковыми средствами в Интернете являются поисковые системы и каталоги.
В связи с тем, что в средствах поиска в Интернете не используются информационно-поисковые языки, на которых должны были быть описаны исходные документы и запросы, полнота поиска в Интернете с учетом описанных выше поисковых средств будет значительно ниже, чем в документальных системах, построенных на базе информационно-поисковых языков. Поисковые машины включают в свою базу поиска (индекс) лишь незначительную часть от всех ресурсов Интернета, из-за особенностей структуры Интернета и самих поисковых машин [45].
Особенности информационных ресурсов Интернета и поисковых средств позволяют сделать вывод о том, что эффективность поиска информации в Интернете существенно уступает эффективности поиска информации в документальных информационно-поисковых системах, использующих специальные информационно-поисковые языки, и эффективности поиска в профессиональных базах. Эти обстоятельства определяют те высокие требования к профессиональной подготовке пользователя, которые необходимы для получения нужной информации из информационных ресурсов Интернета.
Организация информации в профессиональных базах отличается от организации информации в Интернете в первую очередь тем, что информация накапливается и постоянно обновляется в базах данных, которых в настоящее время свыше 19 тыс. В каждой базе накапливается специфичная информация. Отбор достоверных источников и накопление информации ведут информационные агентства-генераторы. Они же поддерживают эти базы в актуальном состоянии, т. е. обновляют. Предоставление информации из баз потребителям осуществляют агентства- поставщики. Потребителю предоставляется язык запроса и документация, характеризующая базы данных. По каждой базе имеется название, отражающее вид информации, хранимой в базе, с какого времени ведется база, объем накопленной информации, период обновления, источники предоставления информации.
Указанные особенности обеспечивают высокие показатели по достоверности, полноте и точности предоставляемой информации.
Одним из важнейших показателей, характеризующих полученную из других источников информацию, является ее достоверность. Достоверность — это степень соответствия информации об объекте его реальному состоянию.
Процесс оценки достоверности информации — это сложный аналитический процесс, зависящий от многих факторов. Невозможно дать какую-то единую схему, которую можно применять в любых случаях. Однако следует рассмотреть некоторые типичные случаи и выявить факторы, которые влияют на оценку достоверности.
В первую очередь это знания человека, производящего оценку достоверности информации. Оценивающий информацию должен знать процесс поступления информации к нему от первичного источника. В любом случае должна проводиться оценка надежности этого первичного источника: в первом случае это конкретное лицо, например автор статьи в газете, во втором случае это известное информационное агентство, имеющее свою службу контроля качества предоставляемой им информации. Автором статьи тоже может быть надежный и независимый корреспондент.
Ряд ведущих мировых информационных агентств работает на информационном рынке более 150 лет. Успешный бизнес таких агентств, как Рейтер, Доу Джонс, Дан & Бред стрит, определяется тем вниманием, которое они уделяют вопросам достоверности предоставляемой потребителям информации. Молодые агентства, работающие на мировом информационном рынке лишь десятки лет, также уделяют вопросам достоверности информации самое пристальное внимание.
Кроме первичного источника в цепи формирования информации может быть одно или несколько звеньев, которые корректируют полученную от первичного источника информацию и могут вносить свои искажения. Глава правительства Великобритании Уинстон Черчилль во время Второй мировой войны получал от разведывательной службы донесения, построенные на базе агентурных сообщений. Зная, что руководство разведывательной службы интерпретирует первичную информацию в выгодном для себя свете, Черчилль заставил представлять ему от ведущих агентов донесения напрямую и сам производил оценку достоверности этих сообщений.
К каждому виду информации при оценке достоверности должен быть свой подход.
Достоверность одного вида информации не зависит от времени. Примером такого вида информации может служить, например, год регистрации фирмы.
Достоверность другого вида информации зависит от времени. Примером такого вида информации является адрес проживания лица или юридический адрес организации. Пусть нам необходимо срочно найти адрес студента. Мы знаем, что при поступлении в вуз студент заполнял анкету и указывал там свой домашний адрес. Как правило, в процессе учебы эти сведения не корректируются. Если мы обратимся в отдел кадров за справкой о месте жительства студента-первокурсника, то достоверность этих сведений будет достаточно высокой. Если мы обратимся за адресом студента выпускного курса, то достоверность полученных сведений будет существенно ниже. Это происходит из-за того, что по статистике человек за свою жизнь 6—7 раз меняет свое постоянное место жительства.
Широкое распространение в России получили бизнес-справочники — регистры предприятий. Наряду с другими признаками в этих справочниках имеется юридический адрес предприятия. При оценке достоверности значения этого признака необходимо учитывать, что издаются эти справочники раз в год и на сбор информации и издание этого справочника также требуется время. За это время происходит старение информации и снижается ее достоверность.
При оценке достоверности большое значение имеет уровень подготовки специалиста, оценивающего достоверность информации, его эрудиция, знание предметной области. Одним из действенных методов является сравнение значения признака объекта с возможными границами его значений.
Искажения информации могут быть самой различной природы. Это могут быть случайные и систематические (методические) ошибки, а также преднамеренные искажения и дезинформация.
Можно выделить несколько обобщенных подходов к оценке достоверности информации.
Выявление, к каким источникам относится поступающая информация — первичным или вторичным.
Определение надежности источника информации.
Выявление логических несоответствий в поступающей информации.
Изучение контекста, в котором излагаются определенные факты и сведения.
Выделение информации, основанной на предрассудках, обмане или манипуляции, которая может являться пропагандой, рекламой или не соответствующей действительности.
В наиболее ответственных случаях информацию желательно получать из различных независимых источников, а сами источники должны регулярно оцениваться по степени достоверности поступающей от них информации.
Выводы
Эффектом рассеивания информации обусловливается проблема полноты информационных ресурсов, требуемых для решения задачи. Даная проблема актуальна для работы почти во всех информационных системах. В профессиональной базе поступающая информация распределяется по тематическим группам. Таким образом, пользователь, выбрав для работы одну тематическую группу, упускает важные сведения, которые могут содержаться в смежных тематиках. Наиболее остро проблема поиска информации стоит при работе с Интернетом. Глобальная сеть дает доступ к большому количеству информационных ресурсов, однако в силу особенностей построения Интернета и разнообразных форм предоставления информации возможно использование только небольшой части информационных ресурсов.
Добиться полного охвата информационных ресурсов в настоящее время невозможно. Частично проблему полноты охвата информационных ресурсов можно решить путем изучения метаинформации, которая содержится в каталогах, реферативных, библиографических изданиях и базах данных. Кроме того, использование максимально возможного количества информационных ресурсов требует больших затрат, в том числе материальных и трудовых. Поэтому работа с метаинформацией также направлена на выявление наиболее информативных информационных источников.
Актуальной для нашего времени является проблема поиска необходимых сведений по документальным базам, ресурсам Интернета и библиотекам. Накопление информации в мире происходит лавинообразно. Большой массив информации накапливают документальные базы, например, Ьех1$№х15 содержит более 1,4 млрд документов, а "Диалог" — около 1 млрд. Информация в Интернете — неструктурированная и разрозненная, что создает основные трудности при ее поиске. Особенностью фондов библиотек является то, что поиск необходимых изданий строится на библиографических и реферативных сведениях. Таким образом, одной из основных проблем доступа к информации является поиск информации в информационных ресурсах. Подходы к решению этой проблемы варьируются в зависимости от типа информационных ресурсов.
Дополнительные затраты информационных агентств на классификацию — структуру отбираемой информации, оценку рейтинга источников и отбор наиболее информативных из них, построение эффективных поисковых средств — обеспечивают значительно большую полноту и точность поиска по сравнению с поиском в Интернете.
Деловые ресурсы Интернета являются важными информационными источниками. Однако доступ к ним затруднен тем, что сложно определить их месторасположение в глобальной сети. Поддержку поиска информации в Интернете обеспечивают поисковые машины и каталоги ресурсов Интернета. Однако эти поисковые средства не могут гарантировать полноту охвата всех информационных ресурсов. К сожалению, большая часть ресурсов Интернета является практически недоступными для пользователя за счет особенностей построения и технологии работы поисковых машин. Эффективность поиска информации в Интернете существенно уступает эффективности поиска информации в документальных информационно-поисковых системах, использующих специальные информационно-поисковые языки, и эффективности поиска в профессиональных базах.
Доступ к ресурсам библиотек традиционно начинается с работы с метаинформацией. От качества библиографического и реферативного описания фондов библиотеки во многом зависит эффективность работы читателей библиотек с этими фондами. Автоматизация библиотек и создание электронных каталогов фондов библиотек позволят пользователям значительно сократить затраты времени на поиск необходимых источников информации, составления библиографии и т.п.