- •Основные характеристики рынка информационных услуг (определения, основные виды информационных услуг)
- •Участники рынка информационных услуг
- •3. Области информационного рынка
- •4. Рынок информации
- •Этапы развития рынка информационных услуг
- •Профессиональные базы данных (основные характеристики)
- •Этапы решения информационной задачи
- •Источники метаинформации
- •Зарубежные информационные корпорации, специализирующиеся на коммерческой информации («Factiva»)
- •Зарубежные информационные корпорации, специализирующиеся на коммерческой информации («Дан энд Брэдстрит»)
- •Информационная корпорация Questel-Orbit
- •Российские информационные агентства коммерческой информации (справочники, «мцдс», «Национальное рейтинговое агентство»,
- •14. Российские информационные агентства коммерческой информации («Национальное бюро кредитных историй», «бир-Аналитик», ади «Бизнес-карта», «асу-Импульс»)
- •Информационные ресурсы гмц Росстата, регистры фнс
- •Зарубежные производители информационных услуг на финансовом рынке («Томсон Рейтер»)
- •Зарубежные производители информационных услуг на финансовом рынке («Блумберг»)
- •Зарубежные производители информационных услуг на финансовом рынке («cqg International»)
- •Российские производители информационных услуг на финансовом рынке («aк&m», «Интерфакс»)
- •Российские производители информационных услуг на финансовом рынке («финмаркет», «рбк»)
- •Российские производители информационных услуг на финансовом рынке («мфд-ИнфоЦентр», «прайм»)
- •Классификация источников информации в интернете
- •Средства поиска информации в интернете
- •Работа поисковых машин
- •Виды поисковых интернет-систем
- •Эффективность поиска информации
- •Эффективность работы поисковых машин
- •Топология интернета
- •Скрытые ресурсы интернета
- •Источники информации для бизнес-разведки
-
Виды поисковых интернет-систем
Поисковые cистемы обычно состоят из трех компонент:
-
агент (паук или кроулер), который перемещается по Сети и собирает информацию;
-
база данных, которая содержит всю информацию, собираемую пауками;
-
поисковый механизм, который люди используют как интерфейс для взаимодействия с базой данных.
Cредства поиска и структурирования, иногда называемые поисковыми механизмами, используются для того, чтобы помочь людям найти информацию, в которой они нуждаются. Cредства поиска типа агентов, пауков, кроулеров и роботов используются для сбора информации о документах, находящихся в Сети Интернет. Это специальные программы, которые занимаются поиском страниц в Сети, извлекают гипертекстовые ссылки на этих страницах и автоматически индексируют информацию, которую они находят для построения базы данных. Каждый поисковый механизм имеет собственный набор правил, определяющих, как cобирать документы. Некоторые следуют за каждой ссылкой на каждой найденной странице и затем, в свою очередь, исследуют каждую ссылку на каждой из новых страниц, и так далее. Некоторые игнорируют ссылки, которые ведут к графическим и звуковым файлам, файлам мультипликации; другие игнорируют cсылки к ресурсам типа баз данных WAIS; другие проинструктирова-ны, что нужно просматривать прежде всего наиболее популярные страницы.
-
Эффективность поиска информации
1. Семантические показатели. Релевантность - объективно существующее смысловое соответствие между содержанием документа и запроса. o полнота выдачи (потери информации); o точность выдачи (информационный шум). Введем следующие обозначения: n a - множество релевантных и выданных системой документов; n b - множество нерелевантных, но выданных системой документов; n c - множество релевантных, но не выданных системой документов. o Полнота выдачи (ПВ) =a / (a+c) *100% o Точность выдачи (ТВ) = a / (a+b) *100% o Потери информации (ПИ) = c / (a+c) *100% o Информационный шум (ИШ) = b / (а+b) *100% 2. Прагматические показатели. Пертинентность - это субъективно оцениваемое соответствие содержания документов или текстов информационным интересам по требителя (Pertinent – уместный, относящийся к делу). 3. Другие показатели. o Охват – определяется тремя показателями – объемом проиндексированной информации, количеством уникальных серверов и количеством уникальных документов. o Скорость обхода – показывает, насколько быстро осуществляется индексация новой информации в базе. o Глубина – количество страниц и вложенность директорий, просматриваемая при индексации. o Скорость поиска – скорость выполнения поисковой системой запроса пользователя.
-
Эффективность работы поисковых машин
Из-за невероятного увеличения информационных ресурсов Интернет в последние годы некоторые старые поисковые системы перестали быть эффективными. Поэтому появились такие поисковые машины, как Google и Direct Hit, которые сортируют ссылки по принципу популярности. Используя математический алгоритм, они выдают адреса тех ресурсов, на которые чаще всего указывают другие сайты.