Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ГОСы / МИР.docx
Скачиваний:
37
Добавлен:
04.01.2020
Размер:
78.23 Кб
Скачать
    1. Топология интернета

1. Центральное ядро (28% Web-страниц) — компоненты сильной связности (SCC) или узел галстука. Сюда относятся Web-страницы, связанные так тесно, что, просто следуя по гиперссылкам, из любой из них в конечном счете можно попасть на любую другую.

 2. "Отправные" Web-страницы (IN) (22% Web-страниц) — они содержат ги¬перссылки, которые в конечном счете ведут к ядру, но из ядра к ним попасть нельзя.

3. "Оконечные" Web-страницы (OUT) (столько же — 22%) — к ним можно прийти по ссылкам из ядра, но нельзя вернуться назад в ядро.

4. "Отростки" (еще 22% Web-страниц) — полностью изолированы от центрального ядра: это либо "мысы", связанные гиперссылками со страницами любой другой категории, либо "перешейки", соединяющие две Web-страницы, не входящие в ядро.

Указанные четыре основных множества, в сумме составляющие более 90% всех исследованных Web-страниц, каждая из которых топологически относится к одной компоненте связности, и обусловили название полученной модели (рис. Модель Bow Tie) - Bow Tie ("галстук-бабочка"). Помимо этого, в Web существуют и "острова", которые вообще не пересекаются с остальными ресурсами Internet. Единственный способ обнаружить ресурсы этой группы — знать их адрес. Ника¬кие поисковые машины не смогут найти эти острова, если они в прошлом ка¬ким-то образом не соединялись с другими частями Internet.

Невидимый интернет – информация, которая хранится в Сети и которая не была проиндексирована поисковыми системами. К ним относятся.

    1. Скрытые ресурсы интернета

    1. Источники недоступные для обычных поисковых систем.

    2. Информация в скрытом интернете не индексируется поисковыми роботами и пауками. Как правило, БД с ограниченным доступом. Генерируется Access, SQL,Oracle. Нужна регистрация и пароль.

    3. базы данных, допускающие доступ для поиска (профессиональные БД), динамическая информация (по запросу).

    4. ресурсы, требующие пароль и регистрацию.

    5. системы интерактивного взаимодействия с пользователями

    6. вэб-страницы, зарегистрированные на бесплатных серверах

    7. вэб-сайты, создатели которых не оповещают кого-либо о создании этих ресурсов

    8. Различные форматы представления информации (некоторые версии pdf, графических изображений, flash…).

    9. архив ресурсов открытого вэб-пространства.

    10. «китайский интернет» www.baidu.com

Сейчас невидимый интернет приобрел глобальные размеры. По данным ученых из Калифорнийского университета в Беркли в 2008 году поисковые системы индексировали лишь 0,2% страниц интернета, а 99,8% составляет информация, доступ к которому обычные поисковики получить не могут. Однако по оценкам других независимых экспертов, невидимый интернет составляет долю от 20% до 50%.

    1. Источники информации для бизнес-разведки

Конкурентная разведка – сбор и обработка данных из разных источников, для выработки управленческих решений с целью повышения конкурентоспособности коммерческой организации, проводимые в рамках закона и с соблюдением этических норм.

  • Бизнес-разведка

  • Корпоративная разведка

  • Деловая разведка

  • Маркетинговая деятельность

  • Бенчмаркинг (от англ. benchmark, "начало отсчета", "зарубка") - это механизм сравнительного анализа эффективности работы одной компании с показателями других, более успешных, фирм.

  • СМИ

  • интернет

  • ярмарки, выставки, конференции, семинары

  • неформальное общение с коллегами и партнерами

  • базы данных

  • рекламные материалы и проспекты компаний

  • пресс-релизы

  • отраслевые издания

  • технические и патентные доклады

  • правительственные публикации

  • объявления конкурентов

  • сама продукция

  • государственные или правоохранительные органы

  • звонки под видом покупателя в конкурирующие компании

  • косвенная информация о действиях конкурентов

информация от частных лиц