Топология интернета

Добавил:

AnnaNSK Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Новосибирский государственный технический университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

ГОСы / Шпоры МИР.docx

Скачиваний:

114

Добавлен:

04.01.2020

Размер:

1.23 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 1718 / 2118 19 20 21 > Следующая >>>

Топология интернета

Топология интернета (А. Брёдер, 1999 г.)

Центральное ядро (28% Web-страниц) — компоненты сильной связности (SCC) или узел галстука. Сюда относятся Web-страницы, связанные так тесно, что, просто следуя по гиперссылкам, из любой из них в конечном счете можно попасть на любую другую.
"Отправные" Web-страницы (IN) (22% Web-страниц) — они содержат гиперссылки, которые в конечном счете ведут к ядру, но из ядра к ним попасть нельзя.
"Оконечные" Web-страницы (OUT) (столько же — 22%) — к ним можно прийти по ссылкам из ядра, но нельзя вернуться назад в ядро.
"Отростки" (еще 22% Web-страниц) — полностью изолированы от центрального ядра: это либо "мысы", связанные гиперссылками со страницами любой другой категории, либо "перешейки", соединяющие две Web-страницы, не входящие в ядро.
Острова – веб-страницы, не пересекающиеся с остальными ресурсами Интернета 6%

Выявлено, что четыре основных множества - более 90% веб-страниц, топологически относятся к одной компоненте связности. Существуют и "острова", которые вообще не пересекаются с остальными ресурсами Интернет. Единственный способ обнаружить ресурсы этой группы - знать адрес. Никакие поисковые машины не смогут найти эти острова, если они в прошлом каким-то образом не соединялись с другими частями Интернет.

Скрытые ресурсы интернета

Не попадем на них через информационно-поисковые системы (ИПС).

1) Источники, недоступные для ипс

Глубокая паутина (также известна как невидимая сеть) — множество веб-страниц Всемирной паутины, не индексируемых поисковыми системами. Не следует смешивать понятие глубокая паутина с понятием тёмная паутина (от англ. dark web), под которым имеются в виду сетевые сегменты, хотя и подключённые к общей сети Интернет, но требующие для доступа определенных программных средств, настроек или авторизации.

www.brightplanet.com – навигатор скрытого веба

2) Скрытые ресурсы

- Онлайн БД (вход через систему или требует пароля) (патенты, медицина и финансы)

- Ресурсы, требующие пароль и регистрацию — объявления о поиске работы, чаты, библиотеки, справочники (не все).

- С-мы интерактивного взаимодействия с пользователем — помощи, консультирования, обучения, требующие участия людей для формирования динамических ответов от серверов

- Специализированные поисковые системы, которые обслуживают определенные отрасли или рынки, базы данных которых не включаются в глобальные каталоги традиционных поисковых служб. Например, медицинские поисковики.

- Закрытая (полностью или частично) информацию, доступную, пользователям Сети только с определенных адресов, групп адресов, иногда городов или стран. Например, китайский интернет.

- Веб-сайты, зарегистрированные на бесплатных серверах. Индексируются, в лучшем случае, лишь частично - поисковые системы во избежание рекламного спама не стремятся обходить их в полном объеме

- Веб-сайты, создатели которых не оповещают о создании этих ресурсов

Различные форматы представления информации. Например, только сравнительно недавно поисковые машины начали индексировать информацию в PDF-формате.

- архив ресурсов «открытого веба» — устаревающие веб-страницы

На Alexa.com есть ресурс «машина времени» The Wayback Machine — Интернет-архив. Сохранено 484 биллиона веб-страниц.

Плюс некоторые удаленные документы сохраняются какое-то время в кэше гугла.

По топологии Бредера (галстук бабочка):

Существующие "острова" вообще не пересекаются с остальными ресурсами Сети. Единственный способ обнаружить ресурсы этой группы - знать их адрес. Поисковые машины в принципе не находят этих островов, если они в прошлом каким-то образом не соединялись с другими частями Интернет.. Доступные сегодня благодаря традиционным информационно-поисковым системам 10 млрд. вэб- страниц - это лишь видимая крупица. Непознанных, скрытых ресурсов Сети в сотни (!) раз больше. Это прежде всего динамически генерируемые страницы, файлы неопознаваемых поисковыми системами форматов, информация из многочисленных баз данных.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 1718 / 2118 19 20 21 > Следующая >>>

Соседние файлы в папке ГОСы

#
04.01.202052.18 Кб86Схема информационных потов в интернете.jpg
#
04.01.20205.97 Mб94ФБИ ИИС 2016.pdf
#
04.01.20202.07 Mб103ФБИ МИР 2016.pdf
#
04.01.20202.69 Mб90ФБИ ПРИС 2016.pdf
#
04.01.202013.45 Mб112Шпоры ИИС.docx
#
04.01.20201.23 Mб114Шпоры МИР.docx

Топология интернета

Скрытые ресурсы интернета

1) Источники, недоступные для ипс

2) Скрытые ресурсы