Добавил:
tg: @petmanchenko Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ЛР №1 Поиск информации в сети Интернет. Браузеры.docx
Скачиваний:
6
Добавлен:
02.02.2025
Размер:
922.7 Кб
Скачать

ФЕДЕРАЛЬНОЕ АГЕНСТВО СВЯЗИ

Федеральное государственное образовательное бюджетное учреждение

высшего профессионального образования

«Санкт-Петербургский государственный университет телекоммуникаций

им. проф. М.А. Бонч-Бруевича»

Кафедра Автоматизации предприятий связи

Дисциплина «Основы интернет технологий»

ОТЧЁТ

по лабораторной работе №1

«Поиск информации в сети Интернет. Браузеры.»

Выполнил: студент группы ИСТ-931, Гетманченко Полина Алексеевна

«29» сентября 2020г. _________/П.А.Гетманченко/

Принял: к.т.н. доцент. Любимов А.Г.

«29» сентября 2020 г. _________/А.Г.Любимов/

Санкт-Петербург, 2020

Содержание

Цель работы 3

Основные вопросы 3

Поисковые системы: классификация, назначение, принципы работы 3

Общая структурная схема поисковой системы. Алгоритмы работы 4

Поисковая выдача. Релевантность и её оценка 6

Файлы Cookie, Cache 6

Современные интернет-браузеры. Назначение и основные функции 7

Тесты и критерии для сравнения браузеров 8

Ход работы 9

Вывод 20

Электронные источники 21

Цель работы

Ознакомиться с принципами работы поисковых систем, выявить основные закономерности их работы. Выявить преимущества и недостатки различных браузеров, предложить критерии их сравнения.

Основные вопросы Поисковые системы: классификация, назначение, принципы работы

Классификация поисковых систем:

  1. По хранению данных для поиска: внешняя, автономная.

  2. По типу данных, в которых осуществляется поиск: текст, нетекстовые данные (изображения, видео, аудиофайлы), метаданные (автор, дата создания, регистрационный номер).

  3. По типу корпуса: поиск тематических документов, поиск "случайных" документов.

  4. По виду запросов: текстовый ввод, голосовой ввод, поиск по образцу, альтернативный ввод.

  5. По результату: набор документов, все документы, информация (место на карте), результат вычислений.

Виды поисковых систем:

  1. Поисковые каталоги.

  2. Рейтинговые системы.

  3. Поисковые указатели.

Назначение:

Предоставление пользователю возможности быстрого доступа к необходимой ему информации при помощи поиска в обширной коллекции доступных данных.

Принцип работы поисковой системы:

Принцип работы поисковых роботов базируется на выполнении нескольких этапов:

  1. Сбор данных. С помощью ботов ПС собирает необходимую информацию со всех страничек ресурса (тексты, изображения, видео и др.). Эти процессы начинаются после запуска сайта и в дальнейшем происходят по составленному роботом расписанию. Благодаря этому время от времени происходит обновление данных о страницах на предмет изменений;

  2. Индексация – присвоение каждой странице определенного индекса, который позволит производить быстрый поиск по их содержимому;

  3. Анализируется введенный пользователем запрос;

  4. Результаты анализы передаются специальному модулю ранжирования;

  5. Обрабатываются данные всех документов, выбираются самые релевантные введенному запросу;

  6. Генерируется сниппет – заголовок, дескрипшн, слова из запроса подсвечиваются полужирным;

  7. Результаты поиска представляются пользователю в виде SERP (страницы выдачи).

Общая структурная схема поисковой системы. Алгоритмы работы

Типовая схема ИПС аналогична типовой схеме каталога (рис. 1). Индекс базы данных — это основной массив данных ИПС. Он служит для хранения сведений обо всех известных системе интернет-документах. Данные сведения необходимы для того, чтобы поисковая система сумела найти документы на запрос пользователя.

рис. 1 – общая структурная схема поисковой системы

Робот-индексировщик— программный модуль поисковой системы, служащий для отбора информационных ресурсов в сети и их индексирования, т. е. поддержания базы данных индекса в актуальном (по отношению к интернету) состоянии. Эта программа является основным источником информации о состоянии информационных ресурсов. Просмотр документов интернета данным модулем системы делается регулярно. Для крупных систем период просмотра документов, как правило, составляет 1-2 недели.

Общий алгоритм функционирования ИПС состоит в следующем:

  1. Робот-индексировщик автоматически просматривает (переходя от одного ресурса к другому, используя ссылки, расположенные на нем) различные информационные ресурсы интернета (интернет-документы).

  2. Создает индекс базы данных, помещая туда информацию о ресурсах сети. При этом он также периодически возвращается к информационным ресурсам и проверяет их на наличие изменений.

  3. Когда пользователь делает поисковой системе запрос, ее программное обеспечение (поисковая машина) просматривает созданный индекс базы данных с заданными ключевыми словами и ранжирует (упорядочивает) ресурсы по степени близости к предмету поиска.

Алгоритм работы:

  1. Проводится сбор информации. Специально для данной функции разработаны алгоритмы работы поискового робота. Если появился новый сайт, то бот непременно его исследует. И чем быстрее это произойдёт, тем лучше. Продвижения сайта будет успешным в том случае, если добавить ресурс сразу после запуска в Гугл и Яндекс Вебмастер. Не забывайте – поисковики более благосклонно принимают портал, ссылка на который также размещена в социальных сетях, блогах и т. д.

  2. После сбора информации поисковики проводят индексация. Необходимо это для того, чтобы ресурс можно было быстро найти. И только когда будет проведена индексация, сайт попадёт в выдачу. Зато на данном этапе его уже можно будет найти по ключевым словам.

  3. Теперь при определённом запросе пользователя роботы будут подбирать по ключевым словам наиболее подходящие варианты. Запускается алгоритм ранжирования поисковых систем. И тут от множества факторов уже будет зависеть, попадёт ли ресурс на первую строку выдачи или на десятую страницу.