Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Экзамен Волкова.docx
Скачиваний:
0
Добавлен:
01.03.2025
Размер:
618.61 Кб
Скачать

Преимущества поисковых машин:

  1. Малое количество в результатах поиска устаревших ссылок

  2. Намного большее количество Web- узлов, по которым производится поиск

  3. Более высокая скорость поиска

  4. Поисковая машина выдает сразу адреса конкретных документов

  5. Высокая релевантность поиска

Недостатки поисковых машин:

  1. Ограниченная область поиска

  2. Относительная сложность использования

  3. Менее наглядная форма представления результатов запроса

32. Рейтинги и порталы

Рейтинги. С их помощью очень быстро можно найти адреса наиболее посещаемых сайтов по интересующей теме.

Порталы – сайты, содержащие новости, развлечения, почтовые ящики и т. д.

Как строится рейтинг в поисковой системе

При подсчете рейтинга страницы по определенному слову учитывается, где на странице это слово встречается. Каждому встретившемуся слову в зависимости от места, где оно встретилось, присваивается индекс релевантности. Далее все индексы суммируются, и, таким образом, вычисляется индекс релевантности страницы в целом.

Однако если слово будет повторено 1000 раз, то индекс страницы не возрастет в 1000 раз, здесь вступят в силу ограничения на количество повторов, как правило, это количество не более 5.

33. Как работают поисковые машины. ???

Поисковая машина - это комплект программ, в основе которого лежит поисковый робот, индексатор, база данных и система выдачи результатов. Каждая ИПС использует свой алгоритм поиска. При этом учитываются статистические закономерности.

Как работают поисковые машины. Состав «поисковика»

Spider («паук») – программа, которая загружает в поисковую машину Web – страницы

Crawler («червяк») – программа, способная найти на Web – странице все ссылки на другие страницы

Indexer (индексатор) – программа, которая разбирает страницу на составные части и анализирует их

Database (база данных) – хранилище всех данных, которые поисковая система загружает и анализирует

Search Engine Results Engine (система выдачи результатов поиска) решает, какие страницы удовлетворяет запросу пользователя и в какой степени.

Основные определения

Релевантными называются документы, в наибольшей степени соответствующие потребностям пользователя, проводящего их поиск.

Процесс загрузки из Сети информации и предварительного анализа ее поисковой машиной называется индексацией, а сама база данных поисковой машины, в которой хранится собранная информация, называется индексом.

Алгоритм поиска – метод, руководствуясь которым поисковая машина принимает решение, включать или не включать ссылку на страницу какой-либо документ в результате поиска

Основные этапы алгоритма поиска – это ответы на следующие вопросы:

  1. Присутствует ли ключевое слово в заголовке документа?

  2. Присутствует ли ключевое слово в имени домена или в адресе страницы?

  3. Встречается ли ключевое слово в подзаголовке документа либо в элементах текста, выделенных полужирным, курсивом либо как-то иначе?

  4. Как часто ключевое слово встречается на странице?

  5. Встречаются ли ключевые слова в описаниях страниц, выполненных их разработчиком, и среди ключевых слов, указанных разработчиком страниц?

  6. На какие Web –узлы имеются ссылки на анализируемой странице и встречается ли ключевое слово в тексте ссылки?

  7. Какие Web –узлы имеют ссылку на анализируемый сайт? Каков текст ссылки?

  8. На какие еще страницы данного сайта содержит ссылки анализируемая страница?