Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
КТ в НиОбр.Курс лекций .docx
Скачиваний:
2
Добавлен:
01.04.2025
Размер:
1.14 Mб
Скачать

Страница результатов поиска

Поисковые машины не только находят страницы, но и сообщают о находках много ценной информации!

За время существования поисковых машин выработался стандарт выдачи пользователю страниц результатов поиска. Разобравшись в форме выдачи результатов одной поисковой машины, можно уверенно пользоваться остальными поисковиками.

Каждый результат поиска содержит:

  1. Заголовок найденной страницы.

  2. Отрывок из текста страницы, по которому видно, в каком окружении (контексте) используются нужные нам слова. Искомые слова в нем, как правило, выделены жирным шрифтом или отличаются по цвету от основного текста.

  3. Полный URL (УРЛ) (“Universal Resource Locator” - адрес в сети Интернет) страницы.

  4. Размер страницы, дата последнего изменения (если поисковая машина в состоянии ее определить).

  5. Ссылка на копию страницы в базе поисковой машины. Если документ был изменен или сайт временно не работает, то сохраненная в базе поисковой машины копия вам все равно дает возможность ознакомиться с найденным документом.

  6. Похожие документы”. Некоторые поисковики анализируют содержание найденных по запросу страниц и группируют их по своим, внутренним критериям. Например – по близости словарей страниц, по одинаковым заголовкам, по совпадениям фраз, по количеству синонимов. К сожалению, пока еще данные алгоритмы далеки от совершенства и в “похожих страницах” не очень часто можно найти нечто, что действительно поможет в нашем поиске.

Также, в результатах поиска вы можете увидеть

  1. Рубрику каталога или рейтинга поисковой машины (если сайт участвует в каталоге или рейтинге).

На рисунке показаны расположение всех вышеперечисленных пунктов в одном из результатов поиска. Искалась фраза “весеннее похолодание” поисковой машиной Яндекс.

Чем же различаются поисковые машины, если у них одинаковая форма запроса и примерно одинаковый формат выдачи результатов?

  • Релевантностью результатов,

  • величиной и частотой обновления баз данных,

  • скоростью выдачи результатов,

  • удобством работы.

На сегодняшний день поисковые системы - самые популярные страницы сети на которых пользователи проводят очень много времени. Поэтому, все большее значение при выборе поисковика приобретают сопутствующие сервисы (почта, новостные ленты, торговые площадки и т.п.).

Критерии релевантности найденных страниц

Как машина определяет, какие документы наиболее точно отвечают на запрос?

Несмотря на то, что каждая поисковая система имеет свои секреты, особенные алгоритмы, существуют несколько общих критериев, которые учитывают большинство поисковиков при определении порядка выдачи результатов (“ключевыми словами” в перечислении ниже мы будем называть слова из фразы, которую ищет пользователь):

  1. Заголовок. Присутствует ли запрошенное слово в заголовке?

  2. Домен/адрес. Присутствует ли запрошенное слово в имени домена или в адресе страницы?

  3. Стиль. Страница считается более релевантной, если ключевое слово на ней выделено жирным шрифтом или курсивом, используется в подзаголовках.

  4. Плотность. Количество ключевых слов относительно текста страницы называется плотностью ключевого слова.

  5. Мета теги (невидимые пользователю слова, используемые при описании страниц). Содержится ли ключевое слово в них?

  6. Ссылки на другие сайты. Встречается ли ключевое слово в тексте ссылки и на страницах, на которые ведут ссылки?

  7. Ссылки на страницу с других сайтов. С каких страниц ссылаются на ваш сайт? Есть ли на этих страницах ключевые слова? Кто еще в Интернет имеет ссылку на данный сайт? Каков текст ссылки?

  8. Page Rank сайта. Оценка, которую выставляют при индексировании поисковики всему сайту, исходя из своих внутренних критериев.

Поисковые системы. Расширенный поиск

Язык запроса поисковых машин

Все крупные поисковики имеют специальный язык запросов, дающий широкие функциональные возможности для детализации поиска и экономии времени. Знание операторов языка запросов не только существенно облегчит вам жизнь, но и поможет находить информацию, добыть которую только с помощью простых запросов практически невозможно.

Язык запросов - мощный инструмент, который позволяет искать информацию и документы:

 только на определенном сайте (или группе сайтов);

 опубликованную в строго заданном временном диапазоне;

 опубликованные на каком-либо из языков (например, русском).

При помощи языка запросов, мы можем искать текст на определенных участках страниц (в ссылках, в заголовках, в ключевых словах и др.). К сожалению, не существует общепринятого стандарта для операторов языка поисковых машин. Даже для основных операций разные поисковики имеют разные обозначения:

Операторы языка запросов

Рамблер

Яндекс

Google

1. Оператор обязательного присутствия слова в результатах поиска. Логическое “и”.

AND или &

& или +

+

2. Оператор отсутствия слова. Логическое “не”

NOT или !

-

-

3. Оператор выбора. Логическое “или”

OR или |

|

~

Разберем поподробнее каждый из трех основных операторов.

  1. Оператор обязательного присутствия слова в результатах поиска. Все три рассматриваемые поисковые машины выполняют этот оператор по умолчанию. Или, задавая в строке поиска, например, “Булгаков Мастер Маргарита” мы требуем, чтобы поисковик находил страницу, на которой содержатся все три слова.

  2. Оператор отсутствия слова. Найденная страница не должна содержать данное слово. Например, вы ищете книгу Булгакова, но желаете получить текст для чтения, а не предложение купить эту книгу в интернет-магазине. В этом случае логично использовать в теле запроса конструкцию "Булгаков Мастер Маргарита -заказать -магазин". Данный запрос написан на языке Яндекса, в поисковой строке Рамблера следовало бы написать "Булгаков Мастер Маргарита !заказать !магазин".

  3. Оператор выбора. Удобно использовать для поиска текста, содержащего слово или его синонимы. Предположим, мы ищем тексты, содержащие упоминание о городе Волгограде. Разумно было бы, для полноты поиска, использовать и его предыдущее название – Сталинград. Вот так будет выглядеть данный запрос на языке Яндекса и Рамблера: “Волгоград |Сталинград”. Следует отметить, что поисковые системы первое слово считают более важным, и в первых строках результатов поиска будут идти строки с “Волгоградом”, “Сталинград” же появится только на более глубоких страницах.

Все три рассматриваемые поисковые системы позволяют использовать в запросах для группирования круглые скобки. На картинке представлен результат запроса “(теорема конгруэнтные углы) |(теорема равной величины углы)” в Яндексе.

Другой важный оператор – кавычки, "" - оператор строго соответствия. Сочетание слов, которые вы укажете в кавычках, будет учитываться системой как единое целое, поисковик будет искать все слова именно в данном порядке и без применения морфологического склонения слов. Попробуем найти в Рамблере фразу “если не я, так кто же”. Фраза эта специальная, “трудная” для поисковиков т.к. содержит многочисленные стоп-слова. Стоп-слова – это предлоги, частицы, местоимения, которые настолько часто встречаются в тексте, что поиск по ним выдавал бы миллионы страниц и поэтому они, как правило, поисковыми системами игнорируются.

Итак, на первой иллюстрации – результат поиска Рамблером нашей фразы без кавычек. Результат поиска выглядит совершенно нерелевантно, похоже на случайный набор страниц (может быть это страницы пользователей, оплативших рекламу на Рамблере?).

На следующей иллюстрации мы видим скриншот (копию страницы) Рамблера, искавшего нашу фразу с кавычками. Найдено то, что нужно!

Обратите внимание на еще один скриншот. Ищется вроде бы та же самая фраза…. Кавычки стоят. Но не найдено ни одного документа. В чем же причина? В запятой. Рамблер ищет полное совпадение фразы, заключенной в кавычки, вплоть до знаков.

Более подробно с операторами языка запросов Вы можете ознакомиться на специальных страницах, описывающих их (Яндекс, Рамблер, Google).

Рассмотрим пример, демонстрирующий эффективность использования в поиске операторов языка запроса. Предположим, нам необходимо найти учебные пособия по дисциплине «Компьютерные технологии в науке и образовании». Искать будем в Яндексе.

Введем в поле поиска ключевые слова Компьютерные технологии в науке и образовании. Результат ниже показывает, что нашлось 6 млн ответов! Найти нужную информацию в этом море весьма проблематично.

Введем фразу с кавычками и добавим +пособие:

Результат впечатляет – всего 4760 ответов. Беглый анализ найденного показывает, что присутствует много рекламных ссылок на книгу Р.И. Ивановского «Компьютерные технологии в науке и образованию», в которой описывается практика применения систем MathCad. Эта книга нам не требуется, попробуем исключить ее из поиска (-Ивановский):

Объем информации уменьшился почти вдвое, однако все еще велик. Для дальнейшего уменьшения количества страниц можно использовать расширенный поиск Яндекса.

Правила формирования запросов в поисковой системе Яндекс

    Приведем несколько простых правил формирования запроса в поисковой системе Яндекс.

Ключевые слова в запросе следует писать строчными (маленькими) буквами.

    Это обеспечит поиск всех ключевых слов, а не только тех, которые начинаются с прописной буквы.

При поиске учитываются все формы слова по правилам русского языка, независимо от формы слова в запросе.

Например, если в запросе было указано слово «знаю», то условию поиска будут удовлетворять и слова «знаем», «знаете» и т. п.

Для поиска устойчивого словосочетания следует заключить слова в кавычки.

Например, «фарфоровая посуда».

Для поиска по точной словоформе перед словом надо поставить восклицательный знак.

Например, для поиска слова «сентябрь» в родительном падеже следует написать «!сентября».

Для поиска внутри одного предложения слова в запросе разделяют пробелом или знаком &

Например, «приключенческий роман» или «приключенческий&роман». Несколько набранных в запросе слов, разделенных пробелами, означают, что все они должны входить в одно предложение искомого документа.

Если вы хотите, чтобы были отобраны только те документы, в которых встретилось каждое слово, указанное в запросе, поставьте перед каждым из них знак плюс «+». Если вы, наоборот, хотите исключить какие-либо слова из результата поиска, поставьте перед этим словом минус «-». Знаки « + » и «-» надо писать через пробел от предыдущего и слитно со следующим словом.

Например, по запросу «Волга -автомобиль» будут найдены документы, в которых есть слово «Волга» и нет слова «автомобиль».