- •2012 Г. Оглавление
- •Адресация ресурсов в сети Интернет
- •Способы оценки релевантности
- •Понятие и функции поисковой системы
- •Модели работы поисковых машин разных поколений
- •Состав и принципы работы поисковой системы
- •Модуль индексирования
- •База данных
- •Поисковый сервер
- •Расширенный режим подачи запросов к поисковой системе
- •Форма расширенный поиск Яндекса
- •Язык запросов Яндекса
- •Поисковый контекст
- •Документные операторы
- •Язык запросов Google
- •Функции оценки релевантности.
- •PageRank
- •LexRank
- •Методы борьбы с нерелевантным содержимым
- •Список используемых источников
Документные операторы
|
Синтаксис оператора |
Что означает оператор |
Пример запроса |
|
title:запрос |
Поиск текста в заголовке страниц (title) Если текст состоит из нескольких слов, возьмите их в скобки. |
Максвелл title:биография title:(княжна Тараканова) |
|
url:www.url.ru/cat/* |
Поиск ограничивается группой страниц с заданным URL. Если в конце адреса стоит *, то учитываются страницы, адрес которых начинается с заданного URL. Если URL содержит один из символов ', ", (, ), то его нужно искать в кавычках. |
url:"ru.wikipedia.org/wiki/Эрмида_(Каштру-Дайре)" url:exler.ru/* |
|
site:url |
Поиск по всем поддоменам и страницам указанного сайта. |
городские легенды site:narod.ru |
|
inurl:url |
Поиск ограничивается группой страниц, URL которых содержит заданный фрагмент. |
inurl:exler |
|
host:www.host.ru |
Оператор аналогичен url с именем хоста. |
host:www.yandex.ru |
|
rhost:ru.url.* илиrhost:ru.url.www |
Оператор аналогичен host, но имя хоста записывается в обратном порядке — вначале домен верхнего уровня, затем второго и т.д. Если в конце указано .*, то поиск идет по всем поддоменам заданного домена (но не включая домен ru.url). |
новости rhost:com.livejournal.* |
|
mime:тип_файла |
Поиск ограничивается определенным типом файла:
|
(анкета загранпаспорт ~~ биометрический) (mime:pdf | mime:doc) |
|
lang:язык |
Поиск ограничивается страницами на определенном языке:
|
BBC lang:en |
|
domain:домен |
Поиск по страницам, которые расположены в заданном домене. |
domain:yandex /+1 domain:ru |
|
date:ГГГГ{*|ММ{*|ДД}} |
Поиск только по страницам, дата которых удовлетворяет заданному условию. |
date:200310* |
|
date:ГГГГ{*|ММ{*|ДД}}..date:ГГГГ{*|ММ{*|ДД}} |
Поиск только по страницам, дата изменения которых находится в заданном интервале. |
хит-парад date:20090901..20090915 |
|
date:< |
Поиск только по страницам, измененным раньше указанной даты. Допустимы также операторы :>, :<=, :>=. |
вакансии date:>20091101 |
|
cat:ID региона илиcat:ID темы |
Поиск только страниц сайтов, зарегистрированных в Яндекс.Каталоге, тематическая рубрика или регион которых совпадают с заданным. Идентификатор региона можно получить, прибавив к коду региона смещение 11000000. Идентификатор тематической рубрики получается прибавлением к коду темы смещения 9000000. |
зяблик cat:11000051 |
[ydoc]
Язык запросов Google
Многие операторы языка запросов Google совпадают с язфком запросов Яндекса, поэтому перечислим только основные:
Поиск по фразе ("")
Поиск по определенному сайту (site:)
Слова, которые нужно исключить(-)
Джокер (*)
Оператор ИЛИ (OR)[gsyntax]
