- •Тема: информационно-поисковые системы
- •1.Классификация поисковых систем интернет
- •1. Объем поискового индекса
- •2. Метод выбора серверов для просмотра (опроса)
- •3. Используемые поисковые технологии
- •2.Информационно-поисковые системы
- •1. Каталог
- •2. Поисковая машина
- •3.Метапоисковая машина
- •4. Поиск источников информации
- •3.3. Инструментарий поисковых систем сетевой службы www
- •3.1. Инструментарий формирования запросов в ипс
- •2. Логические операторы (булев поиск).
- •7. Определение области поиска (наименование сервиса), домена (серверы с определенным расширением имени, su,ru) и т. П.
- •3.2. Язык запросов ипс Яndex
- •1. Булев поиск:
- •Пример 1.1.
- •Пример 1.2.
- •Пример 1.3.
- •Пример 1.4.
- •2. Контекстный поиск:
- •Пример 2.1.
- •Пример 2.2.
- •Пример 3.1.
- •Пример 3.2.
- •5. Поиск по адресам:
- •8. Ранжирование результата поиска
- •Пример 8.1.
- •Пример 8.2.
Пример 1.2.
Между словами можно поставить знак ‘│’, чтобы найти документы, содержащие любое из этих слов (удобно при поиске синонимов).
Например, запрос вида ‘фото│фотография│фотоснимок│снимок│фотоизображение’ задает поиск документов, содержащих хотя бы одно из перечисленных слов.
Пример 1.3.
Знак ‘~’ позволит найти документы с предложением, содержащим первое слово, но не содержащим второе.
Например, по запросу ‘банки~закон’ будут найдены все документы, содержащие слово ‘банки’, рядом с которым (в пределах предложения) нет слова ‘ закон’.
Пример 1.4.
Чтобы подняться от уровня предложения до уровня документа, необходимо удвоить соответствующий знак. Одинарный оператор (&,~) ищет в пределах абзаца, двойной (&&,~~) – в пределах документа.
Например, по запросу ‘ рецепты &&(плавленый сыр)’ будут найдены документы, в которых есть и слово ‘ рецепты’ и словосочетание ‘ (плавленый сыр)’, причем плавленый сыр должен быть в одном предложении. А запрос ‘ руководство Visual C ~~ цена’ выдаст все документы со словами ‘руководство Visual C’, но без слова ‘цена’.
2. Контекстный поиск:
оператор «( )» означает группирование слов;
оператор «/(n m)» означает расстояние в словах (— назад + вперед);
оператор «""» означает поиск фразы;
оператор «&&/(n m)» означает расстояние в предложениях (— назад + вперед).
Пример 2.1.
Если поставить устойчивые словосочетания в кавычки, то будут найдены те документы, в которых эти слова идут строго подряд.
Например, по запросу ‘красная шапочка’ будут найдены документы с этой фразой (при этом контекст ‘а шапочка у нее была красная’ найден не будет).
Пример 2.2.
Если все слова в тексте перенумеровать по порядку их следования, то расстояние между словами a и b - это разница между номерами слов a и b. Таким образом, расстояние между соседними словами равно 1 (а не 0), а расстояние между соседними словами, стоящими ‘не в том порядке’, равно -1. То же самое относится и к предложениям.
Если между словами поставлен знак ‘/ ’, за которым сразу напечатано число, значит, требуется, чтобы расстояние между ними не превышало этого числа слов.
Например, по запросу ’поставщики /2 кофе’, требуется найти документы в которых содержатся и слово ‘ поставщики’ и слово ‘кофе’, причем расстояние между ними должно быть не более двух слов и они должны находиться в одном предложении. (Найдутся ‘поставщики колумбийского кофе’, ‘поставщики кофе из Колумбии’ и т.д.).
Пример 2.3.
В общем виде ограничение по расстоянию задается при помощи пунктуации вида ‘/(n m)’, где n-минимальное, а m-максимально допустимое расстояние.
Например, запрос ‘ экономическое /(-2 4) образование’ означает, что слово ‘экономическое’ должно находится от ‘ образование’ в интервале расстояний от 2 слов слева до 4 слов справа.
Пример 2.4.
Практически все знаки можно комбинировать с ограничением расстояния.
Например, результатом поиска по запросу ‘ рейтинг ~ /+1 студентов’ будут документы, содержащие слово ‘рейтинг’, причем в этих документах слово ‘студентов’ не следует непосредственно за словом ‘ рейтинг’.
Пример 2.5.
Когда ограничения по расстоянию стоят после двойных операторов, то употребленные там числа – это расстояние не в словах, а в предложениях. Расстояние в абзацах определяется аналогично расстоянию в словах.
Например, запрос ‘банк &&/1 налоги’ означает, что слово ‘ налоги’ должно находиться в том же самом, либо в соседнем со словом ‘банк’ предложении.
Пример 2.6.
Вместо одного слова в запросе можно подставить целое выражение. Для этого его нужно взять в скобки.
Например, запрос ‘(история, технология, изготовление) /+1(сыра, творога)‘ задает поиск документов, которые содержат любую из фраз ‘ история сыра ‘, ‘технология творога ‘, ‘изготовление сыра‘, ‘история творога ‘.
3. Поиск фразы - поиск документов, содержащих конкретное словосочетание или фразу.