
- •Поисковые системы: поле боя - семантика Дмитрий ландэ Феномен десятилетия
- •Характеристики поисковых систем
- •Пертинентность
- •Что такое релевантность
- •Как определяется релевантность.
- •Пертинентность
- •Запросы пользователей
- •Поиск по параметрам
- •Профессиональные запросы к традиционным системам
- •Кластеризация
- •Поиск по подобию
- •Ранжирование откликов
- •Семантические методы
- •"Сюжетный" подход
- •Тернистый путь прогресса
Поиск по параметрам
Отдельного рассмотрения заслуживает возможность поиска по параметрам документов, которая позволяет ограничивать диапазон поиска значениями URL, датам, заглавий и т.п. Чаще всего выйти на возможность поиска по параметрам можно из режима расширенного поиска. В режиме расширенного поиска для ввода значений отдельных параметров предлагается весь диапазон возможностей Web-интерфейса.
Например, в системе Alltheweb в запросах можно указать параметры, обеспечивающие поиск по таким параметрам: URL (например, по запросу "url:energ" будут найдены документы, в URL которых присутсвует строка "energ"), ссылки на страницы сайтов ("link:"), доменные имена (например, "site:ua" обеспечит нахождение документов из украинского домена), заголовки ("title:"). В этой системе допустим поиск, кроме всех вариантов текстовых файлов, еще трех типов файлов - PDF, Ms Word, Flash.
В системе AltaVista присутствуют все приведенные для Alltheweb возможности (параметру "site:" в AltaVista соответствует "host:"), кроме того, в режиме расширенного поиска обеспечивается поиск по датам (с явным указанием "с...- по...", либо указанием тапа "искать за последние 8 месяцев"). Этот режим в системе традиционно называется "Web-археологией".
В Google обеспечивается поиск по сайту ("site:"), определение ссылок на сайт ("admission site:"), поиск по ценам, например "DVD player $250..350", странам, датам, доменам и т.д. В поле ввода запроса можно вводить и арифметические выражения, используя интерфейс Google как калькулятор, что, конечно же, подчеркивает своеобразность данной системы (например, по запросу "4^2" будет выведен результат 16).
Профессиональные запросы к традиционным системам
Традиционные системы пакетного поиска, обеспечивающие, например, рассылку результатов по электронной почте не предполагают интерактивного взаимодействия с конечным пользователем, поэтому им присуща полнота, которая сродни избыточности.
Так профессиональный запроса к системе "Интегрум" по теме "Услуги святи", выглядит следующим образом:
"услуги связи" или "междугородные переговоры" или "телефонные переговоры" или "мобильная связь" или "фиксированная связь" или "сотовая связь" или "сотовый оператор" или "средства связи" или "телефонная связь" или "спутниковая связь" или "космическая связь" или GPS или ростелеком или связьинвест или госкомсвязь или госкомтелеком или госсвязьнадзор или телекоммуникации или электросвязь или АТС или ГТС или минсвязи или "министерство связи" или "волоконно-оптическая линия связи" или ВОЛС
В системе InfoStream для реализации точной рассылки сообщений по теме "Мобильная связь" применяется такой запрос:
(((мобильн~связ) | (мобiльн~зв'яз) | (сотов~связ) | (стiльник~зв'яз) | (беспроводн~связ) | (бездрот~зв'яз) | (бесперебойн~связ) | (безперебiйн~зв'яз) | j2me]| ems]| 3g]| gprs]| ggsn]| sgsn]| sms]| mms]| ems]| bluetooth]| mms]| tdma]| multipoint]| pcs]| cdma]| ofdm]| vpn]| wap]| umts]| gsm)&((моб~телефон)| (стiльник~телефон)| (сотов~телефон))) ! this.is
Вместе с тем, очевидно, что для работы в режиме он-лайн такаие запроси неприемлемы. Пользователь желает ввести 1-2 слова и получить то, что ему не обходимо. Тут на помощь могут прийти только интеллектульные, семантические методы.