- •Лабораторная работа 5 Тема: Поиск информации в сети Интернет.
- •Теоретические сведения
- •1.Поисковые системы сети Интернет
- •1.1. Типы поисковых систем
- •1.2. Поисковые каталоги
- •1.3. Индексные поисковые системы
- •1.4. Сравнения индексных поисковых систем и поисковых каталогов
- •2. Принципы работы индексных поисковых систем
- •2.1. Сканирование World Wide Web
- •2.2. Индексация World Wide Web
- •2.3. Ранжирование результатов поиска
- •3. Приемы эффективного поиска информации
- •3.1. Команды простого поиска
- •3.2. Команды языка запросов
- •3.3. Команды расширенного поиска
- •Ход выполнения работы:
- •Вопросы для самоконтроля
3.1. Команды простого поиска
1. Поиск группы слов. При работе с любой поисковой системой следует выяснить, как она воспринимает группу слов в запросе, например, выдающиеся физики, то есть ищут документы, в которых оба слова встречаются одновременно. Так же работает поисковая системе Google. Но большинство англоязычных поисковых систем воспринимают группу слов таким образом, будто между ними стоит союз ИЛИ и ищут документы, которые содержат или первое, или второе слово, или оба слова вместе. Количество слов в группе не ограничивается.
2. Поиск словоформ. В связи с тем, что в украинском и русском языках слова изменяются по падежам, важным свойством поисковой системы есть поиск словоформ. В большинстве случаев поисковые системы разрешают находить разные словоформы, например, предыдущий запрос на поиск выдающиеся физики равносилен запросу выдающийся физика.
3. Роль больших букв. Общее правило для большинства поисковых систем состоит в том, что большие буквы в начале слова воспринимаются как дополнительное условие, которое ограничивает область поиска. Например, по запросу Лига Чемпионов будут найденные лишь те документы, которые содержат слова Лига Чемпионов. Тем не менее поиск по запросу лига чемпионов возвратит документы, в которых есть слова Лига чемпионов, лига Чемпионов, Лига Чемпионов, лига чемпионов.
4. Поиск однокорневых слов. Большинство поисковых систем находит документы, которые содержат слова однокорневые с ключевыми. Например, поиск по запросу модел возвратит документы, в которых есть слова модель, моделей, модельный, моделизм, моделирует, моделирование.
5. Средства контекстного поиска. Если ключевые слова заключить в кавычки, например "To be or not to be", "Слово о полку Игоревом", то поисковая система должна найти документы, в которых данная фраза присутствующая буквально, то есть именно так, как она записана. Для поиска фразы с абсолютно точным совпадением поисковой системе недостаточно индексного файла, и она обращается к копиям прежде сохраненных в своей базе Web-страничек.
6. Искать в найденном. Если в результате поиска было найдено слишком много документов и пользователь имеет желание сократить такой список, то для этого используется услуга "Искать в найденном", которую предоставляют поисковые системы на пульте управления поиском. Например, запрос электронная библиотека можно уточнить запросом фантастика.
3.2. Команды языка запросов
В расширенном поиске, кроме ключевых слов, можно использовать простые логические операторы и логические скобки.
1. Оператор И. При помощи этого оператора объединяют два ли более слов таким образом, чтобы они все были в документе, например Эйнштейн И теория И относительности. Как было указано выше, в украино- и русскоязычных поисковых системах списки слов и без такого оператора воспринимаются так, будто между ними стоит оператор И. Но для большинства англоязычных поисковых систем оператор И играет важную роль, нему отвечают символы "&" и "+".
2. Оператор ИЛИ. Оператор обеспечивает поиск по любому слову из группы, например, университет ИЛИ академия. В большинстве поисковых систем оператор ИЛИ записывается в запросе как OR.
3. Логические скобки. Скобки применяются, когда необходимо управлять порядком действий логических операторов, например, поиск по запросу (чемпионат ИЛИ кубок) И мира возвратит документы, в которых есть слова чемпионат мира или кубок мира.
4. Оператор НЕ. Этот оператор используется, когда из результатов поиска необходимо исключить некоторое ключевое слово. Необходимость в этом возникает, когда надо избежать двусмысленности или уменьшить количество ссылок, которые возвращаются. Например. Паскаль НЕ (язык программирования), кинопремия НЕ оскар.
5. Поиск с указанием расстояния. Такой вид поиска разрешает указать, на каком расстоянии одно от другого должны располагаться слова в документе. В англоязычных поисковых системах используется оператор NEAR. Например,
information NEAR resources - для англоязычных систем (чем ближе расположенные ключевые слова один к другому, тем выше релевантность документа. Если расстояние между словами более 50 слов, то релевантность считается нулевой);
[5, информационные ресурсы] - для системы <МЕТА> (оба ключевого слова должны принадлежать одной группе длиной не более пяти слов),
информационные/ 2 ресурсы - для системы Яндекс (расстояние между ключевыми словами не должно превышать 2 слов).
