Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лабораторні роботи з КМІ / Лабораторна робота № 3.doc
Скачиваний:
38
Добавлен:
23.03.2015
Размер:
101.89 Кб
Скачать

Лабораторна робота № 3 Пошук інформації в Internet

Мета роботи – опанувати основні принципи роботи з пошуковими серверами. Опанувати метод пошуку інформації з використанням ключових слів.

 

Робота з сервером Яндекс.

Сервер Яндекс має адреси:

http://yandex.ru/

http://www.ya.ru/

1. Як трактуються слова

Незалежно від того, яка форма слова стоїть в запиті, пошук враховує всі форми за правилами російської мови.

Наприклад, якщо задано запит “идти”, те в результаті пошуку будуть знайдені посилання на документи, що містять слова „идет”, „шел”, „шла” тощо . На запит „окно” буде видана інформація, що містить і слово „окон”, а на запит „отзывали” - документи, що містять слово „отозвали”.

Якщо в запиті слово набране з великої букви, будуть знайдені тільки слова з великої літери, у противному випадку будуть знайдені як слова з великої, так і з маленької літери.

Наприклад, запит „лебедь” знайде й птаха, і генерала. Запит „Лебедь” - генерала й ті випадки згадування птаха, коли вона написана з великої букви.

2. Основні оператори

Декілька набраних у запиті слів, розділених пробілами, означають, що всі вони повинні входити в один абзац шуканого документа. Той же самий ефект зробить вживання символу „&”.

Наприклад, при запиті „холодная вода” (або „холодная & вода”), результатом пошуку буде список документів, у яких в одному абзаці втримуються й слово „холодная”, і слово „вода”.

Між словами можна поставити знак „|” (або кому „,”), щоб знайти документи, що містять будь-яке з цих слів.

Запит виду „вода | огонь” або „вода,огонь” задає пошук документів, що містять в одному абзаці хоча б одне зі слів „вода” або „огонь”.

Ще один знак, тильда „~”, дозволить знайти документи з абзацом, що містить перше слово, але не містять друге.

По запиті „холодный ~ горячий” будуть знайдені всі документи, що містять слово „холодний”, поруч із яким (у межах абзацу) немає слова „горячий”.

Щоб здійнятися на сходинку вище, від рівня абзацу до рівня документа, треба подвоїти відповідний знак. Одинарний оператор (&, ~) шукає в межах абзацу, подвійний (&&, ~~) - у межах документа.

Наприклад, по запиті „холодная && вода” будуть знайдені документи, що містять будь-де обоє ці слова. А запит „квас ~~ теплый” видасть всі документи зі словом „квас”, але без слова „теплый”

3. Пошук з відстанню

Як Яndex адресує слова? Якщо всі слова в тексті перенумерувати, то відстань між словами a й b - це різниця між номерами слів a й b. Таким чином, відстань між сусідніми словами дорівнює 1 (а не 0), а відстань між сусідніми словами, що стоять "не в тому порядку", дорівнює -1. Те ж саме стосується й абзаців. Якщо між двома словами поставлений знак „/”, за яким відразу надруковане число, виходить, потрібно, щоб відстань між ними не перевищувало цього числа слів.

Наприклад, по запиті „холодная /2 вода” повинні бути знайдені документи, у яких містяться й слово „холодная” і слово „вода”, причому відстань між ними повинне бути не більше двох слів і вони повинні перебувати в одному абзаці.

Якщо порядок слів і відстань точно відомі, можна скористатися пунктуацією /+n. Так, наприклад, задається пошук слів, що стоять підряд.

Запит „холодная /+1 вода” означає, що слово „вода” повинне випливати безпосередньо за словом „холодная”. (До речі, до того ж результату приведе запит "холодная вода")

У загальному виді обмеження по відстані задається за допомогою пунктуації виду „/(n m)”, де „n” мінімальне, а „m” максимально припустима відстань. Звідси запис „/n” еквівалентний „/(-n +n)”, а запис „/+n” еквівалентний „/(+n +n)”.

Запит „холодная /(-2 4) вода” означає, що „вода” повинна перебувати від „холодная” в інтервалі відстаней від 2 слів ліворуч до 4 слів праворуч.

Знаки можна комбінувати з обмеженням відстані.

Наприклад, результатом пошуку по запиті „холодная ~ /+1 вода” будуть документи, що містять слово „холодна”, причому в цих документах слово „вода” не стоїть безпосередньо за словом „холодная”.

Коли знаки обмеження по відстані стоять після подвійних операторів, то вжиті там числа - це відстань не в словах, а в абзацах. Відстань в абзацах визначається аналогічно відстані в словах.

Запит „холодная && /1 вода” означає, що слово „вода” повинне перебувати в тому ж самому, або в сусідньому зі словом „холодная” абзаці.