Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Metod_lab_5.doc
Скачиваний:
0
Добавлен:
28.01.2020
Размер:
337.92 Кб
Скачать

Лабораторна робота № 5 на тему: Застосування мови запитів пошукової системи Yandex. Засоби збереження соціальних закладок

Мета роботи: ознайомитися з мовою запитів пошукової системи Yandex, вивчити пошукові оператори та їхній синтаксис, навчитися застосовувати мову запитів для формування складних запитів до пошукової системи та використовувати засоби збереження соціальних закладок на прикладі Delicious для збереження та спільного використання онлайн ресурсів.

Теоретичні відомості

1. Мова запитів пошукової системи Yandex

Розглянемо пошукову систему Яндекс (Yandex) – http://www.yandex.ru

Пошукова система «Яндекс» є 5-ою серед пошукових сайтів світу за кількістю оброблених пошукових запитів (більше 3 млрд, 1,7% від світової кількості, статистика за вересень 2011 року). За станом на 16 листопада 2012 року, згідно з рейтингом Alexa.com, за популярністю сайт yandex.ru займає 18-е місце в світі і 1-е місце в Росії. Яндекс – означає мовний індекс, або з англійської Yandex - Yet Another Indexer. Назву Яндекс придумав один з розробників пошуковика.

Пошукова система Яндекс має великий ряд внутрішніх чинників ранжування. Якщо у пошукової системи Google одним з основних алгоритмів є PageRank, то у пошукової системи це тематичний індекс цитування або скорочено ТІЦ. Якщо враховувати такі моменти як морфологію слов’янських мов, то Яндекс однозначно домінує над Google.

Для максимального зниження рівня інформаційного шуму у результатах пошуку необхідно використовувати розширені можливості пошукових систем. Доступ до розширених можливостей та їх застосування реалізується або через панель розширеного пошуку (лабораторна робота №3), або через мову запитів до пошукової системи.

Мова запитів передбачає наявність спеціальних операцій пошуку, які дають змогу параметризувати запит, щоб отримати якомога точніший результат. Використовуючи відповідний синтаксис мови запитів, створюється запит до конкретної пошукової системи.

Синтаксис операцій пошукової системи Google розглядається у лабораторній роботі № 4. Синтаксис операцій пошукової системи Яндекс подано в таблиці 1.

Таблиця 1.

Синтаксис операцій пошукової системи Яндекс

Синтаксис операцій Яндекс

Приклад

Застосування

“запит

освіта в Україні”

Слова в результатах пошуку повинні зустрічатися в прямій послідовності у точній формі

“запит * запит”

не було * то * помогло”

Пошук пропущеного слова в цитаті

запит1 & запит2

закон & освіта

Пошук слів, які зустрічаються у результатах в межах одного речення

запит1 && запит2

закон && освіта

Пошук слів, які зустрічаються у результатах в межах одного документа

запит1 | запит2

університет | універ | ВНЗ

Пошук будь-якого зі слів

запит1 << запит2

система ECTS << ВНЗ

Неранжуюче “і”. Слово(а) після оператора не впливає на позицію у результатах пошуку. «Яндекс» покаже документи, в яких є слова, які стоять і праворуч, і ліворуч від оператора, але слово праворуч не братиме участь у ранжуванні: тобто пошукова система виводить і ранжує результати за запитом [система ECTS] з бази документів, що містять [система ECTS] і [ВНЗ].

запит1 /3 запит2

догляд /3 орхідея

Відстань у межах певної кількості слів в будь-яку сторону (тобто між заданими словами може зустрічатися певна кількість слів). Якщо це цифра 2, то оператор аналогічний * (будь-яке слово), а якщо 3 і більше – набуває власну функціональність.

Запит1 && /3 запит2

Мені тринадцятий минало && /3 любо стало

Пошук слів із відстанню у певну кількість речень у будь-який бік. На прикладі показано обмеження у три речення.

Запит1 ~~ запит2

Породи собак ~~ вівчарка

Виключення певного слова з результатів пошуку

Запит1 /+2 запит2

ВНЗ /+2 Львів

Обмеження відстані між словами. На прикладі розглядається відстань “не більше ніж два” слова між запит1 та запит2 (у прямій послідовності)

Запит1 ~ запит2

німецька ~ вівчарка

Пошук речення, де запит1 зустрічається без запит2, тобто знайти речення (а не документ, як оператор ~ ~) в якому є слово, розташоване ліворуч від тильди (німецька), але немає слова, яке поставлено справа (вівчарка).

запит1 /(-X +Y) запит2

Документ /(-1 +2) електронний

Відстань від X слів в зворотному порядку до Y слів у прямому. Наприклад, слово електронний може стояти безпосередньо перед словом документ, зразу після нього або через одне слово, але не далі.

!Запит

!Могутній

!Було !Україні

Спосіб врахування того, що слово записується з великої літери, а також знак оклику «фіксує» форму - пошук буде проводиться у документах, де слово присутнє саме в такій формі.

(складний запит)

title:(дуб | береза)

Групування в складних запитах. Використовується для того, щоб вказати, що під дію певного оператора потрапляє не одне слово, а група слів. Наприклад, у заголовку слово дуб або береза.

title:запит

title:(економічне зростання)

Пошук у заголовку сторінки

Увага! Після оператора перед запитом НЕ ставиться пробіл!

inurl:запит

inurl:lviv

Пошук за елементом в URL-адресі

Увага! Після оператора перед запитом НЕ ставиться пробіл!

site:URL

site:skid-lp.info

Пошук серед усіх піддоменів і сторінок заданого сайту.

Увага! Після оператора перед запитом НЕ ставиться пробіл!

mime:pdf

Пошук за одним типом файлів.

Увага! Після оператора перед запитом НЕ ставиться пробіл!

lang:en

Пошук з мовним обмеженням. Якщо потрібні результати, наприклад, тільки з англомовних сторінок, то можна задати обмеження en.

Увага! Після оператора перед запитом НЕ ставиться пробіл!

domain:ru

Пошук з обмеженням домену.

Увага! Після оператора перед запитом НЕ ставиться пробіл!

date:дата

date:201302*

вибух date:201302*

Пошук сторінок з обмеженням дати (тобто «не старіші, ніж ...»). Якщо потрібно знайти свіжі документи за певним запитом. Наприклад, статті про процесори нового покоління, тоді статті за 2006 рік можуть бути вже неактуальні. Запит записується у формі: РікМісяцьДень (день можна заміняти зірочкою, якщо він неважливий)

Увага! Після оператора перед запитом НЕ ставиться пробіл!

date:20071215..20080101, date:>20091231

Пошук з обмеженням інтервалу часу.

Увага! Після оператора перед запитом НЕ ставиться пробіл!

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]