Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
реферат пошукові системи.docx
Скачиваний:
35
Добавлен:
22.03.2015
Размер:
113.12 Кб
Скачать

3.Організація пошуку інформації за допомогою тематичних каталогів та пошукових машин

Найбільш популярним в усьому світі визнаний тематичний каталог, згідно зі статистикою Alexa Internet и Netcraft, - Yahoo! (http://www.yahoo.com ). Глобальна мережа веб-сайтів Yahoo! опрацьовує 3,4 млрд. запитів веб-сторінок в день. Він являє собою величезну базу даних URL-адрес сайтів усілякої тематики. Yahoo! пропонує вам скористатися ієрархічним деревом при пошуку інформації. Тобто, ви обираєте спочатку загальну тематику, що задовольняє вашому запиту інформації, і далі конкретизуєте, випливаючи підказкам каталогу. Звичайно в результаті ви одержуєте список сайтів, що містять інформацію, що відповідає вашому запиту. Yahoo! (NASDAQ: YHOO) — американська компанія, яка володіє другою за популярністю (12.46 %) в світі пошуковою системою та представляє ряд сервісів, які з’єднані інтернет-порталом Yahoo! Directory; портал вміщує популярний сервіс електронної пошти Yahoo! Mail, один із найстаріших та найпопулярніших в Інтернеті. Не так давно була запущена нова версія поштового інтерфейсу, яка заснована на AJAX.

Компанія Yahoo! була заснована аспірантами Стенфордського університету Девідом Філо (англ. David Filo) та Джеррі Янгом (англ. Jerry Yang) в січні 1994 року; стала корпорацією 2 березня 1995 року. Головний офіс компанії знаходиться в місті Саннівейл (англ. Sunnyvale), штат Каліфорнія, США.

Якщо ж ви шукайте інформацію свідомо україномовну, то має сенс використовувати українські каталоги, наприклад, "Сузір'я Інтернет", що містить тільки обрані (найцікавіші) ресурси. Принцип роботи з ними ідентичний тому, який ми розглянули на прикладі з Yahoo!. Для пошуку російськомовної інформації слід відзначити перший російський каталог Russіa on the Net (http://www.ru), один з найбільших російськомовних каталогів Lіst.RU (http://www.lіst.ru), російський варіант Yahoo! (http://www.yahoo.ru).

Пошукові машини улаштовані трохи інакше. По суті це сервер з величезною базою даних URL-адрес, що автоматично звертається до сторінок WWW по всіх цих адресах, вивчає вміст цих сторінок, формує і прописує ключові слова зі сторінок у свою базу даних (індексує сторінки). Більш того, цей сервер звертається по всім, що зустрічаються на сторінках посиланнями і переходячи до нових сторінок, проробляє з ними теж саме. Тому що майже будь-яка сторінка WWW має безліч посилань на інші сторінки, то при подібній роботі пошукова машина в кінцевому результаті теоретично може обійти всі сайти в Інтернет. Одназ популярних пошуковихмашин AltaVіsta (http://www.altavіsta.com) містить 11 мільярдів слів, витягнутих з 30 мільйонів WWW-сторінок. Як користатися цим сервісом? Необхідно продумати рядок запиту інформації (не більш ніж 5 слів), як у випадку з Yahoo! і також набрати її в поле введення. Над кнопкою Search (Пошук) знаходиться спадаюче меню з вибором мови. Перед натисканням Enter чи кнопки Search необхідно вибрати мову представлення інформації. Крім того, у запит інформації можна включати спеціальний символ *, що розширює діапазон пошуку. Скажемо, що б Altavіsta могла знайти не тільки усі входження слова "легка", але слова "легку", "легкої" і т.д., у запиті треба писати "легк**", тобто букви закінчення заміняємо на символ *. Для пошуку в російськомовному Інтернет Altavіsta не дуже підходить. Якщо на запит "Lіght іndustry" Altavіsta формує список з 2917 URL-адрес, то по запиті "Легка промисловість" з'являється список посилань на всього 9 сайтів.

Проблема більше полягає в тому, що пошукова машина в результаті вашого запиту генерує гігантський список адрес URL з короткими описами. Варто також відзначити інші російськомовні пошукові машини Апорт (http://www. aport.ru) і АУ (http://www.au.ru).

Читаючи про всі перераховані пошукові служби, по неволі задумаєшся: "а якщо для пошуку необхідної мені інформації не досить однієї пошукової служби, та невже мені доведеться входити на всі тут перераховані сервера і щораз повторювати той самий запит?!". Найбільш якісний результат саме буде саме при такому підході. Але можна, виходячи з економії часу і грошей, скористатися системами позначка пошуку. Найбільш популярна у світі система такого класу Search.com(http://www.search.com), але якщо ми працюємо переважно з російськомовними документами, то можна використовувати Savvy Search. Це досить могутня система відсилає ваш запит на 13 найбільших пошукових машин (у тому числі і російських) і повертаючи вам їхні звіти.