Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
metoda / Metod_lab_IT_ta_tehnol_Internet_2010_ukr.doc
Скачиваний:
21
Добавлен:
16.03.2016
Размер:
2 Mб
Скачать

2 Пошук у web персональної інформації

2.1 Мета роботи

Вивчення прийомів пошуку інформації в Інтернеті.

2.2 Методичні вказівки з організації самостійної роботи студентів

Ознайомтесь за конспектом лекцій з темою “Пошук інформації в Інтернеті. Прийоми та особливості”. Додаткову інформацію за даною темою можна знайти в [3–7].

Пошук інформації в Інтернеті є можливим завдяки існуючим пошуковим серверам. Пошуковий сервер або машина – виділений компютер, який автоматично переглядає всі ресурси Інтернету та індексує їх зміст. Достатньо передати такому серверу фразу чи набір ключових слів, які описують цікаву для вас тему, і сервер поверне перелік джерел, що відповідає вашому запиту.

У Web існують десятки пошукових серверів, кожен з яких має свої особливості. Деякі переглядають всю Web-сторінку, інші – її заголовок, треті – ключові слова та інформацію в тегах МЕТА (теги, які включають ключові слова з описом змісту сторінки). Тому різні сервери видають результати, які відрізняються один від одного.

Тематичні каталоги це спеціалізовані сервери, що містять особливим образом упорядковану інформацію у виді гіпертекстову, що містить посилання на різні теми. Такі сервери пропонують вам скористатися ієрархічним деревом при пошуку інформації. Тобто ви вибираєте спочатку загальну тематику, що задовольняє вашому запиту інформації, і далі конкретизуєте, дотримуючись підказок каталогу. У кінцевому результаті ви одержуєте список сайтів, що містять інформацію, яка відповідає вашим вимогам. Відкіля такі сервери беруть інформацію про те, де і які знаходяться ресурси? Це роблять самі розроблювачі сайтів. Любий творець сайту може помістити (зареєструвати) посилання на нього не сервері-каталозі для того, щоб про його ресурс довідалися в мережі і могли його знайти. На деяких серверах-каталогах існують спеціальні служби, у яких люди займаються переглядом станиць у Internet е і самі заносять знайдені сторінки у відповідні теми каталогів. Такий добір найчастіше є більш якісним, однак останнім часом утрудняється з-за все зростаючого числа ресурсів. Тому таким способом формуються, у основному, спеціалізовані каталоги, що містять посилання на сторінки тільки по визначеній тематиці.

Найбільш популярним в усім світі визнаний тематичний каталог Yahoo! (http://www.yahoo.com).Він являє собою величезну базу даних URL-адрес сайтів усілякої тематики. Yahoo! Але можна скористатися пошуком по каталогу. Проаналізуйте передбачуваний зміст запитуваної інформації і виберіть ключові слова, що обов'язково зустрінуться в матеріалах або заголовках. Набираєте ці слова через пробіл у рядку введення на головній сторінці Yahoo! і натискаєте Enter. Система спробує сама підібрати цікавлячу вас інформацію.

Якщо ж ви шукайте інформацію свідомо російськомовну, то має сенс використовувати російські каталоги. Принцип роботи з ними ідентичний, тому який ми розглянули на прикладі з Yahoo!. Тут варто відзначити перший російський каталог Russia on the Net (http://www.ru),один з найбільших російськомовних каталогів List.RU (http://www.list.ru/),російський варіант Yahoo! (http://www.yahoo.ru).Має місце, також, каталог "Сузір'я Internet", що містить тільки обрані (заявлені як самі цікаві) ресурси. Говорячи про бази даних, не можна не згадати чудовий російський проект "Жовті сторінки Internet " (http://www.piter-press.ru/yp), де як і в однойменній книзі представлена детальна інформація про самі різні ресурси Internet .

Серед українських систем можна відзначити систему Мета http://www.meta-ukraine.com.ua, яка відрізняється досить зручним інтерфейсом, і має свій власний досить оригінальний реєстр українських сайтів, упорядкований по містах.

Пошукові машини улаштовані трохи інакше. По суті це сервер з величезною базою даних URL-адрес, що автоматично звертається до сторінок WWW по всіх цих адресах, вивчає вміст цих сторінок, формує і прописує ключові слова зі сторінок у свою базу даних (індексує сторінки). Більш того, цей сервер звертається по всім, що зустрічаються на сторінках посиланнями і переходячи до нових сторінок, проробляє з ними теж саме. Тому що майже будь-яка сторінка WWW має безліч посилань на інші сторінки, то при подібній роботі пошукова машина в кінцевому результаті теоретично може обійти всі сайти в Internet. Сама популярна пошукова машина AltaVista (http://www.altavista.com) містить 11 мільярдів слів, витягнутих з 30 мільйонів WWW-сторінок. Як користуватися цим сервісом? Необхідно продумати рядок запиту інформації (не більш ніж 5 слів), як у випадку з Yahoo! і також набрати її в поле введення. Над кнопкою Search (Пошук) знаходиться спадаюче меню з вибором мови. Перед натисканням Enter або кнопки Search необхідно вибрати мову представлення інформації. Крім того, у запит інформації можна включати спеціальний символ *, що розширює діапазон пошуку. Скажемо, що б Altavista могла знайти не тільки усі входження слова "легка", але слова "легку", "легкої" і т.д., у запиті треба писати "легк**". Букви закінчення, які змінюються, заміняємо на символ *.

Як і у попередньому випадку, для пошуку в російськомовному Internet Altavista не дуже підходить. Якщо на запит "Light industry" Altavista формує список з 2917 URL-адрес, то по запиті "Легка промисловість" з'являється список посилань на всего 9 сайтов. Найбільш розвитий сервіс пошуку російськомовної інформації надає сервер Яndex (http://www.yandex.ru).У Яndех можна просто написати по-російському фразу, що описує те, що ви хочете знайти. Система самостійно проаналізує й обробить ваш запит, а потім постарається знайти усе, що відноситься до заданої теми. Ну а в тому випадку, якщо потрібних документів не виявиться, можна продовжити пошук через AltaVista, куди автоматично передається вже оброблений системою запит. Але до передачі запиту AltavVista навряд чи дійде, тому що база Яndех містить порядку 2 000 000 документів і постійно обновляється. Проблема більше полягає в тому, що пошукова машина в результаті вашого запиту генерує гігантський список адрес URL з короткими описами. Яndех дозволяє конкретизувати ваш запит для скорочення цього списку до розумних меж. Ви можете на запит або набрати фразу за аналогією з попередніми системами, або, використовуючи, спеціальні оператори, скласти рядок, що пояснює Яndex, яким вашим вимогам повинна відповідати, інформація, що цікавить вас .

Треба відзначити, що більшість пошукових систем використовують аналогічну мову запитів, хоча, звичайно існують відмінності, що можуть полягати, наприклад, у використанні альтернативного написання логічних операторів природною мовою, прийнято. для даної країни, у якій дана пошукова система створена. Треба пам'ятати, що будь-яка пошукова система має допомогу по своїй мові запитів, яку варто вивчити при використанні даної системи. Варто згадати про ще одну популярну російську пошукову машину Rambler (http://www.rambler.ru).У цього сервера ще більш повна база даних адрес URL, чим у Яndex. Відмітною рисою Rambler є те, що цей сервер веде статистику відвідуваності посилань із власної бази даних. Ви завжди можете зайти в розділ "Рейтинг" на головній сторінці Rambler і побачити вміст тематичного каталогу, відсортованого по убуванню числа відвідувань сайтів і також їхньої популярності. Тим самим відтинаються явні аутсайдери і ви не витрачаєте на них свій час. Rambler також як і Yandex, дозволяє, крім простого запиту, запит з мовою запитів. Підтримуються ті ж логічні оператори І, АБО, НЕ, метасимвол * (аналогічно розширювальний діапазон запиту символові * у AltaVista), коэфіцієнтні символи + і -, для збільшення або зменшення значимості слів, що вводяться в запит.

Варто також відзначити інші російськомовні пошукові машини Апорт (http://www.aport.ru)і АУ (http://www.au.ru).

Пошукові машини і тематичні каталоги сьогодні мають багато загального. У каталогів присутня можливість пошуку інформації з рядка запиту з використанням логічних операторів, а пошукові машини містять свої власні тематичні каталоги. І проте найкраще всього пошукові сервіси виявляють себе у своїй первісній категорії.

Читаючи про всі перераховані пошукові служби, по неволі задумаєшся: "А якщо для пошуку необхідної мені інформації не досить однієї пошукової служби, то невже мені доведеться входити на всі тут перераховані сервери і щораз повторювати той самий запит?!". Найбільш якісний результат буде саме при такому підході. Але можна, виходячи з економії часу і грошей, скористатися системами позначка пошуку.

Системи позначки пошуку не мають своїх баз даних URL і не містять каталогів різної інформації, однак вони вміють обробляти запити користувачів певним чином і відправляти на них основі запити пошуковим системам. При цьому пошукові системи видають результат у виді списку посилань на ресурси, що відповідають запитуваної інформації, в упорядкованому виді.

Найбільш популярна у світі система такого класу Search.com (http://www.search.com),але якщо потрібна робота переважно з російськомовними документами, то можна використовувати Savvy Search (http://guaraldi.cs.colostate.edu:2000/form?lang=russian). Це досить могутня система відсилаюча ваш запит на 13 найбільших пошукових машин (у тому числі і російських) і повертаюча вам їхні звіти. Інша російська система мета пошуку "Слідопит" (http://www.medialingua.ru/www/Wwwsearc.htm)працює тільки з п'ятьма англомовними пошуковими машинами й одоюн російськомовною, але цікава тим, що переводить ваш російськомовний запит на англійську мову для англомовних пошукових машин.

Також існують так називані мультипошукові сторінки:

"Усі в одному" (http://www.tpi.ac.ru/~mike/search/index.htm);

Search (http://www.informika.ru/windows/intern/poisk/main.html);

Ці сервери не вміють посилати запити й одержувати звіти від пошукових служб як системи мета пошуку. Мультипошукові сторінки завантажують у безлічі вікон пошукові служби і передають їм ваш запит. До того ж такі системи працюють не стабільно.

В усім світі вважається найкращим сервісом для пошуку інформації в конференціях Usenet сервер DejaNews (http://www.dejanews.com).Серед російськомовних виділяється сервер RusNews (http://news.corvis.ru),який є також новинним сервером, що містить більш 2000 новинних груп. Точно також як і в інших пошукових службах ми набираємо рядок запиту, а сервер нам формує список конференцій, що містять наші ключові слова. Далі треба підписатися на відібрані нами конференції в нашій програмі роботи з новинами. Також має місце аналогічний російський сервер ТЕЛА-пошук (http://tela.dux.ru/news.html).

Якщо ви не знаєте адрес електронної пошти партнерів вашої організації треба, завдяки, так називаним, службам пошуку людей у Internet, указавши ПІБ вашого опонента теоретично ви можете одержати його адресу електронної пошти і URL-адресу.

2.2.1 Класифікація пошукових засобів

Пошук інформації в Інтернеті здійснюється за допомогою Пошукових серверів– виділених компютерів, який автоматично переглядає всі ресурси Інтернету та індексує їх зміст. Достатньо передати такому серверу фразу чи набір ключових слів, які описують цікаву для вас тему, і сервер поверне перелік джерел, що відповідає вашому запиту.

У Web існують десятки пошукових серверів, кожен з яких має свої особливості, які відрізняються один від одного.

Web-каталоги – це Web-вузол, який класифікує Web-сторінки відповідно з темами. Перевага Web-каталогу полягає в тому, що сторінки в ньому класифіковані людьми і відрізняються іерархичною структурою. Майже всі каталоги запропоновують пошук інформації по ключових словах. Такий засіб має назву ключевого индекса.

Web-портал – це Web-вузол, який може стати відправною точкою до вашого звязку з Інтернетом. Майже всі портали пропонують своїм клієнтам однаковий перелік послуг: Web-каталог, пошуковий сервер, служби новин, електронну пошту, домашню сторінку, сторінку чата, дошку оголошень, кімнату ігор, клуби, інвестиційні інструменти, дорожні мапи, інструментальні засоби покупки товарів, перелік  співрозмовник, індивідуальну початкову сторінку.

2.2.2 Пошук інформації з використанням машин пошуку та каталогів

Щоб зменшити обсяг інформації, який можна знайти за допомогою пошукових серверів (з деякими з них ви ознайомились у попередній роботі), використовують декілька простих прийомів. Існує і друга група методів, що встановлює відстань між словами запиту. Вона утворює групу розгорнутого пошуку.

Оператори параметрів запиту дозволяють обмежити область пошуку (як за часом створення, так і за рядом службових полів документа).

Загальна кількість результатів пошуку зявляється на початку сторінки. Найбільш релевантні (що відповідають) запиту відповіді з’являються над списком, із зазначенням кількості пропозицій, що відповідають запиту.

Крім посилання на знайдений документ (із зазначеннямдати створення і кодування документа) видається назва сторінки, дата створення файла і кодування документа. У тому випадку, якщо один ітой жесамий документ розташований на різних серверах, або поданий у різних кодуваннях, буде показаналишеодна відповідь із декількома посиланнями.

У тому випадку, якщо знайдений документ недоступний або істотно змінився з моменту індексації, можна використовувати "Реконструкцію тексту". У цьому випадку відкриєтьсяінше вікно зі змістомсторінки.

2.3 Опис лабораторної установки

Лабораторна робота виконується на ПЕОМ типу IBM PC в операційному середовищі Windows 9x із використанням Internet Explorer 5.0.

2.4 Порядок виконання роботи та методичні вказівки з її виконання

1. Отримайте завдання на пошук у викладача. Визначіть ключові слова для пошуку.

2. Запустіть програму Internet Explorer (Пуск / Программы / Іnternet Explorer).

3. Завантажте стартову сторінку обраної вами пошукової системи. Якщо ви шукаєте інформацію по одному ключовому слову, можна відразу вводити його в спеціально відведене для цього поле введення і відсилати запит, натиснувши на екранну кнопку Search або Submit. Ключове слово, що складається лише з літер англійського алфавіту, вводьте з використанням лише рядкових (маленьких) літер, тоді при пошуку розходження рядкових і прописних літер буде проігноровано. При пошуку інформації з російських ключових слів необхідно враховувати правила словозміни і проводити пошук за всіма можливими варіантами, включаючи можливі варіанти використання рядкових і прописних літер. Проведіть пошук за всіма відомими методами.

4. Перегляньте результати пошуку. Найбільш релевантні посилання запишіть у папку Избранное, Web - сторінки збережіть на диску для звіту.

5. Якщо результати пошуку незадовільні, змініть формулювання запиту або пошукової служби.

2.5 Зміст звіту

Звіт має мати: мету роботи; завдання для пошуку; формулювання розширених запитів і стислий опис релевантних Web-сторінок; висновки про ефективність пошукових служб у Internet.

2.6 Контрольні запитання та завдання

1. Наведіть класифікацію пошукових систем.

2. Чим відрізняються правила простого і розширеного пошуку інформації?

3. Опишіть правила застосування логічних операторів при розширеному пошуку.

4. Як задається відстань між ключовими словами при розширеному пошуку?

5. Як робиться пошук за адресами Web-серверів?

6. Для чого застосовуються оператор усікання та оператор нормальної форми?

7. Назвіть основні оператори параметрів запиту.

8. Назвіть найбільш відомі пошукові системи.

Соседние файлы в папке metoda