Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Додаткова тема Інтернет.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
284.16 Кб
Скачать

7. Програмне забезпечення Інтернету

Успішне використання мережі Інтернет значною мірою залежить від правильного вибору ПЗ. їх виділяють кілька основних груп:

  • браузери (browsers) — дослідники Всесвітньої павутини. Це програми, які дають змогу знаходити й переглядати гіпертекстові документи, опубліковані в мережі й на комп'ютері користувача: Microsoft Internet Explorer, Netscape Navigator, Opera, Mozilla Firefox, Google Chrome, Safari;

  • поштові програми (e-mailprogrammes) — спеціальні програми для прийняття, відправлення, сортування й перегляду електронної пошти: Eudora, The Bat!, MS Outlook Express;

  • FTP-клієнти — програми для обміну файлами: CuteFTP, WSFTP; менеджери завантаження (download manager) — програми завантаження файлів з мережі Інтернет: FlashGet, GoJZilla, ReGet, GetRight;

  • програми спілкування (chat programmes) — програми, що на­дають можливість вести переговори в мережі як у текстовому режи­мі, так і в режимі аудіо- й відеообміну: MicroIRC, ICQ, IPhone, EasyTalk, NetMeeting;

  • програми додзвону (dialer programmes) — програми для з'єд­нання з провайдером за одним або декількома номерами телефонів: E-type Dialer, Advanced Dialer;

  • HTML-редактори — програми підготовки веб-документів: FrontPage, DreamWeaver.

Очевидно, що цим переліком список програмного забезпечення Інтернету не обмежується. Кожна з груп може бути значно поповне­на прикладами.

8. Пошук в Інтернеті

Проблема одержання потрібної інформації полягає в тому, що необхідно вказати її точну адресу — URL. Саме цю адресу нам і по­трібно знайти насамперед.

Якщо знайдемо такий URL, то легко введемо його в адресний ря­док програми-браузера й побачимо потрібну веб-сторінку або скача­ємо файл.

Пошукова система — це спеціалізований веб-вузол, який надає можливість пошуку інформації в Інтернеті. Більшість таких систем шукають інформацію на сайтах Всесвітньої павутини, але є також системи, здатні шукати файли на FTP-серверах, товари в інтернет-магазинах, а також інформацію в групах новин UseNet.

Користувач повідомляє пошуковій системі дані про зміст шука­ної веб-сторінки, а вона видає список гіперпосилань на сторінки, на яких згадуються відповідні відомості. Є кілька моделей, на яких ба­зується робота пошукових систем, але історично лише дві моделі на­були найбільшої популярності. Це пошукові каталоги й пошукові покажчики.

Пошукові каталоги

Пошукові каталоги влаштовані за тим самим принципом, що й тематичні каталоги великих бібліотек. Звернувшись до пошукового каталогу, ми знаходимо на його основній сторінці скорочений спи­сок великих тематичних категорій (наприклад, "Наука").

Кожен запис у списку категорій — це гіперпосилання. Клікнув-ши мишею на ньому, відкривається наступна сторінка пошукового каталогу, на якому ця тема подається докладніше, наприклад, з та­ких предметів, як астрономія, біологія, географія, математика, фі­зика. Натиснувши на назву теми (наприклад, "Фізика"), відкрива­ється сторінка зі списком розділів (астрофізика, атомна фізика, гід­родинаміка, механіка). Продовжуючи "занурення" в тему, можна дійти до списку конкретних веб-строрінок і вибрати той ресурс, який краще підходить для вирішення завдання.

Робота з пошуковими каталогами інтуїтивно проста. У них по­шук інформації практично завжди завершується плідно. Однак за цією простотою ховається найвища складність створення й ведення каталогу. їх створює вручну колектив висококваліфікованих редак­торів. При цьому загальний обсяг каталогізованих веб-ресурсів не­великий, а ступінь охоплення загального обсягу веб-ресурсів змен­шується.

Незважаючи на низький коефіцієнт охоплення, пошукові ката­логи мають велику популярність. їх прийнято використовувати для первинного, реферативного пошуку інформації із заданої теми. Якщо для користувача тема зовсім нова й недосліджена, то йому на­самперед потрібні вказівники на класичні, найбільш змістовні ре­сурси, а саме це й забезпечують пошукові каталоги. Людський фак­тор, пов'язаний із тим, що над складанням каталогу працюють люди, а не програми, забезпечує якісний відбір найважливіших ресурсів з кожної теми.

Пошукові покажчики

Автоматичну каталогізацію веб-ресурсів і задоволення запитів клієнтів виконують так звані пошукові покажчики (пошукові маши­ни). Із процесу наповнення бази даних пошукової системи виключа­ється людський фактор. При цьому значно погіршується якість по­силань, які надає система за результатами пошуку, але одночасно збільшується їхня кількість.

Основними критеріями якості роботи пошукової машини є релевантність (ступінь відповідності запиту і знайденого), повнота бази, врахування морфології мови.

Принцип роботи пошукового покажчика полягає в пошуку веб-ресурсів за ключовими словами. Користувач описує потрібний ре­сурс за допомогою ключових слів, після чого дає завдання на пошук. Пошукова система аналізує дані, що зберігаються в її базі, і видає список веб-сторінок відповідно до запиту. Разом з гіперпосиланнями видаються короткі відомості про знайдені ресурси, на підставі яких користувач вибирає потрібні.

Різні пошукові покажчики застосовують різні інформаційні тех­нології для обробки запитів користувачів. Щоб ефективно здійсню­вати пошук інформації в WWW, потрібно хоча б поверхово розуміти принципи їх роботи.

Роботу пошукового покажчика умовно можна поділити на три етапи. Два етапи є підготовчими, вони не помітні для клієнта, і лише на третьому етапі відбувається взаємодія з користувачем, але від кожного з етапів залежать функціональні властивості пошукової системи й ефективність роботи з нею.

Три етапи роботи пошукового показчика.

Збір первинної бази даних. На першому етапі пошукова система займається скануванням інформаційного простору World Wide Web. Для цього використовують спеціальні агентські програми — worms (черви). Не слід плутати агентів пошукових систем з різновидом ме­режевих комп'ютерних вірусів, теж іменованих worms. Черви пошу­кових систем безпечні для серверів і клієнтів WWW. За сутністю це дуже ефективні невеликі браузери. їм не потрібно виконувати фун­кції перегляду й відтворення вмісту. їхнє завдання полягає в тому, щоб автоматично розшукувати веб-ресурси, переходячи по гіперпосиланнях, і, переконавшись, що цей ресурс системі ще не відомий, копіювати його у свою базу даних. Так само відбувається й віднов­лення раніше прийнятих документів, але змінених за час після по­переднього копіювання.

Індексація бази даних. Пошук ключових слів, уведених кори­стувачем, у великій базі — це досить тривала операція.

Щоб не затримувати клієнта більше ніж на частку секунди, зі­брані бази даних проходять попередню обробку, так звану індекса­цію. На цьому етапі індексації створюються спеціалізовані докумен­ти — пошукові покажчики.

Рафінування кінцевого списку — це третій етап роботи, під час якого здійснюється взаємодія з користувачем. Створюється перелік посилань, який передається користувачеві як результат. Уявлення користувача про якість роботи пошукової системи прямо залежить від технологій, використаних на цьому етапі.

Рафінування полягає у:

  • фільтрації результатів по­шуку;

  • ранжуванні результатів по­шуку.

Фільтрацію розглядають як відсівання посилань, які видава­ти користувачеві недоцільно. Насамперед перевіряється наявність дублікатів. Вони перевантажують кінцевий список й утруднюють вибір справді корисних ресурсів.

Ранжування передбачає створення спеціального порядку подан­ня кінцевого списку, при якому "найкорисніші" (з погляду пошуко­вої системи) посилання наводяться на початку списку, а "найменш корисні" — у його кінці. Розуміння критерію "корисності" посилан­ня може бути різним. Саме тому різні пошукові системи, які навіть працюють з однаковими базами ресурсів, видають різні результати пошуку.

До переваг застосування пошукових машин належить величез­ний обсяг інформації, досліджуваної ними, та її періодична актуалі­зація. Однак при цьому не враховуються документи, які не містять ключових слів, а з іншого боку, у списку є багато непотрібної інфор­мації, "відсівання" якої забирає чимало часу.

Нові пошукові технології

Автоматична каталогізація. Для пошукових каталогів пи­тання невідповідності між розмірами дослідженого й недослідженого веб-простору стоїть особливо гостро. Перспективні напрями роз­витку засновані на впровадженні так званих SMART-технологій автоматичної каталогізації.

Існують теоретичні дослідження в області SMART-технологій, але найперспективнішою є модель векторного інформаційного про­стору.

Уявімо експерта в певній галузі, наприклад, у фізиці. Якщо йому поставити завдання, то, напевно, він зможе скласти словники, ха­рактерні для таких галузей, як механіка, термодинаміка, оптика. Проаналізувавши низку документів, що стосуються цих наукових галузей, він зможе не тільки вказати характерні терміни й поняття, але й дати їм вагові оцінки. Комбінуючи терміни й вагові коефіцієн­ти, можна будувати багатовимірні системи координат, у яких різні сфери знання описувалися б різними багатовимірними векторами.

Автоматично одержавши нову веб-сторінку, пошукова система може побудувати для неї математичний вектор, заснований на фор­мальному аналізі змісту. Порівнюючи цей вектор з уже розрахова­ними векторами для різних галузей знання, система може без участі людини припустити, до якої категорії, теми та розділу належить той чи інший документ.

За такого підходу не обов'язково зберігати копії всіх відомих веб-сторінок, як не потрібно зберігати й їхні пошукові покажчики. Ціл­ком достатньо для кожного веб-документа зберігати лише його URL-адресу й число, що відповідає вектору. У цей час конкретні алгорит­ми SMART-технологій не публікуються, але можна припустити, що вони вже працюють, наприклад, у пошукових системах реального часу.

Пошукові системи реального часу.

Це новий напрям у техноло­гіях пошуку. Для роботи з такою службою користувач має підклю­читися до її центрального сервера, одержати з нього і встановити на своєму комп'ютері програму-клієнта. Ця програма підключається до браузера й працює як додаткова панель.

При кожному запуску браузера програма-клієнт встановлює з'єд­нання зі своїм центральним сервером і далі працює з ним у парі. Вона передає серверу копії всіх веб-сторінок, які відвідує користувач.

Од­нак при цьому є дві істотні відмінності:

  • людина у процесі навігації у веб керується не тими принципа­ми, що автоматична програма, тому сервер одержує копії не всіх веб-ресурсів, а тільки тих, що зацікавили когось із його клієнтів;

  • якщо поставкою веб-ресурсів займаються кілька мільйонів постійних клієнтів, індексація веб-простору відбувається набагато швидше.

У свою чергу, користувач теж має важливу перевагу. На якій би веб-сторінці він не перебував, система завжди готова запропонувати йому список інших веб-сторінок з близьким за тематикою змістом. Вона готує цей список на підставі попереднього досвіду, отриманого в роботі з іншими людьми. Так можна одержати рекомендації, які було б дуже важко (а найчастіше неможливо) розшукати у веб тра­диційними пошуковими засобами.

Прийоми ефективного пошуку

При проведенні первинного реферативного пошуку, коли тема задана досить широко, доцільно використовувати пошукові катало­ги. Це дасть змогу швидко встановити місце розташування основних першоджерел. При ознайомленні з першоджерелами слід насампе­ред приділяти увагу понятійній базі. Знання головних понять і тер­мінів дозволить перейти до поглибленого пошуку в пошукових по­кажчиках із використанням ключових слів, які найточніше харак­теризують тему.

При цьому варто розрізняти прийоми:

  • простого,

  • роз­ширеного,

  • контекстного,

  • спеціального пошуку.

Простий пошук — пошук веб-ресурсів за одним або декількома ключовими словами. Недолік полягає у тому, що зазвичай видаєть­ся занадто багато документів, серед яких важко вибрати найбільш відповідні.

При використанні розширеного пошуку ключові слова зв'язують між собою операторами логічних відношень. Розширений пошук за­стосовують у тих випадках, коли прийоми простого пошуку дають занадто багато результатів. За допомогою логічних операторів пошу­кове завдання формують так, щоб точніше деталізувати завдання й обмежити сферу відбору, наприклад, за датою публікації або типом даних.

Контекстний пошук — це пошук за точною фразою. Він зруч­ний для реферативного пошуку інформації, але доступний не у всіх пошукових системах. Насамперед, щоб забезпечувати таку можли­вість, система має працювати не лише з індексованими файлами, але й з повноцінними образами веб-сторінок. Ця операція досить повільна.

Спеціальний пошук застосовують при розшукуванні веб-сто­рінок, що містять посилання на задані адреси URL, ті, які в службо­вих полях містять задані дані, наприклад, у полі заголовка.

Пошукових систем у мережі Інтернет досить багато.

Нижче за­значені лише найпопулярніші:

  • Google — http://www.google.com.ua;

  • Meta — http://www.meta.ua;

  • Excite — http://www.excite.com;

  • Yahoo — http://www.yahoo.com і приналежні цій компанії пошукові ма­шини: AltaVista — http://www.altavista.com, Alltheweb FAST-Engine — http://www.alltheweb.com, Overture, Inktomi;

  • MSN (нале­жить компанії Microsoft) — http://www.msn.com;

  • InfoSeek — http:// www.infoseek.com;

  • Яндекс — http://www.yandex.ru та ін.