
- •Глобальна мережа іНтернет
- •Глобальна мережа інтернет
- •1. Основні поняття
- •2. Короткі відомості з історії Інтернету
- •3. Основи функціонування Інтернету
- •4. Протоколи Інтернету
- •5. Сервіси Інтернету
- •6. Способи підключення до Інтернету
- •7. Програмне забезпечення Інтернету
- •8. Пошук в Інтернеті
- •9. Етикет в Інтернеті
- •10. Безпека роботи в Інтернеті
7. Програмне забезпечення Інтернету
Успішне використання мережі Інтернет значною мірою залежить від правильного вибору ПЗ. їх виділяють кілька основних груп:
браузери (browsers) — дослідники Всесвітньої павутини. Це програми, які дають змогу знаходити й переглядати гіпертекстові документи, опубліковані в мережі й на комп'ютері користувача: Microsoft Internet Explorer, Netscape Navigator, Opera, Mozilla Firefox, Google Chrome, Safari;
поштові програми (e-mailprogrammes) — спеціальні програми для прийняття, відправлення, сортування й перегляду електронної пошти: Eudora, The Bat!, MS Outlook Express;
FTP-клієнти — програми для обміну файлами: CuteFTP, WSFTP; менеджери завантаження (download manager) — програми завантаження файлів з мережі Інтернет: FlashGet, GoJZilla, ReGet, GetRight;
програми спілкування (chat programmes) — програми, що надають можливість вести переговори в мережі як у текстовому режимі, так і в режимі аудіо- й відеообміну: MicroIRC, ICQ, IPhone, EasyTalk, NetMeeting;
програми додзвону (dialer programmes) — програми для з'єднання з провайдером за одним або декількома номерами телефонів: E-type Dialer, Advanced Dialer;
HTML-редактори — програми підготовки веб-документів: FrontPage, DreamWeaver.
Очевидно, що цим переліком список програмного забезпечення Інтернету не обмежується. Кожна з груп може бути значно поповнена прикладами.
8. Пошук в Інтернеті
Проблема одержання потрібної інформації полягає в тому, що необхідно вказати її точну адресу — URL. Саме цю адресу нам і потрібно знайти насамперед.
Якщо знайдемо такий URL, то легко введемо його в адресний рядок програми-браузера й побачимо потрібну веб-сторінку або скачаємо файл.
Пошукова система — це спеціалізований веб-вузол, який надає можливість пошуку інформації в Інтернеті. Більшість таких систем шукають інформацію на сайтах Всесвітньої павутини, але є також системи, здатні шукати файли на FTP-серверах, товари в інтернет-магазинах, а також інформацію в групах новин UseNet.
Користувач повідомляє пошуковій системі дані про зміст шуканої веб-сторінки, а вона видає список гіперпосилань на сторінки, на яких згадуються відповідні відомості. Є кілька моделей, на яких базується робота пошукових систем, але історично лише дві моделі набули найбільшої популярності. Це пошукові каталоги й пошукові покажчики.
Пошукові каталоги
Пошукові каталоги влаштовані за тим самим принципом, що й тематичні каталоги великих бібліотек. Звернувшись до пошукового каталогу, ми знаходимо на його основній сторінці скорочений список великих тематичних категорій (наприклад, "Наука").
Кожен запис у списку категорій — це гіперпосилання. Клікнув-ши мишею на ньому, відкривається наступна сторінка пошукового каталогу, на якому ця тема подається докладніше, наприклад, з таких предметів, як астрономія, біологія, географія, математика, фізика. Натиснувши на назву теми (наприклад, "Фізика"), відкривається сторінка зі списком розділів (астрофізика, атомна фізика, гідродинаміка, механіка). Продовжуючи "занурення" в тему, можна дійти до списку конкретних веб-строрінок і вибрати той ресурс, який краще підходить для вирішення завдання.
Робота з пошуковими каталогами інтуїтивно проста. У них пошук інформації практично завжди завершується плідно. Однак за цією простотою ховається найвища складність створення й ведення каталогу. їх створює вручну колектив висококваліфікованих редакторів. При цьому загальний обсяг каталогізованих веб-ресурсів невеликий, а ступінь охоплення загального обсягу веб-ресурсів зменшується.
Незважаючи на низький коефіцієнт охоплення, пошукові каталоги мають велику популярність. їх прийнято використовувати для первинного, реферативного пошуку інформації із заданої теми. Якщо для користувача тема зовсім нова й недосліджена, то йому насамперед потрібні вказівники на класичні, найбільш змістовні ресурси, а саме це й забезпечують пошукові каталоги. Людський фактор, пов'язаний із тим, що над складанням каталогу працюють люди, а не програми, забезпечує якісний відбір найважливіших ресурсів з кожної теми.
Пошукові покажчики
Автоматичну каталогізацію веб-ресурсів і задоволення запитів клієнтів виконують так звані пошукові покажчики (пошукові машини). Із процесу наповнення бази даних пошукової системи виключається людський фактор. При цьому значно погіршується якість посилань, які надає система за результатами пошуку, але одночасно збільшується їхня кількість.
Основними критеріями якості роботи пошукової машини є релевантність (ступінь відповідності запиту і знайденого), повнота бази, врахування морфології мови.
Принцип роботи пошукового покажчика полягає в пошуку веб-ресурсів за ключовими словами. Користувач описує потрібний ресурс за допомогою ключових слів, після чого дає завдання на пошук. Пошукова система аналізує дані, що зберігаються в її базі, і видає список веб-сторінок відповідно до запиту. Разом з гіперпосиланнями видаються короткі відомості про знайдені ресурси, на підставі яких користувач вибирає потрібні.
Різні пошукові покажчики застосовують різні інформаційні технології для обробки запитів користувачів. Щоб ефективно здійснювати пошук інформації в WWW, потрібно хоча б поверхово розуміти принципи їх роботи.
Роботу пошукового покажчика умовно можна поділити на три етапи. Два етапи є підготовчими, вони не помітні для клієнта, і лише на третьому етапі відбувається взаємодія з користувачем, але від кожного з етапів залежать функціональні властивості пошукової системи й ефективність роботи з нею.
Три етапи роботи пошукового показчика.
Збір первинної бази даних. На першому етапі пошукова система займається скануванням інформаційного простору World Wide Web. Для цього використовують спеціальні агентські програми — worms (черви). Не слід плутати агентів пошукових систем з різновидом мережевих комп'ютерних вірусів, теж іменованих worms. Черви пошукових систем безпечні для серверів і клієнтів WWW. За сутністю це дуже ефективні невеликі браузери. їм не потрібно виконувати функції перегляду й відтворення вмісту. їхнє завдання полягає в тому, щоб автоматично розшукувати веб-ресурси, переходячи по гіперпосиланнях, і, переконавшись, що цей ресурс системі ще не відомий, копіювати його у свою базу даних. Так само відбувається й відновлення раніше прийнятих документів, але змінених за час після попереднього копіювання.
Індексація бази даних. Пошук ключових слів, уведених користувачем, у великій базі — це досить тривала операція.
Щоб не затримувати клієнта більше ніж на частку секунди, зібрані бази даних проходять попередню обробку, так звану індексацію. На цьому етапі індексації створюються спеціалізовані документи — пошукові покажчики.
Рафінування кінцевого списку — це третій етап роботи, під час якого здійснюється взаємодія з користувачем. Створюється перелік посилань, який передається користувачеві як результат. Уявлення користувача про якість роботи пошукової системи прямо залежить від технологій, використаних на цьому етапі.
Рафінування полягає у:
фільтрації результатів пошуку;
ранжуванні результатів пошуку.
Фільтрацію розглядають як відсівання посилань, які видавати користувачеві недоцільно. Насамперед перевіряється наявність дублікатів. Вони перевантажують кінцевий список й утруднюють вибір справді корисних ресурсів.
Ранжування передбачає створення спеціального порядку подання кінцевого списку, при якому "найкорисніші" (з погляду пошукової системи) посилання наводяться на початку списку, а "найменш корисні" — у його кінці. Розуміння критерію "корисності" посилання може бути різним. Саме тому різні пошукові системи, які навіть працюють з однаковими базами ресурсів, видають різні результати пошуку.
До переваг застосування пошукових машин належить величезний обсяг інформації, досліджуваної ними, та її періодична актуалізація. Однак при цьому не враховуються документи, які не містять ключових слів, а з іншого боку, у списку є багато непотрібної інформації, "відсівання" якої забирає чимало часу.
Нові пошукові технології
Автоматична каталогізація. Для пошукових каталогів питання невідповідності між розмірами дослідженого й недослідженого веб-простору стоїть особливо гостро. Перспективні напрями розвитку засновані на впровадженні так званих SMART-технологій автоматичної каталогізації.
Існують теоретичні дослідження в області SMART-технологій, але найперспективнішою є модель векторного інформаційного простору.
Уявімо експерта в певній галузі, наприклад, у фізиці. Якщо йому поставити завдання, то, напевно, він зможе скласти словники, характерні для таких галузей, як механіка, термодинаміка, оптика. Проаналізувавши низку документів, що стосуються цих наукових галузей, він зможе не тільки вказати характерні терміни й поняття, але й дати їм вагові оцінки. Комбінуючи терміни й вагові коефіцієнти, можна будувати багатовимірні системи координат, у яких різні сфери знання описувалися б різними багатовимірними векторами.
Автоматично одержавши нову веб-сторінку, пошукова система може побудувати для неї математичний вектор, заснований на формальному аналізі змісту. Порівнюючи цей вектор з уже розрахованими векторами для різних галузей знання, система може без участі людини припустити, до якої категорії, теми та розділу належить той чи інший документ.
За такого підходу не обов'язково зберігати копії всіх відомих веб-сторінок, як не потрібно зберігати й їхні пошукові покажчики. Цілком достатньо для кожного веб-документа зберігати лише його URL-адресу й число, що відповідає вектору. У цей час конкретні алгоритми SMART-технологій не публікуються, але можна припустити, що вони вже працюють, наприклад, у пошукових системах реального часу.
Пошукові системи реального часу.
Це новий напрям у технологіях пошуку. Для роботи з такою службою користувач має підключитися до її центрального сервера, одержати з нього і встановити на своєму комп'ютері програму-клієнта. Ця програма підключається до браузера й працює як додаткова панель.
При кожному запуску браузера програма-клієнт встановлює з'єднання зі своїм центральним сервером і далі працює з ним у парі. Вона передає серверу копії всіх веб-сторінок, які відвідує користувач.
Однак при цьому є дві істотні відмінності:
людина у процесі навігації у веб керується не тими принципами, що автоматична програма, тому сервер одержує копії не всіх веб-ресурсів, а тільки тих, що зацікавили когось із його клієнтів;
якщо поставкою веб-ресурсів займаються кілька мільйонів постійних клієнтів, індексація веб-простору відбувається набагато швидше.
У свою чергу, користувач теж має важливу перевагу. На якій би веб-сторінці він не перебував, система завжди готова запропонувати йому список інших веб-сторінок з близьким за тематикою змістом. Вона готує цей список на підставі попереднього досвіду, отриманого в роботі з іншими людьми. Так можна одержати рекомендації, які було б дуже важко (а найчастіше неможливо) розшукати у веб традиційними пошуковими засобами.
Прийоми ефективного пошуку
При проведенні первинного реферативного пошуку, коли тема задана досить широко, доцільно використовувати пошукові каталоги. Це дасть змогу швидко встановити місце розташування основних першоджерел. При ознайомленні з першоджерелами слід насамперед приділяти увагу понятійній базі. Знання головних понять і термінів дозволить перейти до поглибленого пошуку в пошукових покажчиках із використанням ключових слів, які найточніше характеризують тему.
При цьому варто розрізняти прийоми:
простого,
розширеного,
контекстного,
спеціального пошуку.
Простий пошук — пошук веб-ресурсів за одним або декількома ключовими словами. Недолік полягає у тому, що зазвичай видається занадто багато документів, серед яких важко вибрати найбільш відповідні.
При використанні розширеного пошуку ключові слова зв'язують між собою операторами логічних відношень. Розширений пошук застосовують у тих випадках, коли прийоми простого пошуку дають занадто багато результатів. За допомогою логічних операторів пошукове завдання формують так, щоб точніше деталізувати завдання й обмежити сферу відбору, наприклад, за датою публікації або типом даних.
Контекстний пошук — це пошук за точною фразою. Він зручний для реферативного пошуку інформації, але доступний не у всіх пошукових системах. Насамперед, щоб забезпечувати таку можливість, система має працювати не лише з індексованими файлами, але й з повноцінними образами веб-сторінок. Ця операція досить повільна.
Спеціальний пошук застосовують при розшукуванні веб-сторінок, що містять посилання на задані адреси URL, ті, які в службових полях містять задані дані, наприклад, у полі заголовка.
Пошукових систем у мережі Інтернет досить багато.
Нижче зазначені лише найпопулярніші:
Google — http://www.google.com.ua;
Meta — http://www.meta.ua;
Excite — http://www.excite.com;
Yahoo — http://www.yahoo.com і приналежні цій компанії пошукові машини: AltaVista — http://www.altavista.com, Alltheweb FAST-Engine — http://www.alltheweb.com, Overture, Inktomi;
MSN (належить компанії Microsoft) — http://www.msn.com;
InfoSeek — http:// www.infoseek.com;
Яндекс — http://www.yandex.ru та ін.