Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Responses.docx
Скачиваний:
16
Добавлен:
14.04.2019
Размер:
1.67 Mб
Скачать
  1. Протоколи ір і tcp

В Internet перебуває величезна кількість користувачів. Для того щоб визначити, кому призначена інформація, кожному користувачу привласнюється спеціальна адреса. Визначені правила роботи Internet називаються протоколами. Так, Іnternet-протокол (Іnternet Protocol - ІP) призначений для адресації, що дозволяє маршрутизатору визначити необхідні дії при надходженні інформації. Іnternet-адреса (ІP-адреса) складається з чотирьох чисел, розділених крапками. Кожне з цих чисел перебуває в діапазоні від 0 до 255.

Оскільки Internet складається з безлічі мереж, то ліва частина адреси показує, до якої ділянки мережі відноситься комп’ютер, а права містить точну вказівку комп’ютера, що повинен одержати інформацію.

Інформація, що пересилається, розбивається на частини, що називаються пакетами. ІP-пакет містить у собі інформацію, обсяг якої не перевищує 1500 байт, а також адреси відправника й одержувача. Розбиття інформації на пакети не дає можливості монополізації мережі одним користувачем. Очевидно, що дуже часто виникає питання, зв’язане з пересиланням обсягів інформації, що перевищують 1500 байт. Для успішного рішення цієї проблеми використовується протокол керування передачею (Transmіssіon Control Protocol - TCP). Він розбиває інформацію на частини, а також нумерує їх. Це дає можливість "зібрати" інформацію в потрібному порядку в кінцевому пункті. У випадку відсутності якого-небудь пакета чи у випадку виникнення сумнівів у його вірогідності буде зроблено запит на повторне пересилання пакета.

Доменна система імен

Як показала практика, користувачам значно зручніше називати машини не за числами, а за іменами. Основним питанням при цьому стає переклад імен в ІP-адреси. Цим перекладом займаються спеціальні програми, установлені на деяких мережних вузлах, що називаються NAMESERVER чи DNS. Ці машини містять бази даних про відповідність імен машин їхнім ІP-адресам. Крім того, потрібно стежити щоб те саме ім’я не було випадково присвоєне двом комп’ютерам.

Якби для всіх машин вибиралися незалежні адреси, кожний DNS повинен був би зберігати інформацію про імена всіх машин, підключених до ІNTERNET, а така база даних мала б дуже великий обсяг. Ще більш важливим є той аспект, що після яких-небудь змін у мережі ці зміни повинні бути відображеними на всіх DNS, що незручно і трудомістко. Для рішення цих проблем уведена доменна система імен, що представляє метод призначення імен шляхом покладання на групи користувачів відповідальності за підмножини імен. У цій системі кожний рівень називається доменом і відокремлюється від інших крапками (наприклад, іnfo.kharkov.com). Перший домен в імені (іnfo) - ім’я реального комп’ютера. Другий (kharkov) - ім’я групи, що створила і курує ім’я комп’ютера, тощо. Кожна група вільна змінювати перебуваючі під її контролем імена.

Якщо всі групи будуть дотримуватися правил та забезпечувати унікальність імен, то ніякі два комп’ютери в Internet не будуть мати однакових імен.

Домени верхнього рівня, такі як com, були створені, коли була винайдена доменна система. Споконвічно існує шість організаційних доменів вищого рівня (див. табл. 5.1).

Таблиця 5.1.

Первинні домени верхнього рівня

Домен

Використання

соm

Комерційні організації

edu

Навчальні заклади

gov

Урядові заклади

mіl

Військові установи

org

Інші організації

net

Мережні ресурси

Коли мережа Internet стала міжнародною, виникла необхідність надати всім країнам можливість контролю за іменами систем, що знаходяться в них. З цією метою був створений набір двобуквених доменів, що відповідають доменам вищого рівня для цих країн. Наприклад, са - код Канади.

Щоб перетворити ім’я на адресу, комп’ютер звертається до серверів DNS. починаючи з правої частини імені і рухаючись вліво. Спочатку він просить локальні сервери DNS знайти адресу. Тут існує три можливості:

  • локальний сервер знає адресу, тому що ця адреса перебуває в тій частині всесвітньої бази даних, що курує даний сервер;

  • локальний сервер знає адресу, тому що хтось недавно вже запитував про неї. Коли хто-небудь запитує про адресу, сервер DNS якийсь час пам’ятає її на той випадок, якщо трохи пізніше про неї запитає ще хто-небудь. Це значно підвищує ефективність роботи системи;

  • локальний сервер не знає адреси, але знає, як її визначити.

Адреса визначається в такий спосіб. Програмне забезпечення локального сервера знає, як зв’язатися з кореневим сервером, який знає адреси серверів імен доменів вищого рівня (крайньої правої частини імені, наприклад, com). Сервер запитує в кореневого сервера адресу комп’ютера, що відповідає за домен com. Одержавши інформацію, він зв’язується з цим комп’ютером і запитує в нього адресу сервера kharkov тощо.

25. World Wide Web. Навігація в WWW за допомогою Internet Explorer. Передача файлів за допомогою FTP. Електронна пошта: програмне забезпечення електронної пошти; система адрес; протоколи пересилання пошти; створення, відправлення, отримання, перегляд повідомлень; відправлення та отримання файлів; захист повідомлень.

WWW (World Wide Web) — распределенная система, предоставляющая доступ к связанным между собой документам, расположенным на различных компьютерах, подключенных к Интернету. Всемирную паутину образуют миллионы web-серверов. Большинство ресурсов всемирной паутины представляет собой гипертекст. Гипертекстовые документы, размещаемые во всемирной паутине, называются web-страницами. Несколько web-страниц, объединенных общей темой, дизайном, а также связанных между собой ссылками и обычно находящихся на одном и том же web-сервере, называются web-сайтом.

FTP (англ. File Transfer Protocol — протокол передачи файлов) — протокол, предназначенный для передачи файлов в компьютерных сетях. FTP позволяет подключаться к серверам FTP, просматривать содержимое каталогов и загружать файлы с сервера или на сервер; кроме того, возможен режим передачи файлов между серверами (см. FXP).

FTP является одним из старейших прикладных протоколов, появившимся задолго до HTTP, в 1971 году. Он и сегодня широко используется для распространения ПО и доступа к удалённым хостам. Протокол FTP относится к протоколам прикладного уровня и для передачи данных использует транспортный протокол TCP. Команды и данные, в отличие от большинства других протоколов, передаются по разным портам. Исходящий порт 20, открываемый на стороне сервера, используется для передачи данных, порт 21 для передачи команд. Порт для приема данных клиентом определяется в диалоге согласования. В случае, если передача файла была прервана по каким-либо причинам, протокол предусматривает средства для докачки файла, что бывает очень удобно при передаче больших файлов.

Електронна пошта - є одним із основних і найпопулярніших сервісів у комп'ютерних мережах. Програму електронної пошти первісно було створено для передавання текстових повідомлень, але завдяки зручності цього сервісу виникла потреба в розширенні його функціоналних можливостей. З повідомленнями електронної пошти можна передавати не лише текст, але й вкладення, якими можуть бути майже будь-які файли (фактично обмеження накладаються лише на розмір вкладень). У корпоративних мережах система електронної пошти забезпечує переважно внутрішній та зовнішній обмін інформацією. Але у багатьох випадках функції цього сервісу є набагато більшими. Електронну пошту можна використовувати, як компонент системи документообігу і як транспортний протокол корпоративних застосувань або як засіб утворення інфраструктури електронної комерції. Щоб мати змогу користуватися електронною поштою, необхідно створити на певному сервері поштову скриньку, яка здебільшого реалізується у вигляді одного великиго текстового файлу (поштового файлу). Доставлення повідомлення користувачу полягає у дописуванні цього повідомлення в кінець файлу. для того щоб прочитати повідомлення, користуачу необхідно застосувати спеціальне програмне забезпечення. Головною проблемою в реалізації системи електронної пошти є доставлення повідомлень, яке передбачає модифікацію файлу користувача - одержувача повідомлення. Відправлення повідомлень і їх передавання мережею може бути здійснене за різними протоколами, але найчастіше використовують SMTP (Smple Mail Transfer Protocol - простий протокол передавання пошти). Цей протокол реалізують поштові SMTP-серевери. Як альтернативу можна назвати протокол UUCP. Функціонально програма Sendmail складається з троьох відокремлених компонентів:

  • агент користувача - дає змогу користувачу формувати повідомлення для відправлення і декодувати отримані повідомлення, які знаходяться у поштовій скринці;

  • агент пересилання - відповідає за приймання і пересилання кореспонденції з одного поштового сервера на інший;

  • агент доставляння - керує поштовою скринькою користувача, додаючи до неї повідомлення що надходять.

Найголовнішим компонентам системи електронної пошти є агент пересилання. Функції інших компонентів можуть виконувати сторонні програми. В ролі агента переселання замість Sendmail можна також використовувати інші програми всі вони мають спільну назву агенти пересилання пошти (Mail Transer Agents, MTA). В електронній пошті є і інший підхід. Користувач застосовує спеціальну програму - поштового клієнта, що здійснює доступ до сервера за спеціальними протоколами читання електронної пошти, серед яких найпопулярніші POP3 ( Post Office Protocol) та IMAP (Internet Mail Access Protocol). У цьому випадку може бути реалізований одни з таких сценаріїв:

  • користувач забирає з сервера всю пошту, а потім сортує, обробляє та зберігає її на своєму клієнтському коп'ютері;

  • користувач сортує, обробляє, зберігає свою пошту на сервері, а його програма-клієнт лише здійснює керування.

Протокол POP3 призначений для реалізації першого сценарію, IMAP для другого. В переселанні та доставлянні електронної пошти ключову роль відіграють програми-агенти, спілкування з якими (і їх спілкування між собою) здійснюється за протоколом SMTP. Даний протокол передбачає дуже просту ідентифікацію і не передбачає автентифікації. Тобто, агенти пересилання пошти фактично не перевіряють, хто цю пошту передає. На час створення протоколу це видавалося прийнятним, оскільки, протокол SMTP передбачає саме передавання пошти і тому спроби неавторизованого доступу за цим протоколом ніяк не порушують конфеденцйності та цілісності даних. Але з розвитком Інтернету почали з'являтися проблеми:

  • засмічення електронної пошти некорисними і небажаними повідомленнями;

  • розсилання повідомлень, що містять шкідливі програми;

  • відправлення повідомлень від інших користувачів.

Захистити повідомлення можна за допомогою шифрування.

На даний момент найпопулярнішими службами Інтернету є:

  • Веб

    • Веб-форуми

Веб-форум — це клас веб-застосунків для організації спілкування відвідувачів веб-сайту

    • Блоги

Блог — це веб-сайт, головний зміст якого — записи, зображення чи мультимедіа, що регулярно додаються. Для блогів характерні короткі записи тимчасової значущості.

    • Вікі-проекти (в тому числі й Вікіпедія)

    • Інтернет-магазини

Інтернет-магазин — місце в інтернеті, де відбувається прямий продаж товарів споживачеві, враховуючи доставку. 

    • Інтернет-аукціони

    • Інтернет події

    • Інтернет-час

  • Електронна пошта та списки розсилки

Електро́нна по́шта — популярний сервіс в інтернеті, що робить можливим обмін даними будь-якого змісту (текстові документиаудіо-відео файлиархівипрограми).

  • Групи новин (в основному, Usenet)

  • Файлообмінні мережі

Файлообмінна мережа — сукупна назва мереж для сумісного використання файлів.

  • Електронні платіжні системи

  • Інтернет-радіо

  • Інтернет-телебачення

  • IP-телефонія

  • Системи обміну повідомленнями

  • FTP-сервери

  • IRC

Платіжна система в Інтернет - система здійснення розрахунків між фінансовими установами, бізнес-організаціями та Інтернет-користувачами в процесі купівлі-продажу товарів і послуг через Інтернет.

Електронні гроші - це черговий етап на шляху удосконалення платіжних систем, що вже пройшли значний шлях від готівкового золота, металевих монет і паперових банкнот до безготівкових розрахунків і пластикових карток.

Під терміном "електронні гроші" (цифрові гроші, цифрова готівка в електронній формі, гроші Інтернету) розуміють грошову вартість, яка зберігається в електронному вигляді на технічному пристрої і може використовуватися для здійснення платежів.

В українському секторі Інтернету, який часто називають Рунетом, є більше десятка різних систем, що дозволяють перераховувати гроші за товари в онлайновому режимі. Із списками цих систем і їх описом можна познайомитися на сайтах Money.ru і Magazin.ru. Ці системи можна розділити на декілька типів:

  • для платежів по пластикових картах (ППК) міжнародних систем Visa, Eurocard/Mastercard, American Express тощо.;

  • для платежів з призначених для користувача рахунків провайдерів;

  • для платежів з використанням "електронного гаманця";

  • для платежів по смарт-картках.

Найбільш популярною системою першого типу є Assist-CyberPlat. 1. Покупець через Інтернет підключається до Web-сервера магазина, формує корзину товарів і направляє магазину запит на виставляння рахунку.

2. Магазин у відповідь на запит покупця направляє йому завірений своїм електронним цифровим підписом (ЕЦП) рахунок, в якому указує найменування товару (послуги), код магазина, час і дату здійснення операції. З цивільно-правової точки зору цей рахунок є пропозицією укласти договір (офертом).

3. Покупець завіряє своїй ЕЦП пред’явлений йому рахунок і відправляє його назад в магазин, здійснюючи тим самим акцепт. Договір вважається укладеним з моменту підписання покупцем виставленого йому рахунку. У системі рахунок, підписаний покупцем, стає чеком.

4. Підписаний двома ЕЦП (магазина і покупця) чек прямує магазином в Банк для авторизації.

5. Банк проводить обробку підписаного чека: перевіряє наявність в системі магазина і покупця, перевіряє ЕЦП покупця і магазина, перевіряє залишок і ліміти засобів на рахунку покупця, зберігає копію чека в базі даних банку.

Діяльність систем з використанням "електронного гаманця" базується на застосуванні спеціального програмного забезпечення, що зберігає віртуальні гроші.

Іншим варіантом розрахунку є оплата за кредитною карткою.

Смарт-карта також є новим видом носія інформації, заснованим на мікропроцесорній електроніці. Для розрахунків по смарт-картах власникові карти необхідно ввести особистий код (PIN-код).

27. Можливості пошуку суб’єктів у Інтернет. Інтерактивні пошукові служби Інтернет. Головні концепції WWW. Області застосування WWW. Базові поняття WWW. Браузери: типи браузерів; загальна характеристика, можливості та базові команди браузерів. Інформаційний пошук, інформаційно-пошукові системи. Пошукові ресурси WWW.

.Можливості пошуку суб’єктів у Інтернет. Інтерактивні пошукові служби Ін-тернет.

. Головні концепції WWW. Області застосування WWW. Базові поняття WWW.

Всесві́тня павути́на (англ. World Wide Web, скорочено: WWW; також: всемережжя, веб або тене́та) — найбільше всесвітнє багатомовне сховище інформації в електронному вигляді: десятки мільйонів пов'язаних між собою документів, що розташовані на комп'ютерах, розміщених на всій земній кулі. Вважається найпопулярнішою і найцікавішою службою мережі Інтернет, яка дозволяє отримувати доступ до інформації незалежно від місця її розташування.

Основні особливості

В наш час, найбільш бурхливо прогресуюча компонента мережі Інтернет. Користувачі автоматично переходять від однієї бази даних (сайту) до іншої за допомогою гіперпосилань. Кількість серверів WWW постійно зростає, а швидкість росту WWW навіть більша ніж у самої мережі Internet. WWW – найрозвиненіша технологія Internet, вона вже стала масовою. Перспективи розвитку – необмежені.

WWW – інформаційна система, якій не можна дати конкретного визначення. Наведемо лише деякі з епітетів, якими вона може бути позначена: гіпертекстова, гіпермедійна, розподілена, інтегруюча, глобальна. Нижче буде показано, що слід розуміти під кожною з цих властивостей у контексті WWW.

Принцип роботи

WWW працює за принципом клієнт-сервер: існує велика кількість серверів, які за запитом клієнта надають йому гіпермедійний документ. Такий документ складається із частин з різним представленням інформації (текст, графіка, звук, відео, тривимірні об’єкти тощо). В ньому кожен елемент може бути посиланням на інший документ чи його частину. Такі посилання в WWW організовані так, що кожний інформаційний ресурс в глобальній мережі Internet однозначно адресується, а надісланий сервером документ може посилатися на інші документи на цьому ж сервері, чи на документи на інших комп’ютерах Internet. При цьому користувач не помічає цього і працює з усім інформаційним простором Internet, як з єдиним цілим. Посилання WWW вказують не тільки на документи, специфічні для самої WWW, але й на інші сервіси і інформаційні ресурси Internet. Більш того, більшість програм клієнтів WWW (браузер) не просто розуміють такі посилання, а є додатково програмами-клієнтами відповідних сервісів: FTP, Gopher, новин мережі Usenet, електронної пошти і т. і. Таким чином, програмні засоби WWW — універсальні для різних сервісів Internet, а сама інформаційна система WWW грає інтегруючу роль.

Основні вживані терміни Всесвітньої павутини

Наведемо роз’яснення деяких термінів, які використовуються в WWW. HTML (hyper text markup language, мова розмітки гіпертексту). Це формат гіпермедійних документів, які використовують в WWW для представлення інформації. Цей формат описує вміст документу, його структуру, а також його зв’язки з іншими документами. Зовнішній вигляд документа на екрані користувача визначається навігатором — якщо користувач працює за графічним або текстовим терміналом, у кожному випадку документ на екрані матиме різний вигляд. HTML виконує інтегруючу роль для елементів гіпермедійного документа. Імена файлів у форматі html, як правило, закінчуються на html (або мають розширення htm у випадку, якщо сервер працює під Windows). URL (uniform resource locator, універсальний вказівник на ресурс). Таку назву носять словесні посилання на будь-які інформаційні ресурси Internet. До ресурсів Internet можна отримувати доступ і за IP-адресою певного комп'ютера. HTTP (hypertext transfer protocol, протокол передачі гіпертексту). Таку назву носить протокол, за яким взаємодіють клієнт та сервер WWW для передавання гіпермедійного документа клієнту.

WWW — сервіс прямого доступу, який потребує повноцінного підключення до Internet. Він вимагає швидких ліній зв’язку для документів, що містять багато графічної або іншої нетекстової інформації. Коли швидкості нижчі, втрачається частина переваг, які зробили WWW таким популярним.

Проблеми та майбутній розвиток

Практично будь-яка інформація, яка подається для публічного доступу може бути відображена засобами WWW. Якщо ж щось не може бути відображене в WWW, то це зумовлене лише деякими обмеженнями та недоліками WWW. По-перше, з’єднання між клієнтом і сервером одноразове: клієнт посилає запит, сервер видає документ, і зв’язок переривається. Це означає, що сервер не має механізму сповіщення клієнта про зміну або надходження нових даних. Ця проблема сьогодні вирішується декількома способами: розробляється нова версія протоколу http, яка дасть змогу підтримувати тривале з’єднання, передачу даних у декілька потоків, розподіл каналів передачі даних та управління ними. Якщо вона буде реалізована і буде підтримуватися стандартним програмним забезпеченням WWW, то це зніме вищезгадані недоліки. Інший шлях – використання навігаторів, які зможуть локально виконувати програми на інтерпретованих мовах, як, наприклад, проект Java компанії Sun Microsystems. Інший варіант розв'язку цієї проблеми — використання технології AJAX, на основі XML та Javascript. Це дає змогу доотримувати дані з сервера тоді, коли сторінка WWW вже завантажена з сервера.

. Браузери: типи браузерів; загальна характеристика, можливості та базові команди браузерів.

Поняття веб-браузера

Браузер - це програма, що представляє в зручному для сприйняття вигляді інформацію, що отримується з Інтернету. Це інструмент для перегляду ресурсів Мережі і, в меншій мірі, для взаємодії з ними.

Втім, говорити про те, що браузер потрібен тільки в Інтернеті, було б невірно. У наш час на технологіях Інтернету грунтуються багато локальних мереж, так звані інтранети або інтрамережі. Вони можуть і не мати виходу в Інтернет.

Слово "браузер" походить від англійського слова browse, що означає "гортати" (це слово можна побачити на кнопках у діалогових вікнах англомовних програм). Цю назву програма отримала за кордоном ще до виникнення системи World Wide Web в той час, коли, крім тексту, переглядати в Мережі було нічого, і користувачі "гортали" текстові файли на екранах комп'ютерів.

Зараз Інтернет пропонує нам дивовижне розмаїття інформації - текст, графіку, анімацію, відео, звук, і все ми бачимо і чуємо завдяки браузеру.

Інформація, яку брaузер передає на сервер в якості запиту і яку отримує від нього у відповідь, передається, як правило, по протоколу HTTP.

Web-сторінки, які користувач бачить на екрані, блискучі різноманіттям кольорів і форм представлених на них об'єктів, насправді являють собою всього лише текстові файли, в яких містяться певні інструкції. Ці інструкції вказують браузеру, що і як слід показувати на даній сторінці. У найпростішому випадку вихідний текст Web-сторінки пишеться на мові HTML. Внаслідок своєї складної історії мова HTML неоднозначно трактується різними браузерами. Та й самі браузери можуть призначатися для різних цілей. У результаті в різних браузерах одні й ті ж сторінки можуть виглядати по-різному.

Виділяють такі види браузерів:

  • браузер режиму командного рядка. До цього типу відносяться самі ранні браузери. Вони не дають можливості переглядати текст і графіку. Такі браузери підтримують переміщення тільки з використанням цифрових адрес (IP). В даний час практично не використовуються.

  • повноекранний браузер. Текстовий браузер без підтримки мультимедійних (картинки, анімація і т.п.) ресурсів мережі Інтернет. За допомогою нього користувач може переглядати тільки текст і посилання.

  • браузер з підтримкою мультимедіа. Найпоширеніші і найпопулярніші браузери на сьогодні. Дозволяють працювати практично з усіма видами інформації, представленої в Інтернеті.

  • браузери-додатки. Вони є надбудовами над повнофункціональними браузерами. Найчастіше розробниками додатків використовується Internet Explorer. Додатки всього лише змінюють інтерфейс і додають деякі функції, на які розробники з Microsoft не звернули уваги.

Також виділяють офлайн браузери. Це програми, які автоматично завантажують інформацію з Інтернету і зберігають її на локальному диску комп'ютера для подальшого перегляду та аналізу. Ідея, що лежить в основі роботи офлайн браузерів, досить проста. Користувач вказує адресу потрібного йому Web-сайту, а програма у відповідь завантажує на його комп'ютер всі файли, які необхідні для автономного (тобто відключившись від Internet) перегляду цього сайту. Перевагами такого способу роботи є - плата в автономному режимі за Internet, така сама як і за телефонну лінію (для модемного з'єднання) не потрібна, інформація з жорсткого диска завантажується дуже швидко, а локальна копія сайту повністю "оглядова" - зберігається структура і взаємозв'язок HTML - документів. Веб-переглядач дозволяє користувачеві швидко та просто отримувати інформацію, розміщену на багатьох веб-сторінках.

Типи web-браузерів

Internet Explorer

Microsoft Internet Explorer — графічний веб-оглядач (браузер), який розробляє корпорація Microsoft.

Найперша версія побачила світ 16 серпня 1995 року. Вона була заснована на браузері Mosaic, права на який корпорація Microsoft придбала у компанії Spyglass. Починаючи з версії 3.0, Microsoft поширювала Internet Explorer у складі операційної системи Windows, що дозволило йому швидко збільшити ринкову частку і навіть витіснити провідний колись веб-оглядач Netscape Navigator.

Останніми версіями для Mac OS і Unix-подібних систем були Internet Explorer 5.2.3 і Internet Explorer 5.0 SP1 Beta відповідно. Зараз розробку Internet Explorer для цих систем припинено.

Серед сучасних браузерів IE відрізняється найгіршою підтримкою CSS2, неповною підтримкою XHTML і безліччю проблем із безпекою. До виходу сьомої версії мав застарілий незручний інтерфейс.

Internet Explorer можна безкоштовно завантажити і використовувати навіть на нелегальній копії Microsoft Windows, проте ліцензійна угода дозволяє встановлювати Internet Explorer лише за наявності легальної ліцензії на операційну систему сімейства Windows.

На 2011 рік є найпопулярнішим браузером, охоплюючи близько 40% ринку, але кількість користувачів Internet Explorer стабільно знижується. Internet Explorer є найуживанішим web-браузером починаючи з 1999 року, досягнувши в 2002—2003 роках за цим показником своєї максимальної позначки в 95%; у Південній Кореї у 2007—2008 роках частка IE складала 99%. Цей показник було досягнуто внаслідок стандартизації протоколу шифрування, реалізованого лише у вигляді готових модулів, які видають громадянам (ActiveX і Nsplugin, останні більше не видаються).

Opera

Opera (Опера) — веб-оглядач та програмний пакет для роботи з Інтернетом. Розробляється норвезькою компанією Opera Software.

Браузер Opera було розроблено в 1994 році компанією Opera Software, розташованою в Осло, Норвегія. Він працює в багатьох операційних системах, таких як: Microsoft Windows, Mac і Linux. Версія Opera Mini є найпопулярнішим оглядачем для мобільних телефонів, смартфонів і КПК (кишенькових персональних комп'ютерів).

Opera безкоштовний для персональних комп'ютерів. Міжнародна версія браузера має багатомовний інтерфейс, включаючи український.

За популярністю в Україні Opera станом на 2009 займав близько 25-30% ринку і був другим браузером, поступаючись лише IE. На березень 2011 року Opera з долею 36% є першою в Україні, випереджаючи IE та Firefox (приблизно 33%). В той же час світова доля Opera за різними оцінками — від 1% до 3.5%

Можливості програми

Компанія Opera Software позиціонує свій переглядач Opera як «найшвидший браузер на Землі» («the fastest browser on Earth»). Незалежні перевірки показали, що Opera 9.01 швидше інших браузерів в чотирьох тестах із семи на Microsoft Windows і Mac OS X і в трьох з семи на Linux. Найсильнішою стороною Opera є робота зі сценаріями JavaScript, приблизно вдвічі швидше ніж в інших браузерах. Крім того, Opera починає відображати вміст сторінки до повної її завантаження, що також заощаджує час користувача, особливо при повільному з'єднанні та великій кількості впроваджених об'єктів.

В Opera встроєний TDI-інтерфейс, що настроює блокування виринаючих вікон. Є захист від шахрайства, менеджер завантажень, BitTorrent-клієнт, меню пошуку, RSS-агрегатор. Також в пакет входить поштовий клієнт Opera Mail і клієнт для IRC-мереж.

Однією з особливостей браузера є можливість швидкого переходу до найчастіше відвідуваних веб-сторінок (Speed Dial — «швидкий набір» або «експрес-панель»). Користувач може задати адреси веб-сторінок в дев'яти слотах, і після відкриття порожньої вкладки на ній будуть відображені за замовчуванням 9 (3 × 3) віконець, у кожному з яких буде зменшена копія заданої сторінки. Ця опція значно полегшує навігацію між веб-сайтами. Настроїти кількість сайтів в Speed Dial можна починаючи з версії 9.5, змінивши speeddial.ini в папці профілю. А починаючи з версії 10.0 beta ця опція доступна в інтерфейсі браузера.

Opera підтримує так звані віджети (Opera Widgets) — маленькі веб-застосунки, які можна запустити з браузера. Серед інших існує «User JavaScript», діалект скриптової мови, що дозволяє користувачеві редагувати скрипти на веб-сторінках і додавати нові. Готові скрипти можна завантажити на сайті UserJS.org, з іншої адреси: Userscripts.org можна завантажити аналогічні скрипти для Greasemonkey, більшість з яких можна використовувати і в Opera. Третій спосіб розширення можливостей браузера — підключення плагінів, які змінюють зовнішній вигляд браузера або додавати до нього нові функції. В той же час, використання плагінів обмежена. Можна підключати тільки плагіни, схвалені і розповсюджувані Opera Software, тоді як у деяких інших браузерах є можливість встановлювати плагіни будь-яких розробників.

Управління та інтерфейс

У браузері Opera передбачені засоби керування для людей з порушеннями зору або обмеженими руховими можливостями: є голосове управління і можливість підключення «екранних дикторів». За допомогою різних установок користувач може налаштувати інтерфейс за своїм смаком.

Є можливість здійснювати навігацію і налаштування браузера, використовуючи тільки клавіатуру. «Гарячі клавіші», задані за замовчуванням, можна переозначувати на свій розсуд. Можна також використовувати «жести мишею», які істотно спрощують навігацію за допомогою цього маніпулятора, певні послідовності натиснення клавіш і рухів «миші» дозволяють, наприклад, швидко гортати або оновлювати сторінки, не переміщує курсор до іконки меню навігації.

Масштабування сторінок дозволяє пропорційно збільшувати або зменшувати всі елементи документа: текст, зображення, флеш-анімацію, створюючи ефект наближення і віддалення сторінки. Масштаб можна змінювати в межах від 20% до 1000%. Користувач може налаштувати шрифти та кольори для веб-сторінок, і навіть подолати налаштування стилів CSS. Це може бути корисним, наприклад, для сторінок з невдалим дизайном: коли шрифти важкочитаємі або контраст між кольором шрифту і фоном недостатній.

Голосове управління, розроблений спільно з IBM, дозволяє користуватися браузером без допомоги миші та клавіатури. Opera також може читати вголос сторінки і виділені фрагменти, але це можливо тільки в середовищі Microsoft Windows і тільки за допомогою екранного диктора, вбудованого в браузер, так як програми сторонніх розробників, починаючи з версії Opera 6.0, не підтримуються.

Безпека та конфіденційність

У Opera є кілька установок безпеки, доступних користувачеві. Одна з них — можливість швидкого видалення інформації про відвіданих сторінках: очистка cookies, історії, кеша. Це корисно, якщо за комп'ютером по черзі працюють кілька користувачів.

При відвідуванні захищених сторінок, Opera кодує одержану і передану інформацію, за допомогою протоколів високої надійності: 3 SSL або TLS. Інформація про включення захисту відображається в адресному рядку браузера. Користувач може натиснути на кнопку яка з'явилася там і перевірити, чи не є сторінка шахрайською або створеною для «фішингу». Користувач може включити автоматичну перевірку сторінок на «фішинг», але за замовчуванням ця опція не активна.

Для захисту збережених паролів можливо шифрування бази даних паролів використовуючи алгоритм 3DES та майстер паролів в якості ключа шифрування, яким також захищені особисті сертифікати та дані wand.

Для своєчасного виявлення вразливостей і відлову багів в програмі є можливість відправки повідомлень про помилки в Opera Software. За даними компанії Secunia, що спеціалізується на комп'ютерній і мережевій безпеці, в Opera 9.x було виявлено 13 вразливостей, всі вони до цього часу усунуті. Для порівняння, в Firefox 2.0.x було виявлено 23 вразливості, з яких до сих пір не усунені 4, в Internet Explorer 7.x залишаються незакритих 8 з 24, а в Safari 3.x одна з трьох знайдених вразливостей.

Група Arche Twist випускає комплект програмного забезпечення OperaTor, призначеного для анонімного серфінгу в Інтернеті. До нього входить браузер Opera, клієнт анонімної мережі Tor і віртуальний проксі-сервер Polipo. Анонімізується робота по протоколах HTTP і HTTPS.

Mozilla Firefox

Браузер Mozilla Firefox , відомий раніше як Firebird і Phoenix, - займає друге місце в світі по популярності, а також першим браузером з доступним початковим кодом.

Відразу після виходу 9 листопада 2001 року версії 1.0 браузер отримав визнання в таких видань, як "Форбс" і "The Wall Street Journal". За перші 99 днів Firefox вивантажили 25 мільйонів разів. Завдяки цьому він став однією з найпопулярніших програм з відкритим кодом, особливо в домашніх користувачів. А через 344 дні, після виходу його першої версії 1.0, число завантажень перевищило стомільйонну відмітку.

У липні 2007 року браузер Firefox застосовують 28 % європейських користувачів. За даними компанії Net Applications в грудні 2007 року ринкова частка Firefox складала 16,80 %. А вже у березні 2009 року За даними компанії Net Applications ринкова частка Firefox складала понад 18,8 %

Firefox оптимізовано для: Windows, FREEBSD, OS/2, Mac OS X, а також і для інших операційних систем.

Особливості браузера Mozilla Firefox:

· невеликий розмір установчого файлу;

· підтримка великої кількості розширень;

· можливість автоматичного оновлення;

· налаштування зовнішнього вигляду і загальної роботи програми;

· наявність, інтегрованих в закладки RSS потоків;

· наявність вбудованої панелі пошуку по пошукових машинах;

· наявність веб-редактора сторінок.

У стандартному варіанті дистрибутиву Firefox присутнім є лише один інструмент для веб-дизайнера. Програма DOM шукає і вказує рядок, в якому присутня синтаксична помилка. Але є спеціальні plugin-и, які додають до браузеру решту доповнень: View Source Chart - плагін для перегляду і сортування початкового коду HTML; JSView - плагін для проглядання файлів, сторінки, що знаходяться за межами; HTMLValidator - перевірка коду на відповідність стандартам W3C.

Недоліки браузера Mozilla Firefox

Браузер Firefox вимагає великої кількості пам’яті, це суттєво помічається при тривалій роботі в програмі.

Можливості Mozilla Firefox

  • Швидке завантаження файлів. Після завантаження файлів з Інтернету вони автоматично зберігаються на робочому столі, тим самим, спрощуючи подальшу роботу з ними.

  • Блокування спливаючих вікон. При заходженні на будь-який сайт спливаючі вікна вже не заважатимуть. Користувач сам вирішує, які вікна відкривати.

  • Пошук. Поряд з адресним рядком розташована панель пошуку, з її допомогою можна виконувати пошук інформації в світових пошукових системах.

  • Закладки RSS. Браузер Firefox підтримує технологію RSS. Якщо зробити спеціальну закладку з даних, що отримані з RSS-потоків, то можна бути в курсі всіх подій, що відбуваються в світі.

  • Зрозумілий інтерфейс. Firefox містить всі необхідні засоби і кнопки, що є необхідними для комфортної роботи в Інтернет. Тут присутнє все необхідне: історія відвідин, закладки та інші необхідні засоби.

  • Доповненість. До стандартного складу функцій браузера можна підключати нові плагіни, які у великій кількості є доступними для вільного вивантаження з мережі Інтернет. Панель інструментів надається до ретельного налаштування, її можна набудувати відповідно до вимог користувача. При використанні більшості плагінів можна із звичайного і простого браузера зробити хороший багатозадачний інструмент для роботи з Інтернет.

Safari

Четвертий за популярністю браузер серед користувачів всього світу, його частка на світовому ринку близько 5%. Браузер Safari - розробка корпорації Apple. Входить у комплектацію Mac OS X, а для операційних систем сімейства Windows розповсюджується безкоштовно. Розробники стверджують, що Apple Safari останньої версії 4.0.5. є найшвидшим браузером в світі, серед працюючих на платформі Windows за частиною завантаження веб-сторінок і обробки скриптів. Треба відзначити, що багато незалежних експертів вважають вказані заяви розробників дещо перебільшеними. У Safari інтегровані мультимедійні технології QuickTime, вбудовані засоби пошуку в Google і Yahoo. Браузер оснащений функціями блокування спливаючих вікон, використання вкладок, автозаповнення, пошуку фрагмента тексту на сторінці. Safari підтримує різні протоколи шифрування, відмінно проходить тести підтримки веб-стандартів Acid2 і Acid3.

Safari 5

Apple випустила Safari 5 7 червня 2010. В новій версії можна побачити новий Safari Reader для читання статей в Інтернеті без відволікання (на основі, зокрема, на інструменту Arc90), JavaScript на 30 відсотків продуктивніший в порівнянні з Safari 4, і додана пошукова система Bing. Доступний для Mac і Windows, Safari 5 включає в себе вдосконалені засоби розробки і підтримує більше десятка нових технологій HTML5, зосереджених на сумісності. За допомогою Safari 5, розробники тепер можуть створювати безпечні розширення Safari для налаштовування і підвищення їхньої комфортності. Apple в цьому випуску також повторно додала в адресному рядку індикатор для відстежування місця. Apple випустила Safari 4.1 одночасно з Safari 5, спеціально для Mac OS X Tiger. Оновлення включає в себе більшість функцій і зміцненню безпеки в Safari знайшли 5. Однак вона не включає Safari Reader або Safari Extensions.

Основні можливості:

· режим пошуку слів на сторінці;

· використання вкладок (дозволяє відкривати в одному вікні відразу по кілька веб-сторінок і вільно переключатися між ними);

· вбудовані засоби пошуку: Google, Yahoo! і Bing в Mac OS X і Windows;

· можливість блокування спливаючих вікон;

· зручний і простий пошук фрагмента тексту на сторінці;

· автозаповнення форм (синхронізація з адресними книгами Mac OS X і MS Windows);

· вбудований RSS-агрегатор;

· масштабування області введення тексту;

· приватний перегляд - режим, при якому не ведеться історія відвідувань, cookie не приймаються, паролі і дані, що вводяться не запам'ятовуються;

· підтримка різних протоколів шифрування;

· функція "Snapback" - дозволяє миттєво повернутися до вихідних результатів пошуку або до верхнього рівня будь-якого веб-сайту, навіть якщо ви пішли на кілька рівнів вниз. Значок SnapBack з'являється в полі пошуку при натисканні на посилання на сторінці результатів пошуку;

· у "Safari" використовуються ті ж технології Apple для роботи з графікою, що і в Mac OS X;

· попередня підтримка CSS3 і HTML 5;

· "Safari" автоматично розпізнає веб-сайти, що використовують нестандартні шрифти, і завантажує їх у міру необхідності;

· інтеграція мультимедійних технологій QuickTime;

· Web Inspector - дозволяє користувачам і розробникам переглядати Document Object Model (DOM) веб-сторінок;

· підтримка протоколів SSL версій 2 і 3, а також Transport Layer Security (TLS);

· перевірка орфографії в текстових полях;

· Top Site - дозволяє переглядати список найбільш відвідуваних веб-сайтів у вигляді мініатюрних сторінок

Google Chrome

Порівняно недавно з’явився браузер від компанії Google впевнено займаючий третій рядок п’єдесталу популярності - число його користувачів по всьому світу постійно зростає, а до лютого 2010 року досягла 5,61%. Особливістю даного браузера є те, що кожна вкладка в Chrome - це окремий процес, і навіть якщо цей процес "зависне", то він може бути завершений без втрати даних в інших вкладках. Спочатку браузер був випущений для роботи на операційній системі Windows, але в наприкінці 2009 року з’явилися версії для операційних систем Linux і Mac. Поточна версія Google Chrome 4.0.249.89 в повному обсязі проходить тести підтримки веб-стандартів Acid2 і Acid3. Двигун V8, який використовується для обробки сценаріїв JavaScript, дозволяє розвивати досить високу швидкість.

Однією з відмінних рис Chrome є сторінка швидкого доступу, яка може заміняти домашню сторінку і відкривається при створенні нової вкладки. На сторінці швидкого доступу міститься 8 найбільш відвідуваних веб-сайтів (відображаються у вигляді маленьких знімків веб-сторінок), нещодавно закриті вкладки, поради з використання Chrome і синхронізація закладок. За бажанням користувач може змінити зовнішній вигляд сторінки, додавши або видаливши одну з опцій.

. Інформаційний пошук, інформаційно-пошукові системи. Пошукові ресурси WWW.

Інформаційний пошук (ІП) (англ. Information retrieval) — наука про пошук неструктурованої документальної інформації. Особливо це відноситься до пошуку інформації в документах, пошук самих документів, добуття метаданих з документів, пошуку тексту, зображень, відео та звуку у локальних реляційних базах даних, у гіпертекстових базах даних таких, як Інтернет та локальні інтранет. Інформаційний пошук — велика міждисциплінарна область науки, яка стоїть на перетині когнітивної психології, інформатики, інформаційного дизайну, лінгвістики, семіотики, бібліотечної справи, та статистики.

Автоматичні системи інформаційного пошуку використовують для зменшення так званого «інформаційного перевантаження». Багато університетів та публічних бібліотек використовують системи ІП для полегшення доступу до книжок, журналів та інших документів. Найвідомішим прикладом систем ІП можна назвати пошукові системи в Інтернеті.

Об’єктом інформаційного пошуку є текстова інформація, зображення, аудіо, відео інформація.

З інформаційним пошуком змикаються проблеми:

  • розсилки інформації (information routing);

  • сортування інформації (information filtering);

  • упорядкування (класифікація) інформації (information categorization);

  • відбір інформації (information extraction).

Для інформаційного пошуку розробляють:

  • алгоритми інформаційного пошуку (retrieval algorithms);

  • підходи інформаційного пошуку(retrieval approaches);

  • стратегії інформаційного пошуку (retrieval strategies).

Для його здійснення створюють:

  • методи інформаційного пошуку (retrieval utilities);

  • засоби інформаційного пошуку (information retrieval systems);

  • комп’ютерні пошукові програми (search engines).

До проблем інформаційного пошуку належать питання:

  • представлення даних, інформації, знань (data, information, knowledge);

  • представлення інформації в сучасних інформаційних сховищах (representation of information);

  • багатомовний інформаційний пошук (cross-language information retrieval);

  • одночасний інформаційний пошук (parallel information retrieval);

  • розподілений інформаційний пошук (distributed information retrieval);

  • суспільний інформаційний пошук (social information retrieval)

Напрям інформаційний пошук відносять до проблем:

  • застосовної (прикладної) лінгвістики (applied linguistics);

  • обробки природної мови (natural language processing);

Завданням інформаційного пошуку є знаходження відповідних (до пошукового запиту) інформаційних об’єктів, або документів серед доступного для пошуку матеріалу. Завдання для інформаційного пошуку задається у вигляді інформаційного запиту (query), який може містити слова, фрази чи речення або комбінацію їх. Переважна більшість пошукових систем орієнтована на роботу з пошуковими термінами — словами або словосполученнями, які пошукова система розпізнає як одне ціле. Для здійснення інформаційного пошуку потрібно мати збірку інформаційних об’єктів (бібліотека, комп’ютерні файли) і систему (алгоритм або програму) яка здійснює пошук. Для здійснення інформаційного пошуку користувач (людина або інформаційна система) формує інформаційний запит (information query). Результатом пошукової роботи є список документів який укладається згідно з певним принципом. Такий список називають впорядкованим (ranked list, ranked results).

Пошукова система переглядає всі доступні інформаційні одиниці (документи) зі збірки і відбирає документи відповідні до інформаційного запиту. Оскільки реальні пошукові системи знаходять не всі відповідні документи, говорять про точність пошукових систем (system accuracy). Результатом роботи пошукової системи є список відібраних документів (retrieved documents list), серед яких є відповідні до запиту документи (relevant documents). Для ідеальної пошукової системи список відібраних документів та відповідних документів повинні збігатися. В реальних пошукових системах в списках відібраних документів знаходяться і невідповідні до запиту документи. Тому говорять про ефективність пошукових систем. Ефективність пошукових систем оцінюється двома параметрами: пошукова відповідність (precision) та пошукова якість (recall). Пошукова відповідність визначає частку відповідних документів серед відібраних на запит. Пошукова відповідність визначає якість отриманого результату інформаційного пошуку. Пошукова якість визначає частку отриманих системою відповідних до запиту документів серед загального числа відповідних до запиту документів у збірці. Загальне число відповідних до запиту документів завжди є невідомим і може бути встановлене лише при повному перегляді збірки людиною. Крім того роботу пошукових систем оцінюють швидкодією — часом, за який отримують список відповідних до запиту документів.

Інформаційний пошук — велика міждисциплінарна область науки, яка стоїть на перетині когнітивної психології, інформатики, інформаційного дизайну, лінгвістики, семіотики, бібліотечної справи, та статистики.

Автоматичні системи інформаційного пошуку використовують для зменшення так званого "інформаційного перевантаження". Багато університетів та публічних бібліотек використовують системи ІП для полегшення доступу до книжок, журналів та інших документів. Найвідомішим прикладом систем ІП можна назвати пошукові системи в Інтернеті.

Інформаційно-пошукові системи Internet

М ережа Internet з’явилась близько двадцяти років тому в США. Нині це вже глобальна міжнародна інформаційна система, яка може бути використана як для інформаційного пошуку, так і у комерційних цілях для інформаційного обміну як корпоративна мережа. Загальну схему інформаційно-пошукової системи Internet зображено на рис.

Типова схема інформаційно-пошукової системи.

Клієнт — це програма перегляду конкретного інформаційного ресурсу. Найбільш популярні сьогодні мультипротокольні програми типу Netscape Navigator. Така програма забезпечує перегляд документів WWW, Gopher, Wais, FTP-архівів, поштових списків розсилки і груп новин Usenet. У свою чергу всі ці інформаційні ресурси є об’єктом пошуку інформаційно-пошукової системи.

Інтерфейс користувача — це не просто програма перегляду, у разі інформаційно-пошукової системи під цим словосполученням розуміють також спосіб спілкування користувача з пошуковим апаратом, системою формування запитів і перегляду результатів пошуку.

Пошукова машина — застосовується для трансляції запиту на інформаційно-пошукову мову (ІПМ), у формальний запит системи, пошуку посилань на інформаційні ресурси мережі і видачі результатів цього пошуку користувачеві.

Бази даних індексів — це основний масив даних ІПС, використовуваних для пошуку адреси інформаційного ресурсу. Архітектура індексу влаштована таким чином, щоб пошук відбувався максимально швидко і при цьому можна було б визначити цінність кожного із знайдених інформаційних ресурсів мережі.

Запити користувача — зберігаються в його (користувача) особистій базі даних. На відлагодження кожного запиту йде досить багато часу, і тому надзвичайно важливо запам’ятовувати запити, на які система дає гарні відповіді.

Робот-індексувальник — застосовується для сканування Internet і підтримки бази даних індексу в актуальному стані. Ця програма є основним джерелом інформації про стан інформаційних ресурсів мережі.

WWW sites — це весь Internet або точніше — інформаційні ресурси, перегляд яких забезпечується програмами перегляду.

Розглянемо тепер призначення і принципи побудови кожної з цих компонентів докладніше і визначимо, в чому відмінність даної системи від традиційної ІПС для локального типу.

Подання інформаційних ресурсів у Internet

Інформаційними ресурсами в ІПС Internet документи шести основних типів: WWW-сторінки, Gopher-файли, документи Wais, записи архівів FTP, новини Usenet і статті поштових списків розсилки. Усе це досить різнорідна інформація, подана у вигляді різних, ніяк неузгоджених один з одним форматів даних: тексти, графічна і аудіоінформація тощо.

У традиційних ІПС використовується поняття пошукового образу документа — ПОД. Цим терміном позначають щось, що замінює собою документ і що використовується при пошуку замість реального документа. Найбільш популярною моделлю створення ПОД є векторна модель, в якій кожному документу приписується список термінів, що найбільш адекватно відображають його тематику. Документу приписується вектор розмірності, рівний числу термінів, якими можна скористатися при пошуку. Якщо використовується булєва векторна модель, то елемент вектора

рівний 1 або 0, в залежності від наявності або відсутності терміну в ПОД. У більш складних моделях терміни зважуються — елемент вектора рівний не 1 або 0, а деякому числу (вазі), що відображає відповідність даного терміну документу. Саме остання модель стала найбільш популярною в ІПС Internet. Лінійна модель застосовується в системах Lycos, WebCrawler, AltaVista, OpenText і AliWeb.

Перша задача, яка вирішується в ІПС, — це визначення списку ключових слів, які характеризують документ чи інший інформаційний ресурс. Ця процедура називається індексуванням. Іноді процедуру індексування називають складанням файла інвертованого списку, в якому кожному терміну індексування ставиться у відповідність список документів, в яких він зустрічається. Така процедура є тільки окремим випадком, а точніше, технічним аспектом створення пошукового апарату ІПС.

Під час роботи у World Wide Web індексування виконують спеціальні програми, що називаються роботами-індексувальниками, які виконують сканування мережі. Робот переглядає мережу, знаходить нові ресурси, приписує їм терміни і вміщує в базу даних індексу. Головне питання полягає в тому, які терміни приписувати документам, звідки їх брати, адже ряд ресурсів взагалі не є текстом. Сьогодні роботи звичайно використовують для індексування наступні джерела для поповнення своїх віртуальних словників: гіпертекстові посилання, заголовки, анотації, списки ключових слів, повні тексти документів, а також повідомлення адміністраторів про свої Web-сторінки. Для індексування telnet, gopher, ftp, нетекстовій інформації використовуються головним чином URL, для новин Usenet і поштових списків поля Subject і Keywords. Найбільший простір для побудови ПОД дають HTML документи. Однак не треба думати, що всі терміни з перелічених елементів документів потрапляють до їх пошукових образів. Дуже активно застосовуються списки заборонених слів (stop-words), які не можуть бути вжиті для індексування, загальних слів (прийменники, сполучники і т. п.). Таким чином навіть те, що в OpenText, наприклад, називається повнотекстовим індексуванням, реально є вибором слів з тексту документа і порівнянням з набором різних словників, після якого термін надходить до ПОД, а потім і до індексу системи. Для того щоб не збільшувати словників і індексів (індекс системи Lycos вже сьогодні рівний 4 Тбайт), застосовується таке поняття, як вага терміна. Документ звичайно індексується через 40—100 найбільш вагомих термінів.

Механізми пошуку в Internet

Після індексації ресурсів і визначення їх ПОД, починається побудова пошукового апарату. Абсолютно очевидно, що безпосередній перегляд файлів ПОД займе багато часу, що абсолютно не прийнятно для інтерактивної системи www_ Для прискорення пошуку будується індекс, яким в більшості систем є набір пов’язаних між собою файлів, орієнтованих на швидкий пошук даних по запиту. Структура і склад індексів різних систем можуть відрізнятися один від одного і залежать від багатьох чинників: розміру масиву пошукових образів, інформаційно-пошукової мови, розміщення різних компонентів системи і т. п. Одним з варіантів структури індексу є побудова його у вигляді таблиці, що вміщує ідентифікаторів сторінок (page-ID), таблиці ключових слів (Keyword-ID), таблиці модифікації сторінок, таблиці заголовків, таблиці гіпертекстових зв’язків, інвертованого (IL) і прямого списку (FL).

Page-ID відображує ідентифікатори сторінок в їх URL, Keyword-ID — кожне ключове слово в унікальний ідентифікатор цього слова, таблиця заголовків — ідентифікатор сторінки в заголовок сторінки, таблиця гіпертекстових посилань — ідентифікатор сторінок у гіпертекстові посилання на цю сторінку. Інвертований список ставить у відповідність кожному ключовому слову документа список пар — ідентифікатор сторінки, позиція слова в сторінці. Прямий список — це масив пошукових образів сторінок. Всі ці файли так чи інакше використовуються при пошуку, але головним серед них є файл інвертованого списку. Результат пошуку в даному файлі — це об’єднання і/або перетин списків ідентифікаторів сторінок. Результуючий список, який перетворюється в список заголовків, забезпечених гіпертекстовими посиланнями повертається користувачеві в його програму перегляду Web. Для того щоб швидко шукати записи інвертованого списку, над ним надбудовується ще декілька файлів, наприклад, файл буквених пар з вказівкою записів інвертованого списку, що починаються з цих пар. Крім цього, застосовується механізм прямого доступу до даних — хешування.

Ефективність пошуку в кожної конкретної ІПС визначається виключно архітектурою індексу. Як правило, спосіб організації масивів індексів є секретом фірми.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]