Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лабораторна_робота_18_Комп_практика_Интернет.doc
Скачиваний:
0
Добавлен:
01.04.2025
Размер:
222.72 Кб
Скачать

Міністерство освіти і науки України

Київський радіомеханічний коледж НАУ

ЗАТВЕРДЖУЮ

Заступник директора з НВирР

_____________А.П.Єрмоленко

« ___ » _____________ 20___ р.

ІНСТРУКЦІЯ

до проведення лабораторної роботи №18

«Організація пошуку в мережі Internet»

Предмет: Комп’ютерні мережі

Автор і дата затвердження програми: Новиченко В.М., 31.08.2011 р.

Спеціальність: 5.05010201 «Обслуговування комп'ютерних систем і мереж»

Спеціалізація: «Комп’ютерна інженерія»

РОЗГЛЯНУТО

на засіданні ЦК

Автоматики та ОТ

« ___ » _____________ 20___ р.

протокол №_____

Голова ЦК

______________ В.М. Новиченко

Інструкцію склав викладач

Новиченко В.М.

____________

« ___ » _____________ 20___ р.

м. Київ

Лабораторна робота № 18

Організація пошуку в мережі Internet

1 Мета роботи

Дослідити різноманітні види пошуку та пошукових систем, які використовуються в Internet

2 Завдання

2.1. Одержати відомості про налаштування браузерів.

2.2. Одержати відомості про типи пошуку в Internet та методику їх організації.

2.3. Одержати відомості про види пошукових систем та принципи їх роботи.

2.4. Провести пошук інформації, використовуючи різні види пошукових систем та різні типи пошуку.

2.5 Провести тестування роботи локальної мережі для виходу у глобальну мережу.

3 Література

3.1 Марк Спортак, Френк Паппас и др. Компьютерные сети и сетевые технологии – К: ТВД ДС, 2002. - 736 с

3.2 Таненбаум Э. Компьютерные сети. 4-е издание. Серия «Классика computer science» - С-П: Питер, 2003. - 992 с

3.3 Антонов В.М. Сучасні комп’ютерні мережі. – К: МК-Прес, 2005. - 480 с

3.4 Олифер В.Г., Олифер Н.А. Компьютерные сети: принципы, технологии, протоколы. 3-е издание Учебник. - С-П: Питер Бук, 2006. - 958 с

3.5. Новиченко В.М. Методичні вказівки до самостійної роботи «Введення в Internet»

4 Теоретична частина

4.1 Теоретичні питання з даної теми описані в методичній розробці «Введення в Internet», автор В.М. Новиченко

4.2 В Інтернеті з кожним днем накопичується все більше інформації коли-небудь створеної і новостворюваної людьми. Рівнодоступність більшої частини інформації в Інтернеті зрівнює можливості доступу до цієї інформації як звичайних користувачів Інтернету і журналістів локальних ЗМІ, так і співробітників світових інформаційних агентств.

Завдяки Інтернету перед кожною людиною відкрився доступ до багатомільйонної аудиторії, якій він може передати свій інформаційний матеріал, отриманий, наприклад, за допомогою звичайного мобільного телефону з диктофоном і вбудованою фотокамерою. Отже, рівень монополізації діяльності з розповсюдження інформації також знижується завдяки Інтернету.

До недавнього часу обмеження в прямій комунікації між людьми, що породжуються простором і часом, багато в чому визначали потребу людей в послугах журналістів. У міру зростання загальної кількості користувачів Інтернету, а серед них – кількості тих, хто володіє англійською мовою, ці обмеження все більше знімаються, що закономірно веде до зменшення попиту на послуги журналістів. Одночасно з цим зростає обсяг "сирої" інформації, яка доступна кожному окремому користувачеві Інтернету, що актуалізує проблему її відбору й редагування. Журналісти все більше стають схожими на "пошукові машини", що відбирають, редагують і пропонують отриманий при цьому інформаційний продукт своїм читачам.

Для того, щоб знайти в Інтернеті потрібну інформацію, необхідно знати або адресу пошуку (наприклад, адреса html-сторінки або файлу), або користувача Інтернету, який може надати інформацію. Якщо не знати ні адресу, ні людину, яка могла б допомогти, то слід перейти до питань "Як можна дізнатися адресу розміщення інформації?" або "Як знайти людину, яка могла б нам допомогти з пошуком інформації?". При цьому не слід переоцінювати можливості Інтернету. Кращі результати може дати поєднання онлайнових і офлайнових методів пошуку інформації.

Методів пошуку в Інтернеті і через Інтернет достатньо багато. Тому пошук інформації в Інтернеті - це вибір методів пошуку інформації, що потребує їх оцінки, виходячи з поставленого завдання. У кожному конкретному випадку успішність пошуку визначається знаннями можливих методів і навичками володіння ними, знанням етнічних мов, на яких ця інформація може бути представлена, або соціальними зв'язками.

Підручник може бути корисний як журналістам, так і всім іншим користувачам Інтернету. Адже для того, щоб знайти саме те, що необхідно, треба знати де і як це шукати.

Таким чином, планування пошуку зводиться до трьох питань: "Що шукаємо?", "Де шукаємо?", "Як шукаємо?".

Що шукаємо?

Пошукові запити бувають явні і неявні. В явних питаннях конкретно вказується об'єкт пошуку. В неявних питаннях, наприклад, «яка сьогодні погода», «чи відбувається зараз щось важливе», «чи можна проїхати по місту», або у О.С. Пушкіна в «Казці про мертву царівну і про сім богатирів»:

«Свет мой, зеркальце! скажи

Да всю правду доложи:

Я ль на свете всех милее,

Всех румяней и белее?»

об'єкт пошуку конкретно не вказується.

Пошукові запити також діляться в залежності від необхідної системи пошуку. Перша група пошукових систем призначена лише для лінійного пошуку інформації, тобто для виявлення в текстах фрагментів, аналогічних заданому. Отже, у запиті має міститися фрагмент тексту. Друга група систем дозволяє вибирати дані про зв'язки між об'єктами, що вимагає зазначення в запиті зв'язоку між тими чи іншими об'єктами.

Щоб спланувати пошук, слід насамперед визначити об'єкт пошуку, сформулювати яку інформацію необхідно знайти. Якщо однозначно відповісти на це питання не представляється можливим, то пошук слід розділити на задачі з різними об'єктами. У плануванні пошуку також слід визначити співвідношення видів інформації в пошуковому завданні.

Наприклад, якщо необхідно представити якусь компанію, то корисними можуть стати не тільки стандартні характеристики фірми (дані про оборот, клієнтів тощо), але й відомості про зв'язки її перших осіб. І навпаки - фізичну особу можна охарактеризувати через компанію, якою вона володіє або в якій працює.

Треба визначитися і з можливими форматами файлів в яких може міститися необхідна інформація. Це може бути html-сторінка, текстовий документ у форматах txt, rtf, odt, doc або docx, документ pdf, презентація в форматах odp, ppt або pptx, електронна таблиця в форматах ods, xls або xlsx, аудіо у форматі mp3, flash- ролик формату swf, відео у форматі avi тощо.

  • Типи інформації;

  • Оцінка інформації;

  • Пошук файлів;

  • Пошук файлів з розширенням rtf;

  • Пошук файлів з розширенням doc;

  • Пошук файлів з розширенням ppt;

  • Пошук файлів з розширенням xls;

  • Пошук файлів з розширенням pdf;

  • Пошук файлів з розширенням mp3;

  • Пошук файлів з розширенням mpeg4;

  • Пошук файлів з розширенням swf;

  • Пошук файлів з розширенням ps;

  • Пошук файлів з розширенням dwf;

  • Пошук файлів з розширенням kml;

  • Пошук файлів з розширенням kmz;

  • Пошук файлів з розширенням avi;

  • Пошук програмного забезпечення;

  • Пошук законодавчого акту;

  • Пошук вакансій;

  • Пошук робітників;

  • Пошук реферату;

  • Пошук людини;

  • інші запити.

Де шукаємо?

Інформація може розміщуватися на веб-серверах, на ftp-серверах, в блогах, в новинах, в книгах, в словниках, в товарах, на географічних картах, в довідниках адрес організацій, серед афіш театрів і музеїв, в телепрограмах, в каталогах, в Вікіпедії, в архівах Інтернету, у пірингових мережах, в базах даних, у веб-закладках або в рейтингових системах.

  • Джерела інформації;

  • Пошук по блогам;

  • Пошук в новинах;

  • Новини Google;

  • Яндекс.Новини;

  • Пошук книг та в книгах;

  • Пошук в словниках;

  • Пошук в картинках;

  • Пошук в товарах;

  • Пошук по карте;

  • Пошук адрес;

  • Пошук афіши;

  • Пошук по об’явам;

  • Пошук інформації про погоду;

  • Пошук телепрограми;

  • Пошук в каталогах;

  • Пошук в Вікіпедії;

  • Пошук в архівах Інтернету;

  • Пошук через пірингові системи;

  • Пошук в базах даних;

  • Пошук в інтернет-версіях правових систем;

  • Сервіс закладинок;

  • Пошук через рейтингові системи;

  • Пошук звуків в FindSounds.com

  • інший пошук

Як шукаємо?

  • Методи пошуку залежать від відповіді на два перших питання. Пошук може здійснюватися в пошукових індексах, через розміщення власної публікації з певної теми, через експертів тощо.

  • Карти пошуку інформації;

  • Пошукові індекси;

  • Мова запитів в пошукових індексах;

  • Особиста публікація як джерело інформації;

  • Пошук за допомогою експертів;

  • Пошук на сайтах правових систем;

Пошукові системи:

    • Google;

    • Yahoo!;

    • Апорт;

    • Rambler;

    • Яндекс;

    • @MAIL.RU;

    • ru.msn.com;

    • Nigma.ru ;

    • AltaVista;

    • Quintura;

    • Microsoft Live Search;

Спеціалізовані пошукові системи.

    • Bing

    • Ask.com

    • GigaBits.com

    • Taggalaxy.de

    • FindSounds.com

    • KM.RU

    • informationrecuperation.blogspot.com

    • та інші

ОПИС МОВИ ЗАПИТІВ

Як трактуються слова

Незалежно від того, в якій формі вжито слово в запиті, пошук враховує всі його форми за правилами певної мови (мови, яка використовується при запиті).

Наприклад, якщо задано запит "йти", то в результаті пошуку будуть знайдені посилання на документи, що містять слова 'йти', 'йде', 'йшов', 'йшла' тощо. На запит 'вікно' буде видана інформація, що містить і слово 'вікон', а на запит 'відкликали' - документи, що містять слово 'відкликались'.

Якщо набрати в запиті слово з великої літери, будуть знайдені тільки слова з великої літери (якщо це слово не перше в запиті), в іншому випадку будуть знайдені як слова з великою, так і з маленької літери.

Наприклад, запит 'лебідь' знайде і птицю, і генерала. Запит 'Лебідь' - генерала і ті випадки згадки птиці, коли вона написана з великої літери.

За замовчуванням пошук враховує всі форми заданого слова згідно з правилами російської мови. Однак існує можливість пошуку за точною словоформою, для цього перед словоформою треба поставити знак оклику '!'.

Так за запитом '! Лужкову' будуть знайдені всі документи, що містять словоформу 'Лужкову', а на запит 'Лужков ~ ~! Лужкову' - документи, в яких згадується Лужков, крім тих, які були знайдені за першим запитом.

  • Природно-мовний пошук

  • Знаки "+" і "-". Якщо ви хочете, щоб слова із запиту обов'язково були знайдені, поставте перед кожним з них "+". Якщо ви хочете виключити будь-які слова з результату пошуку, поставте перед кожним з них "-".

  • Наприклад, запит 'приватні оголошення продаж велосипеда', видасть багато посилань на сайти з різноманітними приватними оголошеннями. А запит з "+" 'приватні оголошення продаж + велосипеда' покаже оголошення про продаж саме велосипедів. Якщо вам потрібний опис Парижа, а не пропозиції численних турагентств, має сенс задати такий запит 'путівник по Парижу –агентство -тур'

  • Зверніть увагу на знак "-". Це саме мінус, а не тире і не дефіс. Знак "-" треба писати через пробіл від попереднього і разом з наступним словом, ось так: 'рак -гороскоп'. Якщо написати 'рак-гороскоп' або 'рак - гороскоп', то знак "-" буде проігноровано.

Основні оператори

Кілька набраних у запиті слів, розділених пробілами, означають, що всі вони повинні входити в одну пропозицію документа, який шукається. Той же самий ефект справить вживання символу '&'.

Наприклад, при запиті 'лікувальна фізкультура' або 'лікувальна фізкультура &'), результатом пошуку буде список документів, в яких в одному реченні містяться і слово 'лікувальна', і слово 'фізкультура'. (Еквівалентно запросу '+ лікувальна фізкультура +')

Між словами можна поставити знак '|', щоб знайти документи, що містять будь-яке з цих слів. (Зручно при пошуку синонімів).

Запит виду 'фото | фотографія | фотознімок | фото | фотозображення' задає пошук документів, що містять хоча б одне з перерахованих слів.

Ще один знак, тильда '~', дозволить знайти документи з пропозицією, що містить перше слово, але не містить друге.

За запитом 'банки ~ закон' будуть знайдені всі документи, що містять слово 'банки', поруч з яким (в межах речення) немає слова 'закон'.

Щоб піднятися на сходинку вище, від рівня пропозиції до рівня документа, треба відповідний знак застосувати двічі. Одинарний оператор (&, ~) шукає в межах абзацу, подвійний (& &, ~ ~) - в межах документа.

Наприклад, за запитом 'рецепти & & (плавлений сир)' будуть знайдені документи, в яких є і слово 'рецепти' і словосполучення '(плавлений сир)' (причому '(плавлений сир)' повинен бути в одному реченні. А запит 'керівництво Visual C ~ ~ ціна 'видасть всі документи зі словами' керівництво Visual C ', але без слова' ціна '

  • Пошук з відстанню

Часто в запитах шукають стійкі словосполучення. Якщо поставити їх в лапки, то будуть знайдені ті документи, в яких ці слова йдуть строго поспіль.

Наприклад, за запитом "червона шапочка" будуть знайдені документи з цією фразою. (При цьому контекст "а шапочка у неї була червона" знайдено не буде.)

Як Яndex адресує слова? Якщо всі слова в тексті перенумерувати по порядку їх слідування, то відстань між словами a і b - це різниця між номерами слів a і b. Таким чином, відстань між сусідніми словами дорівнює 1 (а не 0), а відстань між сусідніми словами, що стоять "не в тому порядку", дорівнює -1 (мінус 1). Те ж саме відноситься і до пропозицій.

Якщо між двома словами поставлений знак "/", за яким відразу надруковано число, значить, потрібно, щоб відстань між ними не перевищував цього числа слів.

Наприклад, задання запиту 'постачальники / 2 кава', вимагає знайти документи, в яких містяться і слово 'постачальники', і слово 'кава', причому відстань між ними повинна бути не більше двох слів і вони повинні перебувати в одному реченні. (Знайдуться "постачальники колумбійського кави", "постачальники кави з Колумбії" і т.д.)

Якщо порядок слів і відстань точно відомі, можна скористатися пунктуацією '/ + n'. Так, наприклад, задається пошук слів, що стоять підряд.

Запит 'синя / +1 борода' означає, що слово 'борода' має йти безпосередньо за словом 'синя'. (До того ж результату приведе запит "синя борода")

У загальному вигляді обмеження по відстані задається за допомогою пунктуації виду '/ (nm)', де 'n' мінімальне, а 'm' максимально допустима відстань. Звідси випливає, що запис '/ n' еквівалентний запису '/ (-n + n)', а запис '/ + n' еквівалентний запису '/ (+ n + n)'.

Запит 'музичне / (-2 4) освіта' означає, що 'музичне' повинно знаходитися від 'освіта' в інтервалі відстаней від 2 слів зліва до 4 слів справа.

Практично всі знаки можна комбінувати з обмеженням відстані.

Наприклад, результатом пошуку за запитом 'вакансії ~ / +1 студентів' будуть документи, що містять слово 'вакансії », причому в цих документах слово 'студентів' знаходиться не безпосередньо за словом 'вакансії'.

Коли знаки обмеження по відстані стоять після подвійних операторів, то вжиті там числа - це відстань не в словах, а в пропозиціях. Відстань в абзацах визначається аналогічно відстані в словах.

Запит 'банк & & / 1 податки "означає, що слово 'податки' повинно знаходитися в тому ж самому, або в сусідньому зі словом 'банк' реченні.

  • Дужки

  • Замість одного слова у запиті можна підставити цілий вираз. Для цього його треба взяти в дужки.

Наприклад, запит '(історія, технологія, виготовлення) / +1 (сиру, сиру)' задає пошук документів, які містять будь-яку з фраз 'історія сиру', 'технологія сиру', 'виготовлення сиру', 'історія сиру'.

  • Пошук в зонах

Можна шукати інформацію в "зонах" - заголовках (ім'я "зони": Title), посиланнях (ім'я "зони": Anchor) та адресу (ім'я "зони": Address). Синтаксис: $ імя_зони (пошуковий вираз).

Запит '$ title CompTek' шукає в заголовках документів слово 'CompTek'. Запит '$ anchor (CompTek | Dialogic)' знаходить документи, в посиланнях, всередині яких є одне з слів 'CompTek' або 'Dialogic'.

  • Пошук в певних елементах

Можна обмежити пошук інформації списком серверів або навпаки виключити сервера з пошуку (url). Можна також шукати документи, які містять посилання на певні URL (link), і файли картинок (image). Якщо ви хочете працювати не з конкретним URL (image), а з усіма, що починаються з даної послідовності символів, використовуйте "*". Синтаксис: # імя_елемента = "ім'я_файлу (URL)".

За запитом 'CompTek ~ ~ # url = "www.comptek.ru *"' будуть шукатися згадки компанії 'CompTek' скрізь, крім її власного сервера (www.comptek.ru). А запит '# link = "www.comptek.ru *"' покаже всі документи, які послалися на сервер компаніі. Запит '# image = "tort *"' дасть посилання на документи із зображеннями тортів (хоча, можливо, знайдеться і портрет черепахи Тортілли).

Можна також шукати за ключовими словами (keywords), анотаціями (abstract) і підписам під зображеннями (hint). Синтаксис: # імя_елемента = (пошуковий вираз).

Запросу '# keywords = (пошукова система) | # abstract = (пошукова система)' будуть шукатися всі сторінки, в meta-тегах яких є ці слова. За запитом '# hint = (кіно)' будуть знайдені документи, що містять зображення з таким підписом .

  • Ранжування результату пошуку

При пошуку для кожного знайденого документа Яндекс обчислює величину релевантності (відповідності) змісту цього документа пошуковому запиту. Список знайдених документів перед видачею користувачеві сортується за цією величиною в порядку зменшення. Релевантність документа залежить від ряду факторів, у тому числі від частотних характеристик слів, які треба знайти, ваги слова або виразу, близькості пошукових слів у тексті документа один до одного тощо.

Користувач може вплинути на порядок сортування, використовуючи оператори ваги й уточнення запиту.

Завдання ваги слова або виразу застосовується для того, щоб збільшити релевантність документів, які містять "зважений" вираз. Синтаксис: слово: число або (пошуковий_вираз): число

За запитом 'пошукові механізми: 5' будуть знайдені ті ж документи, що і за запитом 'пошукові механізми'. Різниця полягає в тому, що зверху знайденого списку виявляться документи, де найчастіше зустрічається саме слово 'механізми'. Запит 'пошукові (механізми | машини | апарати): 5' рівнозначний запиту 'пошукові (механізми: 5 | машини: 5 | апарати: 5 ) '.

Завдання уточнюючого слова або виразу застосовується для того, щоб збільшити релеватність документів, які містять уточнюючий вираз. Синтаксис: <- слово або <- (уточнюючий_вираз).

За запитом 'комп'ютер <- телефон' будуть знайдені всі документи, що містять слово 'комп'ютер', при цьому першими будуть видані документи, що містять слово 'телефон'. Якщо ні в одному документі зі словом 'комп'ютер' немає слова 'телефон', результат запиту буде еквівалентний запиту 'комп'ютер'.