Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
50-53(без разницы).docx
Скачиваний:
2
Добавлен:
04.09.2019
Размер:
31.87 Кб
Скачать

52.Навигация в сети Интернет. Понятие браузера.

Для работы с Интернет создаются спец-е программы – браузеры - "просмотрщик или обозреватель".

Первый браузер – Mosaic. К наиболее распр-ным относятся: Internet Explorer, Opera, Mozilla. Помимо браузеров, каждый из кот ис-ет ориг-ное программное ядро, сущ-ет множество программных надстроек над браузерами, кот добавляют в них некот полезные ф-ции.

Характер-ки: скорость работы, способности открывать прилож-я, безопасность и т.д. На популярность браузеров накладывает отпечаток и распрост-сть тех или иных ОС. Всем совр-ным браузерам свойственна простота интерфейса в сочетании с большими возмож-ями, кот они предоставляют польз-лям. Программы снабжены мн-вом сервисных ф-ций: способ-ть делать закладки, отслеживать маршрут по Сети с возм-тью возвр-я к любой промеж-ой ступени, удобный доступ к e-mail. Польз-ль может одновр-но работать сразу с неск-ми источниками инф-и, отсылать страницы по эл-й почте, сохранять файлы на своем компе. Практически все браузеры русиф-ны и для их ис-ия не треб-ся инсталляции доп модулей и шрифтов. Для правильного воспр-ия русскояз-х материалов нужно лишь установить и сохранить опр-ые параметры (кириллич-ю кодир-ку). Сущ-ют механизмы орг-ции работы со ссылками: работа с базами ссылок, избранное и Журнал. В папке Избранное - БД ссылок. В папке Журнал автомат-ки накап-ся и обнов-ся инф-я об адресах посещаемых веб-страниц, сгруп-ные в зав-сти от временных периодов их посещения. Кол-во папок может меняться. Каждый день порождается новая папка с именем дня, затем папки дней недели превращаются в одну - прошлая неделя (Last week) -> в 2 недели назад и т. д.

Можно насторить параметры отобр-я инф-и в Журнале с пом-ю меню Вид (View): выбрать порядок сортировки: по дате, по узлу, по посещаемости, по порядку. Сущ-ет возм-сть поиска опр-ой страницы по ключевым словам.

53.Поиск информации в Интернет. Принципы построения универсальных поисковых систем. Работа механизмов поиска. Процесс поиска информации. Классификация поисковых систем.

Для поиска - поисковые системы, основываются на различных механизмах, имеют всяческие возможности. Для поиска достаточно ввести поисковый запрос в спец форму и нажать поиск.

ключевые слова и правильно сформ-вать запрос для конк-ной поиск системы помогает понимание реал-ции её поиск-го мех-зма. Средства структур-ия инф-и - поисковые механизмы.

Осн-ые протоколы, используемые в Интернет, не содержат спец-ых встроенных ф-ций поиска. Протокол HTTP был создан, как ср-во навигации, т.е. просмотра страниц и не содержит ф-ций для построения эф-го поиска инф-и, также и протокол FTP для обмена файлов.

Для того чтобы структурировать инф-ю, накопл-ю в Интернет, и обеспечить ее польз-лей ср-вами поиска необ-мых данных, были созданы поисковые системы. Каждый из "поисковиков " опрашивает свой внутренний каталог по ключевым словам или фразам. Различие состоит в объёме просматриваемой инф-и и алгоритме поиска, плюс, в наличии доп сервисов (встроенных темат-ких каталогов или рейтинга индексируемых страниц). Поиск ведется в базе на множестве серверов поисковой системы, а в ответ на запрос выдаются подходящие адреса веб-страниц во всех концах Интернет. Поисковик ведёт пост-ый опрос узловых адресов в Сети, пополняя собственную БД. Поисковые системы обычно состоят из трех компонент: 1.средства поиска - агент (паук или кроулер), кот перемещается по Сети и собирает инф-ю; 2.БД, кот содержит всю инф-ю, собираемую пауками; 3.поиск-ый механизм, кот люди ис-ют как интерфейс для взаимод-я с БД поиск системы.

Работа механизмов поиска

Средства поиска исся для сбора инфи о документах, находящихся в Сети. Это спец-е программы, кот ищут страницы, извлекают гипертекст-е ссылки на этих страницах и автомат-ки индекс-ют инф-ю, кот находят, для построения БД.

Каждый поисковый механизм имеет собст-ый набор правил, опр-ющих, как собирать док-ты. Одни следуют за каждой ссылкой на каждой найденной странице. Другие игнорируют ссылки, кот ведут к граф-им и звуковым файлам, файлам мультип-и; третьи игнорируют ссылки к ресурсам типа БД; четвёртые просмат-ют наиболее популярные страницы.

Общий поиск инф-и в Интернет осущ-ют программы, известные как пауки. Пауки сообщают о содержании найденного док-та, индекс-ют его и извл-ют итог-ю инф-ю. Также они просма-ют заголовки, некот ссылки и посылают проиндекс-ую инф-ю БД поиск-го мех-зма.

Кроулеры просмат-ют заголовки и возвр-ют только первую из найденных ссылок.

Роботы могут быть запрограм-ны так, чтобы переходить по различным ссылкам различной глубины вложенности, выполнять индексацию и даже проверять ссылки в док-те. Из-за своей природы они могут застревать в циклах, им требуются знач-ные ресурсы. Сущ-ют методы для запрета роботам поиска по сайтам, владельцы кот не желают, чтобы они были проиндексированы.

Агенты – самые "интел-ные". Они могут выпол-ть даже транзакции от имени польз-ля. Они могут искать cайты специф-кой тематики и возвращать списки cайтов, отсортир-ных по посещаемости. Агенты могут обрабат-ть содер-е док-ов, находить и индексировать др виды ресурсов, не только страницы.

Процесс поиска информации

При первой попытке реком-ется ис-ть как можно больше ключевых слов. Затем есть два пути найти приемлемый ответ на запрос – поставить сортировку по дате (последний проиндекс-ный сайт вверху): нет необх-сти открывать много окон, или можно восп-ся расширенным поиском (в найденных страницах) - число страниц уменьшится вдвое.

Чтобы опр-ть порядок, в кот список док-ов будет показан, БД применяет алгоритм ранжирования. Чаще док-ты наиболее адекватные польз-му запросу будут помещены первыми в списке. Основные принципы опр-я адекватности следующие: Кол-во слов запроса в текстовом содержимом html-страниц; Тэги, в кот эти слова распол-ся; Местоположение искомых слов в документе; Удельный вес слов,

Время – как долго страница находится в базе поискового сервера, Индекс цитируемости –кол-во ссылок на данную страницу.

БД выводит ранж-ный подобным образом список док-ов. Разные способы показа получ-го списка: только ссылки; ссылки с первыми предлож-ми или заголовок доку-та вместе с ссылкой.

Классификация поисковых систем

1. По способу реализации: Уникальные – ис-ют собст-ные механизмы поиска и БД, Мета-системы посылают запрос на неск-ко поиск-х систем, каталогов и невидимое (скрытое) - собрание онлайновой инфи, не проиндекс-ной традиц-ми поисковыми системами, затем система удаляет дублир-ые ссылки и по своему алгоритму, объединяет/ранжирует результаты в общем списке

2. По нац-но-территор-ой направленности. Здесь важным является понятие нац-ого корпуса языка.

Нац-ный корпус – это инфор-но-справочная система, осн-ная на собрании текстов в электр-ой форме. Нац-ный корпус представляет язык на опр-ном этапе суще-ия во всём многообр-и жанров, тер-ных и соц-ых вариантов и т.п.

3. По специализации: поиск изобр-ий, поиск файлов, поиск новостей и т.п.

Специализированные поисковые Интернет- ресурсы - Каталоги ресурсов Интернет –преимуществом такого вида поиск инструментов яв-ся их целенапр-сть.