Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
18.По сетям.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
308.22 Кб
Скачать

3. Средства телекоммуникационных технологий

3.1. Основные услуги Интернета

В любой компьютерной сети предоставление пользователю кон­кретного набора услуг осуществляется определенной службой в соответствии с определенным протоколом. Рассмотрим наиболее рас­пространенные услуги Интернета и протоколы, поддерживающие их.

  1. Электронная почта (e-mail) - услуга, позволяющая любому пользователю сети передавать и получать электронные сообщения по адресам электронной почты за короткий промежуток времени в любое время суток. Для передачи сообщения необходимо знать электронный адрес получателя. Работа электронной почты основана на последовательной передаче информации по сети от одного почтового сервера другому, пока сообщение не достигнет адресата. Данная услуга поддерживается группой протоколов (SMTP, РОРЗ и др.).

  2. Usenet - служба телеконференций (группа новостей), осу­ществляемая по протоколу NNTP (Network News Transfer Protocol - протокол передачи новостей по сети). Выполняет циркулярную рассылку электронной почты - сообщения отправляются на специальный сервер, где они становятся доступными большой группе пользователей для публичного обсуждения. Для удобства обсуждения различных тем созданы специальные группы - Newsgroups, которые объединены в иерархии по областям знаний. В настоящее время телеконференции позволяют передавать файлы любых типов, включая текстовые, графические и аудио файлы.

Серверы Usenet дублируют (частично или полностью) информацию, хранящуюся друг у друга, чтобы их пользователи могли общаться между собой. Однако работают они не синхронно. Каждый из них имеет свои ограничения на объем загружаемой информации с других серверов и сроки ее хранения. Причем администрация сервера сама определяет, какие группы и в каком объеме синхронизовать. Среди факторов, осложняющих публикацию в Usenet, есть и ограничение на объем одной публикации.

Все файлы, имеющиеся в Usenet: музыка, изображения, видео, программное обеспечение, образы дисков, игры и прочие - представлены в текстовой кодировке и прикреплены к сообщению так же, как и в электронной почте.

  1. Telnet - это протокол, позволяющий пользователю использовать ресурсы удаленного компьютера: получать доступ к его файлам, запускать программы.

  2. FTP - услуга, осуществляемая по протоколу FTP {File Transfer Protocol - протокол передачи файлов). Она обеспечивает пересылку файлов между компьютерами сети независимо от их типов, особенностей операционных систем, файловых систем и форматов файлов.

  3. World Wide Web (WWW) - услуга для работы с совокупностью ресурсов, доступных с помощью таких инструментов, как протоколы HTTP, FTP, Telnet и др. Она строится на основе гипертекстового представления информации. Термином WWW или Web называется также организация файлов для размещения на группе серверов в Интернете, запрограммированных для обработки запросов, поступающих от браузеров, работающих на ПК пользователей.

  4. IRC (Internet Relay Ghat - ретранслируемый интернет-разговор) - услуга, предназначенная для прямого общения в Интернете в режиме реального времени путем обмена текстовыми сообщениями. Услуга получила название «чат». Характерной особенностью является коммуникация именно в реальном времени или близкая к этому, что отличает чат от форумов и других «медлен­ных» средств.

Существует несколько разновидностей программной реализации чатов:

  • Web-чаты - выглядит как обычная web-страница, где можно прочесть последние несколько десятков фраз, написанных уча­стниками чата и модераторами. Первоначально они представля­ли собой страницу с разговором, содержащую форму для ввода и передачи текста на сервер. Сервер добавлял новые сообщения в текстовую область, удалял старые и обновлял файл. Важно заметить, что такой чат осуществлялся с заметной задержкой в десятки секунд, из-за того, что web-средства не позволяли серверу сообщить клиенту об изменениях — клиент мог только запрашивать данные сам с некоторой периодичностью.

  • Видео-чаты - это обмен текстовыми сообщениями и транслирование изображений с web-камер. Поначалу это были не видео-, а скорее, фото-чаты: из-за низкой пропускной способности каналов отправлялся не видеопоток, а картинка с некоторыми интервалами, что однако, давало возможность достаточно опе­ративно наблюдать смену эмоций у собеседника и было значительным прорывом. Позднее, конечно, стал транслироваться видеопоток, хотя и с низким разрешением.

  • Голосовые чаты тоже явились развитием идей обмена сооб­щениями. В настоящее время в компьютерных играх широко применяется система TeamSpeak, позволяющая общаться голо­сом между членами команды, не отвлекаясь от управления игрой. А общение по Skype больше напоминает разговор по телефону, чем чат, хотя возможность отправки обычных текстовых сообщений в нем тоже присутствует.

  • Телечаты - сообщение передается путем отправки SMS с мобильного телефона, используются на телеканалах MTV, RU.TV, Bridge-TV и др. Чаще всего это объявления о знакомствах или поздравления с праздниками. Также на некоторых каналах ведётся общение с ведущим. Большинство сообщений - платные.

  • 7. Web-форум - класс web-приложений для организации общения посетителей web-сайта. Форум предлагает набор разделов для обсуждения. Работа форума заключается в создании пользователя­ми тем в разделах и последующим обсуждением внутри этих тем. Распространённая иерархия web-форума: разделы —> темы —* сооб­щения.

Обычно сообщения несут информацию «автор - тема - содержа­ние-дата / время». Сообщение и все ответы на него образует «вет­ку» или «тему». Отклонение от начальной темы обсуждения часто запрещено правилами форума. За соблюдением правил следят моде­раторы и администраторы - участники, наделённые возможностью редактировать, перемещать и удалять чужие сообщения в опреде­лённом разделе или теме, а также контролировать к ним доступ от­дельных зарегистрированных участников, а иногда и незарегистри­рованных - гостей.

На форумах может применяться гибкое разграничение доступа к сообщениям. Так, на одних форумах чтение и создание новых со­общений доступны любым случайным посетителям, на других не­обходима предварительная регистрация - те и другие форумы назы­вают открытыми. Применяется и смешанный вариант - когда от­дельные темы могут быть доступны для размещения сообщений всем посетителям, а другие - только зарегистрированным участ­никам. Кроме открытых, существуют закрытые форумы, доступ к которым определяется персонально для каждого участника админи­страторами форума. На практике также нередко встречается вари­ант, когда некоторые разделы форума общедоступны, а остальная часть доступна только узкому кругу участников.

При регистрации участники форума могут создавать свои про­фили - страницы со сведениями о себе.

Каждый конкретный форум имеет свою тематику - достаточно широкую, чтобы в ее пределах можно было вести многоплановое обсуждение.

Форум отличается от чата разделением обсуждаемых тем и воз­можностью общения не в реальном времени. Это располагает к более серьёзным обсуждениям, поскольку предоставляет отвечающим больше времени на обдумывание ответа. Форумы часто использу­ются для разного рода консультаций, в работе служб технической поддержки.

В настоящее время web-форумы почти полностью вытеснили новостные группы на базе NNTP и являются одним из наиболее по­пулярных способов обсуждения вопросов во всемирной паутине.

  1. IPTV (Internet Protocol Television) - цифровое интерактивное телевидение в сетях передачи данных по протоколу IP, новое поко­ление телевидения.

  2. IP-телефония - технология, использующая протокол IP в ка­честве основного средства передачи голоса. Для обозначения этого явления используется также аббревиатура VoIP, которая расшифро­вывается как Voice over IP, то есть голос поверх протокола IP.

  3. Интернет-телефония - частный случай IP-телефонии, когда в качестве линий передачи телефонного трафика используются ка­налы сети Интернет, позволяет устанавливать соединение по схе­мам компьютер-телефон и компьютер-компьютер.

3.2. Электронная почта

Система электронной почты позволяет доставить сообщение на любой компьютер, включенный в сеть Интернет. Сообщение может содержать текст или файл любого формата - графику, музыку и т. д.

Все пользователи электронной почты имеют уникальные адреса. Адрес пользователя зарегистрирован в определенном домене сети Интернет. С каждым доменом связан почтовый сервер, управ­ляющий адресами пользователей. Пользователь набирает текст письма в программе, которая называется почтовым клиентом, по­зволяет создавать и редактировать новые письма, обрабатывать пришедшие, хранить и систематизировать переписку и т. д.

Почтовый клиент помещает письмо в «почтовый ящик» пользо­вателя, расположенный на почтовом сервере. Сервер, в свою оче­редь, передает письмо на почтовый сервер адресата. Почтовые сер­веры обмениваются сообщениями в автоматическом режиме, при­чем маршрут движения сообщения в сети рассчитывается специ­альной программой-маршрутизатором. Когда сообщение прибывает на почтовый сервер, пользователь при очередном соединении с сер­вером получает уведомление о поступлении почты.

Вместе с Internet Explorer устанавливается почтовая программа Outlook Express, предназначенная для обработки электронной поч­ты. Она является модифицированной версией программы Outlook, которая входит в комплект Microsoft Office и служит для автомати­зации офисной работы.

Интерфейс почтовой программы построен таким образом, что в одном окне открываются несколько панелей, позволяющих быстро сориентироваться в потоке почты (рис. 6.8). Прежде всего, это панель Папки, расположенная с левой стороны. Пункт Локальные папки включает следующие:

  • Входящие - папка, в которую будут поступать письма с сервера.

  • Исходящие - содержит письма, подготовленные к отправке.

  • Отправленные - в этой папке остаются копии всех отправленных писем.

  • Удаленные - папка является аналогом Корзины в Windows. Все удаленные сообщения перемещаются сюда.

  • Черновики - здесь хранятся заготовки и черновики писем.

Outlook fcxores

Рис. 6.8. Окно программы Outlook Express

Последние три папки являются вспомогательными. С правой стороны расположены панели-фреймы для экспресс-просмотра со­держимого папок. Если открыть какую-либо из папок {Входящие, Исходящие и т. д.), правая часть окна Outlook Express окажется раз­деленной на две части: верхнюю и нижнюю. В верхней части будет показано содержимое текущей папки, а в нижней - текст сообще­ния. На рисунке 6.9 приведена иллюстрация для папки Входящие.

Программы электронной почты нуждаются в настройке, которая обычно происходит при первом запуске с помощью Мастера под­ключения. Для работы с почтой требуется отдельная учетная запись. Учетных записей может быть несколько. Для создания учетной запи­си нужно указать:

  • имя и фамилию, которые будут отображаться в строке «От ко­го» корреспонденции;

  • полный адрес электронной почты (обычно состоит из сочета­ния имени пользователя и названия поставщика услуг Интерне­та - провайдера, разделенных знаком @ и точками);

  • адрес почтового сервера провайдера, который занимается от­правкой почты с использованием протокола SMTP и соответ­ственно называется SMTP-сервер;

  • адрес почтового сервера, принимающего почту ( может быть IMAP или POP3), называется POP-сервер (адреса обоих серверов могут совпадать); имя пользователя, по которому компьютер будет вас иденти­фицировать (login); пароль.

Fhc. 6.9. Папка ИхоОящие

Работа программы Outlook Express после запуска и подключения к сети Интернет начинается с проверки поступления почты. В дальнейшем программа автоматически проверяет поступления каждые 30 минут. При появлении новых сообщений в правом ния^ нем углу окна появляется значок конверта.

Программа Outlook Express построена таким образом, что позво­ляет сразу ознакомиться с содержимым пришедшей почты в папке Вхо­дящие. Если папка не пустая, т. е. в ней содержатся какие-либо при­шедшие письма, то ее название будет выделено жирным шрифтом.

Вновь пришедшие и не отсортированные письма располагаются в виде таблицы, где указаны отправитель и тема письма, обозначенная автором при отправлении. Кроме того, в начале таблицы перед этими записями можно встретить и другие значки:

  • восклицательный знак t - письмо повышенной важности;

  • - сообщение не срочное;

  • наличие скрепки ^ означает, что в письме есть вложенный файл, который можно отдельно просмотреть при наличии соот­ветствующих программ или сохранить в виде файла;

  • флагом У помечаются сообщения, удовлетворяющие опреде­ленным условиям;

  • закрытый конверт и текст, выделенный жирным шрифтом, обозначают непрочитанные письма;

  • открытый конверт - письмо просмотрено.

Наличие колонок, в которых появляются значки, регулируется в настройках. Выделив в таблице любое письмо, можно увидеть в нижней панели его содержимое, а двойной щелчок откроет выбранное сообщение в новом окне

Современные почтовые системы позволяют пересылать любые файлы, которые приходят как приложение к сообщению. Само со­общение при этом может и отсутствовать, т. е. пересылается лишь один вложенный файл. Таким образом пересылается отфор­матированный текст, например документы Word, изображения, музы­кальные файлы.

3.3. World Wide Web

Основное назначение WWW - распространение гипертекстовой информации посредством глобальной сети Интернет. Термин World Wide Web в переводе буквально означает «паутина, распростра­няющаяся по всему миру». Система WWW первоначально предна­значалась для использования различными группами специалистов, которые с помощью WWW могли получать доступ к заранее под­готовленной информации. В последующие годы система WWW стремительно развивалась, она стала основой работы в сети Интер­нет. В настоящее время WWW удовлетворяет потребности в ин­формации самых широких слоев пользователей, включая в свой состав сотни тысяч узлов Web. На каждом узле могут быть разме­щены тысячи и сотни тысяч документов.

Термин «гипертекст» был введен в 1969 году, то есть задолго до появления Интернета, и обозначает электронный документ, кото­рый содержат в себе ссылки на другие документы, тексты рисунки.

Ссылки в гипертекстовых документах называются гипер­ссылками. В гипертекстовом документе находятся выделенные слова и графические изображения, при наведении на которые ука­затель мыши обычно превращается в изображение руки с подня­тым указательным пальцем. Эти выделенные объекты и являются гиперссылками. Любая ссылка - это «окно» в другой документ: щелчком мышью по ссылке происходит перемещение в другой до­кумент, на который она указывает.

К основным достоинствам гипертекстов относятся:

  • возможность размещения на небольшом пространстве (в пре­делах нескольких экранов) огромного количества информации;

  • интуитивно понятный способ поиска информации при помощи ссылок.

Гипертекстовые документы, распространяемые в World Wide Web, называются web-страницами. Web-страница обычно содержит разнородную информацию: текст, графику, звуки и даже видео. Множество web-страниц, посвященных одной теме, принадле­жащих одному автору (владельцу) и объединенных между собой с помощью гиперссылок, называется web-узлом или web-сайтом.

Как и любой гипертекстовый документ, web-страница содержит ссылки, щелкая по которым мышью, пользователь переходит к другим документам, изображениям, прочей информации в WWW. За один сеанс работы в сети Интернет пользователь может от­крывать десятки и сотни web-страниц.

3.4. Браузеры

Браузер - программное обеспечение для просмотра web-страниц, их обработки, вывода и перехода от одной страницы к другой.

Браузеры постоянно развивались со времени зарождения сети Интернет и с её ростом становились всё более востребованными программами. Современный браузер - комплексное приложение для обработки и вывода составляющих web-страницы и для предо­ставления интерфейса между web-сайтом и его посетителем.

Практически все популярные браузеры распространяются бес­платно или в комплекте с другими приложениями:

  • Internet Explorer - совместно с Microsoft Windows;

  • Mozilla Firefox - бесплатно, свободное ПО;

  • Safari - совместно с Mac OS или бесплатно для Windows;

  • Opera -бесплатно, начиная с версии 8.50;

  • Google Chrome - бесплатно, свободное ПО;

  • Avant - бесплатно, свободное ПО.

Одним из часто используемых браузеров является Internet Explorer. Браузер Internet Explorer облегчает доступ к ресурсам сети Интернет, позволяя выполнять как поиск новых сведений, так и просмотр полюбившихся web-узлов. Встроенная технология IntelliSense technology позволяет сэкономить время за счет завер­шения обычных действий при работе в Интернете, таких как авто­матическое заполнение web-адресов и форм, а также автоматиче­ского определения состояния сети и подключения.

Окно обозревателя Internet Explorer имеет вид, напоминающий окна большинства Windows-приложений (рис. 6.11).

j 3!aboul:blcink - - [Автономная работе)]

Файл Правка Вид Избранное

Сервис £правка

)««■ о а ш

J~) Поиск

Избранное 0

Адрес! ||Й about:blank

jv] Переход Ссылки "

DAEMON ,!ПЖ Tools M'

Р] ©. <|.

ф DAEMON Took Lite •

ф AstroBurn И Product» » » 0

Готово

jjg

Ф Интернет

Рис. 6.11. Окно программы Internet Explorer

Основные приемы работы с браузером

Работа начинается с ввода в строке адреса требуемого web- адреса. Если адрес используется часто, то отобразится список по­хожих адресов, в котором можно выбрать нужный. Если введен не­верный адрес, обозреватель Internet Explorer может выполнить по­иск похожих адресов, чтобы найти соответствующий.

Кнопки Назад 0 и Вперед 0 позволяют перейти к преды­дущей странице или вернуться к той станице, с которой ушли.

Для поиска web-узлов можно использовать встроенные средства поиска браузера. При нажатии кнопки Поиск на панели инструмен­тов открывается панель Поиск. В строке поиска вводится слово или фраза, описывающая предмет поиска. При отображении результатов поиска можно просмотреть конкретные web-страницы, сохранив при этом список результатов.

Можно также выполнить поиск непосредственно из строки адре­са. После ввода общего имени или слова обозреватель Internet Explorer может автоматически отобразить web-узел, который с наи­большей вероятностью совпадает с поисковым запросом, а также покажет список других узлов с высокой вероятностью совпадения.

При отображении web-страницы обозреватель Internet Explorer поможет заполнить записи в любой web-форме. При вводе отобра­зится список похожих записей, из которых можно сделать выбор.

Журнал позволяет выполнить просмотр списка недавно посе­щенных web-страниц. Кроме того, можно провести поиск в списке или реорганизовать его.

Браузер Internet Explorer может работать в двух основных режи­мах:

  • on-line - работа происходит во то время, когда установлен сеанс связи с удаленным компьютером;

  • off-line - работа производится без установления связи с удален­ным компьютером (автономный режим).

3.5. Поиск информации в Интернете

Как только число документов в какой-либо базе данных превышает критический уровень (обычно начиная с одной-двух сотен), появля­ется необходимость в их систематизации и каком-либо инструменте поиска. В Интернете подобные системы поиска разрабатывались практически с основания сети. Как только устанавливается связь с сервером, возникает задача найти нужный документ или программу.

В начале 1990-х годов для каждого значительного сервера разра­батывалось свое программное поисковое обеспечение, а в описание его работы (help-файле), в первую очередь, включались команды по­иска. Позднее стали появляться надстройки, которые собирали ин­формацию с разных серверов, обобщали и систематизировали ее.

Современный Интернет никому конкретно не принадлежит и ни­кем конкретно не управляется. Если техническая сторона его регла­ментирована протоколами, то в отношении содержания он во мно­гом развивается стихийно и поэтому не имеет четко выраженной структуры. Информация, которая собирается на каком-либо серве­ре, всецело зависит от вкусов и взглядов хозяина сервера. Сориен­тироваться в миллиардах документов без наличия специальных служб поиска практически невозможно.

В настоящее время существует большое количество таких служб. Возглавляет этот список десяток глобальных поисковых систем (поисковых машин), в которых содержится информация о миллионах документов. Наиболее известные поисковые системы: Google, Yahoo, Rambler, Yandex (рис. 6.12).

Рис. 6.12. Окно поисковой системы Google

Некоторые серверы могут иметь свои поисковые системы. Они со­держат много информации и проводят поиск по своим документам. Наконец, крупный сайт может иметь свой маленький поисковый ме­ханизм, который ищет нужные слова на своих страницах.

Поиск требуемой информации производится, прежде всего, в про­странстве web-страниц. Однако можно производить поиск интере­сующих вас теленовостей, адресов электронной почты и даже поиск людей. Последние службы используют различные источники: от те­лефонных справочников до регистрационных списков пользователей разных служб. Отдельные машины производят поиск файлов.

Механизм поиска каждой машины-поисковика представляет собой ноу-хау фирмы. В основном это индексированные базы данных. Но темпы роста числа web- и других документов в сети опережают скорость, с которой обновляются и пополняются базы данных. До недавнего времени эти базы обновлялись каждой службой са­мостоятельно, вручную или с помощью программ-Яауков. В на­стоящее время нередки случаи разделения труда, когда поиско­вые серверы привлекают клиентов бесплатным поиском и соби­рают деньги с рекламодателей, а базы данных покупают у других специализированных компаний.

При поиске любого объекта в сети Интернет используются три основных принципа:

  • поиск по категориям (каталогам, рубрикам);

  • поиск по ключевым словам;

  • поиск по рейтингу (рекомендациям).

Первый напоминает поиск нужного материала в книге по оглавле­нию, второй - по алфавитному указателю, третий - поиск на основа­нии чьей-то рекомендации.

Поиск по категориям

В Интернете собирается информация о web-страницах, и ссылки на них раскладываются по категориям, каталогам. На начальной странице такого сервера можно найти список основных категорий. Названия и количество категорий меняются от сервера к серверу, но они отражают основные сферы человеческих интересов и ориенти­роваться в них легко. Например:

  • искусство и гуманитарные науки;

  • бизнес и экономика;

  • компьютеры и Интернет;

  • образование;

  • развлечения и т. д.

При щелчке на выбранной категории открывается список подка­тегорий, в котором можно выбрать подходящую, и так далее, пока не появится список конкретных web-страниц. Количество разделов и глубина разных каталогов могут существенно различаться.

Составляются каталоги обычно вручную, поэтому охватывают лишь небольшую часть web-пространства. Каталог Yahoo, например, охватывает более миллиона документов, что составляет лишь 0,1 % всех документов. Однако полторы сотни редакторов-специалистов Yahoo обеспечивают отбор и классификацию наиболее ценных доку­ментов, отсеивая малозначащие страницы-однодневки.

Поиск по ключевым словам

Это вторая из наиболее распространенных технологий поиска в сети необходимой информации. Она известна также под именами «поисковых указателей», «индексов». Суть технологии заключается в том, что пользователь отсылает запрос, состоящий из ключевых слов, на центральный сервер. Для формирования запроса на web- странице расположено поле для ввода и редактирования текста, которое может служить визитной карточкой такой технологии. Сервер ищет в своей базе данных ключевые слова и выдает спи­сок документов, которые их включают. Но это лишь видимая вер­шина айсберга.

Эта технология берет свое начало с программ мониторинга сети, которые в начале 1990-х годов разрабатывались в ряде американских университетов. Она состоит из нескольких этапов:

  1. Регулярное сканирование web-pecypcoe и получение данных.

  2. Составление из них базы данных, поискового индекса.

  3. Получение запроса от пользователя, нахождение в базе соответ­ствующих ссылок и возвращение результатов пользователю.

Весь процесс автоматизирован, получение и обновление данных идет непрерывно, благодаря чему подобные поисковые системы име­ют поистине огромные базы проиндексированных web-страниц.

Основу этой автоматизации составляет технология spider (паук). Первый этап выполняется специальными поисковыми про­граммами-роботами, обобщенно именуемыми «пауками», назначе­ние которых - доползти до самых удаленных уголков web- пространства, раскопать новую информацию и принести ее на цен­тральный сервер.

Рождение нового «паука» начинается с появления на сервере но­вого web-адреса. В сети достаточно мест, где черпается информация о новых адресах: списки серверов, телеконференции, регистрационные списки различного рода, где оставляются адреса электронной почты и др. Паук устремляется по указанному ему маршруту, просматривает страницу, копирует ее на сервер, выделяет новые ссылки-адреса, кото­рые есть на этой странице. По новым ссылкам устремляются новые пауки, цикл повторяется снова и снова. Посещенные однажды сайты не остаются забытыми. Они просматриваются регулярно, и вновь появив­шаяся на них информация обновляется также на центральном сервере.

После попадания web-страницы на центральный сервер начинает­ся второй этап - ее обработка и занесение в базу данных, называемую «индексом». Механизмы обработки и индексации обычно не разгла­шаются фирмами. Но суть заключается в том, что страницы перво­начально фильтруются и освобождаются от неключевых слов: предло­гов, союзов, местоимений, а также слов, встречающихся настолько часто, что проводить по ним поиск бессмысленно. В результате такой обработки информация может быть ужата до 60 % от первоначальной.

В ряде систем выполняется морфологический анализ, в процессе которого могут выделяться корни слов, находиться родственные фор­мы, например «человек» - «люди» и т. п. Затем документ заносится в базу данных. Базы данных строятся таким образом, чтобы поиск по ним проходил максимально быстро. В простейшем случае это мо­жет быть постоянно пополняющийся словарь, каждое слово которого связано со ссылками на web-страницы, где оно встречается.

Третий этап - собственно обслуживание запроса клиента. Ключе­вые слова, пришедшие в запросе, сравниваются с содержанием мил­лионов страниц, входящих в индекс, и выдается список нужных.

Отранжированные результаты поиска доставляются клиенту. Они обычно представляют собой список, в котором для каждого докумен­та указан URL, затем следует название, если оно есть, и, возможно, несколько первых строк, помогающих клиенту сориентироваться в назначении документа. Иногда присутствуют даты регистрации документа и его последней проверки.

Найденные ключевые слова выделяются цветом или шрифтом. Иногда присутствует рейтинговое число, выраженное в процентах.

Если результаты поиска не уместились на одной странице, что бывает очень часто, то внизу появляются ссылки на оставшиеся страницы, которые загружаются по мере вызова.

Число страниц, поставляемых вышеописанными поисковыми указателями, обычно велико, поскольку базы данных охватывают до 25 % всех web-ресурсов. Однако качество поиска, выражающееся в том, какой процент ссылок действительно подойдет, оставляет же­лать лучшего.

У разных поисковых серверов существует свой собственный язык запросов с использованием разных операторов. Чаще всего в «сложном поиске» используют следующие операторы:

AND – «И». Этот оператор подразумевает, что в искомом документе обязательно должны содержаться все слова, которые оператор разделяет в запросе. При этом совершенно безразлично, стоят слова рядом или находятся в разных частях документа. Как правило, логическому «И» в запросе соответствует пробел между словами, однако в большинстве случаев вместо пробела можно использовать знак & или +. Знаки + и – в запросе размещаются не так, как в математике, перед любым из них обязательно ставится пробел, а вот с последующим словом они должны находиться в близком соседстве:

Компьютеры +железо

OR –«ИЛИ». В документе должно находиться хотя бы одно из слов, которые разделяет этот оператор. Например: ( садовая OR лесная) +земляника.

Эквивалент знака | . Например, садовая +земляника |клубника

NOT – «без». Подразумевается, что будут выбраны все документы, содержащие слово перед этим оператором, но исключая содержащие слова после него. Этому оператору соответствуют знаки – или ~. Например: реферат +педагогика ~социальная

NEAR – «близко». Подразумевается, что слова, разделенные этим оператором, должны находиться максимально близко друг от друга. Эквивалент – знак &&.

– поиск точного соответствия - знак «!» перед термом: – поиск страниц, где встречается слово в указанной форме, склонении, падеже и т. п.;

 – поиск точной фразы – знак «» – поиск страниц, где искомые слова располагаются строго рядом;

 – задание расстояния между слов - «/n», где n – допустимое количество слов, разделяющих искомые;

 – ограничение по адресам - команда «#url» и др.

Удвоенный оператор используется в тех случаях, когда разделенные им слова надо искать в пределах одного абзаца.

Например: социальная ~ ~педагогика будут найдены все страницы, в которых в каждом абзаце не встречаются слова социальная и педагогика , а в разных абзацах можно.

Помимо операторов при поиске используются разные символы. Это связано с разными падежами, склонениями и т.д.

-Используются * и ? ( как в шаблонах имен) и @ - поиск слов со всеми словоформами.

 

На многих серверах существует свой собственный язык запросов. Набор найденных страниц также будет разный, т.к. у каждой поисковой машины своя база данных.

Так в системе Яндекс, который используется для поиска информации только на русском языку, вместо оператора AND используется символ &, вместо OR - |, а вместо NOT – символ ~. При этом условия, ограничеснные этими операторами, действуют только в пределах абзаца. Если надо, чтобы заданные условия относились ко всему тексту документа, а не к отдельной фразе, операторы надо «удвоить» - например, вместо & поставить &&. Так, по запросу « Виталий && Леонтьев» сервер найдет все документы, где встречаются данное имя и фамилия, пусть даже имя будет в начале документа, а фамилия в конце.

Поиск информации в Яндексе

Например, ввели телевизор LG ( без кавычек) – будут искаться страницы, содержащие слово телевизор И/ ИЛИ слово LG..

  1. можно группировать ключевые слова телевизор ( LG | Samsung)

  2. здесь нет операторов + и -, зато есть оператор -- , который аналогичен знаку – в в Google

  3. можно проводить поиск с учетом морфологии и учитывать расстояние между словами. Например, лучший /2 компьютер что означает, что расстояние между указанными словами не должно превышать 2 единицы. Обычно между соседними словами расстояние 1 единица, следовательно, в запросе между указанными словами может стоять еще одно любое слово и будет осуществляться поиск лучший компьютер лучший персональный компьютер лучший портативный компьютер лучший игровой компьютер и т.д.

Google – зарубежная поисковая машина, ищет сайты на разных языках

Поиск информации в Google .

Учитывает морфологию слов , т.е. найдет искомые слова в разных падежах.

Например, ввели телевизор LG ( без кавычек) – будут искаться страницы, содержащие как два слова вместе ( так как пробел является как бы оператором И), так и страницы, содержащие эти слова не рядом. Для конкретизации поиска:

  1. заключить ключевые слова в кавычки

  1. использовать операторы + и – ( + указывает слова, которые обязательно должны быть в результате, а – слова, которых не должно быть в результате, например + телевизор + LGSamsung в этом случае найдутся телевизоры разных марок, кроме Samsung

  1. при использовании оператора ИЛИ(|) телевизор | LG будут найдены странички, содержащие или одно слово, или другое

  2. использование группировки поисковых слов телевизор ( LG | Samsung) найдутся странички только о телевизорах LG или телевизорах Samsung

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]