
3. Средства телекоммуникационных технологий
3.1. Основные услуги Интернета
В любой компьютерной сети предоставление пользователю конкретного набора услуг осуществляется определенной службой в соответствии с определенным протоколом. Рассмотрим наиболее распространенные услуги Интернета и протоколы, поддерживающие их.
Электронная почта (e-mail) - услуга, позволяющая любому пользователю сети передавать и получать электронные сообщения по адресам электронной почты за короткий промежуток времени в любое время суток. Для передачи сообщения необходимо знать электронный адрес получателя. Работа электронной почты основана на последовательной передаче информации по сети от одного почтового сервера другому, пока сообщение не достигнет адресата. Данная услуга поддерживается группой протоколов (SMTP, РОРЗ и др.).
Usenet - служба телеконференций (группа новостей), осуществляемая по протоколу NNTP (Network News Transfer Protocol - протокол передачи новостей по сети). Выполняет циркулярную рассылку электронной почты - сообщения отправляются на специальный сервер, где они становятся доступными большой группе пользователей для публичного обсуждения. Для удобства обсуждения различных тем созданы специальные группы - Newsgroups, которые объединены в иерархии по областям знаний. В настоящее время телеконференции позволяют передавать файлы любых типов, включая текстовые, графические и аудио файлы.
Серверы Usenet дублируют (частично или полностью) информацию, хранящуюся друг у друга, чтобы их пользователи могли общаться между собой. Однако работают они не синхронно. Каждый из них имеет свои ограничения на объем загружаемой информации с других серверов и сроки ее хранения. Причем администрация сервера сама определяет, какие группы и в каком объеме синхронизовать. Среди факторов, осложняющих публикацию в Usenet, есть и ограничение на объем одной публикации.
Все файлы, имеющиеся в Usenet: музыка, изображения, видео, программное обеспечение, образы дисков, игры и прочие - представлены в текстовой кодировке и прикреплены к сообщению так же, как и в электронной почте.
Telnet - это протокол, позволяющий пользователю использовать ресурсы удаленного компьютера: получать доступ к его файлам, запускать программы.
FTP - услуга, осуществляемая по протоколу FTP {File Transfer Protocol - протокол передачи файлов). Она обеспечивает пересылку файлов между компьютерами сети независимо от их типов, особенностей операционных систем, файловых систем и форматов файлов.
World Wide Web (WWW) - услуга для работы с совокупностью ресурсов, доступных с помощью таких инструментов, как протоколы HTTP, FTP, Telnet и др. Она строится на основе гипертекстового представления информации. Термином WWW или Web называется также организация файлов для размещения на группе серверов в Интернете, запрограммированных для обработки запросов, поступающих от браузеров, работающих на ПК пользователей.
IRC (Internet Relay Ghat - ретранслируемый интернет-разговор) - услуга, предназначенная для прямого общения в Интернете в режиме реального времени путем обмена текстовыми сообщениями. Услуга получила название «чат». Характерной особенностью является коммуникация именно в реальном времени или близкая к этому, что отличает чат от форумов и других «медленных» средств.
Существует несколько разновидностей программной реализации чатов:
Web-чаты - выглядит как обычная web-страница, где можно прочесть последние несколько десятков фраз, написанных участниками чата и модераторами. Первоначально они представляли собой страницу с разговором, содержащую форму для ввода и передачи текста на сервер. Сервер добавлял новые сообщения в текстовую область, удалял старые и обновлял файл. Важно заметить, что такой чат осуществлялся с заметной задержкой в десятки секунд, из-за того, что web-средства не позволяли серверу сообщить клиенту об изменениях — клиент мог только запрашивать данные сам с некоторой периодичностью.
Видео-чаты - это обмен текстовыми сообщениями и транслирование изображений с web-камер. Поначалу это были не видео-, а скорее, фото-чаты: из-за низкой пропускной способности каналов отправлялся не видеопоток, а картинка с некоторыми интервалами, что однако, давало возможность достаточно оперативно наблюдать смену эмоций у собеседника и было значительным прорывом. Позднее, конечно, стал транслироваться видеопоток, хотя и с низким разрешением.
Голосовые чаты тоже явились развитием идей обмена сообщениями. В настоящее время в компьютерных играх широко применяется система TeamSpeak, позволяющая общаться голосом между членами команды, не отвлекаясь от управления игрой. А общение по Skype больше напоминает разговор по телефону, чем чат, хотя возможность отправки обычных текстовых сообщений в нем тоже присутствует.
Телечаты - сообщение передается путем отправки SMS с мобильного телефона, используются на телеканалах MTV, RU.TV, Bridge-TV и др. Чаще всего это объявления о знакомствах или поздравления с праздниками. Также на некоторых каналах ведётся общение с ведущим. Большинство сообщений - платные.
7. Web-форум - класс web-приложений для организации общения посетителей web-сайта. Форум предлагает набор разделов для обсуждения. Работа форума заключается в создании пользователями тем в разделах и последующим обсуждением внутри этих тем. Распространённая иерархия web-форума: разделы —> темы —* сообщения.
Обычно сообщения несут информацию «автор - тема - содержание-дата / время». Сообщение и все ответы на него образует «ветку» или «тему». Отклонение от начальной темы обсуждения часто запрещено правилами форума. За соблюдением правил следят модераторы и администраторы - участники, наделённые возможностью редактировать, перемещать и удалять чужие сообщения в определённом разделе или теме, а также контролировать к ним доступ отдельных зарегистрированных участников, а иногда и незарегистрированных - гостей.
На форумах может применяться гибкое разграничение доступа к сообщениям. Так, на одних форумах чтение и создание новых сообщений доступны любым случайным посетителям, на других необходима предварительная регистрация - те и другие форумы называют открытыми. Применяется и смешанный вариант - когда отдельные темы могут быть доступны для размещения сообщений всем посетителям, а другие - только зарегистрированным участникам. Кроме открытых, существуют закрытые форумы, доступ к которым определяется персонально для каждого участника администраторами форума. На практике также нередко встречается вариант, когда некоторые разделы форума общедоступны, а остальная часть доступна только узкому кругу участников.
При регистрации участники форума могут создавать свои профили - страницы со сведениями о себе.
Каждый конкретный форум имеет свою тематику - достаточно широкую, чтобы в ее пределах можно было вести многоплановое обсуждение.
Форум отличается от чата разделением обсуждаемых тем и возможностью общения не в реальном времени. Это располагает к более серьёзным обсуждениям, поскольку предоставляет отвечающим больше времени на обдумывание ответа. Форумы часто используются для разного рода консультаций, в работе служб технической поддержки.
В настоящее время web-форумы почти полностью вытеснили новостные группы на базе NNTP и являются одним из наиболее популярных способов обсуждения вопросов во всемирной паутине.
IPTV (Internet Protocol Television) - цифровое интерактивное телевидение в сетях передачи данных по протоколу IP, новое поколение телевидения.
IP-телефония - технология, использующая протокол IP в качестве основного средства передачи голоса. Для обозначения этого явления используется также аббревиатура VoIP, которая расшифровывается как Voice over IP, то есть голос поверх протокола IP.
Интернет-телефония - частный случай IP-телефонии, когда в качестве линий передачи телефонного трафика используются каналы сети Интернет, позволяет устанавливать соединение по схемам компьютер-телефон и компьютер-компьютер.
3.2. Электронная почта
Система электронной почты позволяет доставить сообщение на любой компьютер, включенный в сеть Интернет. Сообщение может содержать текст или файл любого формата - графику, музыку и т. д.
Все пользователи электронной почты имеют уникальные адреса. Адрес пользователя зарегистрирован в определенном домене сети Интернет. С каждым доменом связан почтовый сервер, управляющий адресами пользователей. Пользователь набирает текст письма в программе, которая называется почтовым клиентом, позволяет создавать и редактировать новые письма, обрабатывать пришедшие, хранить и систематизировать переписку и т. д.
Почтовый клиент помещает письмо в «почтовый ящик» пользователя, расположенный на почтовом сервере. Сервер, в свою очередь, передает письмо на почтовый сервер адресата. Почтовые серверы обмениваются сообщениями в автоматическом режиме, причем маршрут движения сообщения в сети рассчитывается специальной программой-маршрутизатором. Когда сообщение прибывает на почтовый сервер, пользователь при очередном соединении с сервером получает уведомление о поступлении почты.
Вместе с Internet Explorer устанавливается почтовая программа Outlook Express, предназначенная для обработки электронной почты. Она является модифицированной версией программы Outlook, которая входит в комплект Microsoft Office и служит для автоматизации офисной работы.
Интерфейс почтовой программы построен таким образом, что в одном окне открываются несколько панелей, позволяющих быстро сориентироваться в потоке почты (рис. 6.8). Прежде всего, это панель Папки, расположенная с левой стороны. Пункт Локальные папки включает следующие:
Входящие - папка, в которую будут поступать письма с сервера.
Исходящие - содержит письма, подготовленные к отправке.
Отправленные - в этой папке остаются копии всех отправленных писем.
Удаленные - папка является аналогом Корзины в Windows. Все удаленные сообщения перемещаются сюда.
Черновики - здесь хранятся заготовки и черновики писем.
Outlook
fcxores
Рис. 6.8. Окно программы Outlook
Express
Последние три папки являются вспомогательными. С правой стороны расположены панели-фреймы для экспресс-просмотра содержимого папок. Если открыть какую-либо из папок {Входящие, Исходящие и т. д.), правая часть окна Outlook Express окажется разделенной на две части: верхнюю и нижнюю. В верхней части будет показано содержимое текущей папки, а в нижней - текст сообщения. На рисунке 6.9 приведена иллюстрация для папки Входящие.
Программы электронной почты нуждаются в настройке, которая обычно происходит при первом запуске с помощью Мастера подключения. Для работы с почтой требуется отдельная учетная запись. Учетных записей может быть несколько. Для создания учетной записи нужно указать:
имя и фамилию, которые будут отображаться в строке «От кого» корреспонденции;
полный адрес электронной почты (обычно состоит из сочетания имени пользователя и названия поставщика услуг Интернета - провайдера, разделенных знаком @ и точками);
адрес почтового сервера провайдера, который занимается отправкой почты с использованием протокола SMTP и соответственно называется SMTP-сервер;
адрес почтового сервера, принимающего почту ( может быть IMAP или POP3), называется POP-сервер (адреса обоих серверов могут совпадать); имя пользователя, по которому компьютер будет вас идентифицировать (login); пароль.
Fhc.
6.9. Папка
ИхоОящие
Работа программы Outlook Express после запуска и подключения к сети Интернет начинается с проверки поступления почты. В дальнейшем программа автоматически проверяет поступления каждые 30 минут. При появлении новых сообщений в правом ния^ нем углу окна появляется значок конверта.
Программа Outlook Express построена таким образом, что позволяет сразу ознакомиться с содержимым пришедшей почты в папке Входящие. Если папка не пустая, т. е. в ней содержатся какие-либо пришедшие письма, то ее название будет выделено жирным шрифтом.
Вновь пришедшие и не отсортированные письма располагаются в виде таблицы, где указаны отправитель и тема письма, обозначенная автором при отправлении. Кроме того, в начале таблицы перед этими записями можно встретить и другие значки:
восклицательный знак t - письмо повышенной важности;
- сообщение не срочное;
наличие скрепки ^ означает, что в письме есть вложенный файл, который можно отдельно просмотреть при наличии соответствующих программ или сохранить в виде файла;
флагом У помечаются сообщения, удовлетворяющие определенным условиям;
закрытый конверт и текст, выделенный жирным шрифтом, обозначают непрочитанные письма;
открытый конверт - письмо просмотрено.
Наличие колонок, в которых появляются значки, регулируется в настройках. Выделив в таблице любое письмо, можно увидеть в нижней панели его содержимое, а двойной щелчок откроет выбранное сообщение в новом окне
Современные почтовые системы позволяют пересылать любые файлы, которые приходят как приложение к сообщению. Само сообщение при этом может и отсутствовать, т. е. пересылается лишь один вложенный файл. Таким образом пересылается отформатированный текст, например документы Word, изображения, музыкальные файлы.
3.3. World Wide Web
Основное назначение WWW - распространение гипертекстовой информации посредством глобальной сети Интернет. Термин World Wide Web в переводе буквально означает «паутина, распространяющаяся по всему миру». Система WWW первоначально предназначалась для использования различными группами специалистов, которые с помощью WWW могли получать доступ к заранее подготовленной информации. В последующие годы система WWW стремительно развивалась, она стала основой работы в сети Интернет. В настоящее время WWW удовлетворяет потребности в информации самых широких слоев пользователей, включая в свой состав сотни тысяч узлов Web. На каждом узле могут быть размещены тысячи и сотни тысяч документов.
Термин «гипертекст» был введен в 1969 году, то есть задолго до появления Интернета, и обозначает электронный документ, который содержат в себе ссылки на другие документы, тексты рисунки.
Ссылки в гипертекстовых документах называются гиперссылками. В гипертекстовом документе находятся выделенные слова и графические изображения, при наведении на которые указатель мыши обычно превращается в изображение руки с поднятым указательным пальцем. Эти выделенные объекты и являются гиперссылками. Любая ссылка - это «окно» в другой документ: щелчком мышью по ссылке происходит перемещение в другой документ, на который она указывает.
К основным достоинствам гипертекстов относятся:
возможность размещения на небольшом пространстве (в пределах нескольких экранов) огромного количества информации;
интуитивно понятный способ поиска информации при помощи ссылок.
Гипертекстовые документы, распространяемые в World Wide Web, называются web-страницами. Web-страница обычно содержит разнородную информацию: текст, графику, звуки и даже видео. Множество web-страниц, посвященных одной теме, принадлежащих одному автору (владельцу) и объединенных между собой с помощью гиперссылок, называется web-узлом или web-сайтом.
Как и любой гипертекстовый документ, web-страница содержит ссылки, щелкая по которым мышью, пользователь переходит к другим документам, изображениям, прочей информации в WWW. За один сеанс работы в сети Интернет пользователь может открывать десятки и сотни web-страниц.
3.4. Браузеры
Браузер - программное обеспечение для просмотра web-страниц, их обработки, вывода и перехода от одной страницы к другой.
Браузеры постоянно развивались со времени зарождения сети Интернет и с её ростом становились всё более востребованными программами. Современный браузер - комплексное приложение для обработки и вывода составляющих web-страницы и для предоставления интерфейса между web-сайтом и его посетителем.
Практически все популярные браузеры распространяются бесплатно или в комплекте с другими приложениями:
Internet Explorer - совместно с Microsoft Windows;
Mozilla Firefox - бесплатно, свободное ПО;
Safari - совместно с Mac OS или бесплатно для Windows;
Opera -бесплатно, начиная с версии 8.50;
Google Chrome - бесплатно, свободное ПО;
Avant - бесплатно, свободное ПО.
Одним из часто используемых браузеров является Internet Explorer. Браузер Internet Explorer облегчает доступ к ресурсам сети Интернет, позволяя выполнять как поиск новых сведений, так и просмотр полюбившихся web-узлов. Встроенная технология IntelliSense technology позволяет сэкономить время за счет завершения обычных действий при работе в Интернете, таких как автоматическое заполнение web-адресов и форм, а также автоматического определения состояния сети и подключения.
Окно обозревателя Internet Explorer имеет вид, напоминающий окна большинства Windows-приложений (рис. 6.11).
j
3!aboul:blcink
-
- [Автономная работе)]
Файл
Правка Вид Избранное
Сервис
£правка
)««■
о а ш
J~)
Поиск
Избранное
0
Адрес!
||Й about:blank
jv]
Переход
Ссылки "
DAEMON
,!ПЖ
Tools
M'
Р]
©. <|.
ф
DAEMON
Took Lite •
ф
AstroBurn
И
Product»
»
» 0
Готово
jjg
Ф
Интернет
Рис. 6.11. Окно программы Internet
Explorer
Основные приемы работы с браузером
Работа начинается с ввода в строке адреса требуемого web- адреса. Если адрес используется часто, то отобразится список похожих адресов, в котором можно выбрать нужный. Если введен неверный адрес, обозреватель Internet Explorer может выполнить поиск похожих адресов, чтобы найти соответствующий.
Кнопки Назад 0 и Вперед 0 позволяют перейти к предыдущей странице или вернуться к той станице, с которой ушли.
Для поиска web-узлов можно использовать встроенные средства поиска браузера. При нажатии кнопки Поиск на панели инструментов открывается панель Поиск. В строке поиска вводится слово или фраза, описывающая предмет поиска. При отображении результатов поиска можно просмотреть конкретные web-страницы, сохранив при этом список результатов.
Можно также выполнить поиск непосредственно из строки адреса. После ввода общего имени или слова обозреватель Internet Explorer может автоматически отобразить web-узел, который с наибольшей вероятностью совпадает с поисковым запросом, а также покажет список других узлов с высокой вероятностью совпадения.
При отображении web-страницы обозреватель Internet Explorer поможет заполнить записи в любой web-форме. При вводе отобразится список похожих записей, из которых можно сделать выбор.
Журнал позволяет выполнить просмотр списка недавно посещенных web-страниц. Кроме того, можно провести поиск в списке или реорганизовать его.
Браузер Internet Explorer может работать в двух основных режимах:
on-line - работа происходит во то время, когда установлен сеанс связи с удаленным компьютером;
off-line - работа производится без установления связи с удаленным компьютером (автономный режим).
3.5. Поиск информации в Интернете
Как только число документов в какой-либо базе данных превышает критический уровень (обычно начиная с одной-двух сотен), появляется необходимость в их систематизации и каком-либо инструменте поиска. В Интернете подобные системы поиска разрабатывались практически с основания сети. Как только устанавливается связь с сервером, возникает задача найти нужный документ или программу.
В начале 1990-х годов для каждого значительного сервера разрабатывалось свое программное поисковое обеспечение, а в описание его работы (help-файле), в первую очередь, включались команды поиска. Позднее стали появляться надстройки, которые собирали информацию с разных серверов, обобщали и систематизировали ее.
Современный Интернет никому конкретно не принадлежит и никем конкретно не управляется. Если техническая сторона его регламентирована протоколами, то в отношении содержания он во многом развивается стихийно и поэтому не имеет четко выраженной структуры. Информация, которая собирается на каком-либо сервере, всецело зависит от вкусов и взглядов хозяина сервера. Сориентироваться в миллиардах документов без наличия специальных служб поиска практически невозможно.
В настоящее время существует большое количество таких служб. Возглавляет этот список десяток глобальных поисковых систем (поисковых машин), в которых содержится информация о миллионах документов. Наиболее известные поисковые системы: Google, Yahoo, Rambler, Yandex (рис. 6.12).
Рис. 6.12. Окно
поисковой системы Google
Некоторые серверы могут иметь свои поисковые системы. Они содержат много информации и проводят поиск по своим документам. Наконец, крупный сайт может иметь свой маленький поисковый механизм, который ищет нужные слова на своих страницах.
Поиск требуемой информации производится, прежде всего, в пространстве web-страниц. Однако можно производить поиск интересующих вас теленовостей, адресов электронной почты и даже поиск людей. Последние службы используют различные источники: от телефонных справочников до регистрационных списков пользователей разных служб. Отдельные машины производят поиск файлов.
Механизм поиска каждой машины-поисковика представляет собой ноу-хау фирмы. В основном это индексированные базы данных. Но темпы роста числа web- и других документов в сети опережают скорость, с которой обновляются и пополняются базы данных. До недавнего времени эти базы обновлялись каждой службой самостоятельно, вручную или с помощью программ-Яауков. В настоящее время нередки случаи разделения труда, когда поисковые серверы привлекают клиентов бесплатным поиском и собирают деньги с рекламодателей, а базы данных покупают у других специализированных компаний.
При поиске любого объекта в сети Интернет используются три основных принципа:
поиск по категориям (каталогам, рубрикам);
поиск по ключевым словам;
поиск по рейтингу (рекомендациям).
Первый напоминает поиск нужного материала в книге по оглавлению, второй - по алфавитному указателю, третий - поиск на основании чьей-то рекомендации.
Поиск по категориям
В Интернете собирается информация о web-страницах, и ссылки на них раскладываются по категориям, каталогам. На начальной странице такого сервера можно найти список основных категорий. Названия и количество категорий меняются от сервера к серверу, но они отражают основные сферы человеческих интересов и ориентироваться в них легко. Например:
искусство и гуманитарные науки;
бизнес и экономика;
компьютеры и Интернет;
образование;
развлечения и т. д.
При щелчке на выбранной категории открывается список подкатегорий, в котором можно выбрать подходящую, и так далее, пока не появится список конкретных web-страниц. Количество разделов и глубина разных каталогов могут существенно различаться.
Составляются каталоги обычно вручную, поэтому охватывают лишь небольшую часть web-пространства. Каталог Yahoo, например, охватывает более миллиона документов, что составляет лишь 0,1 % всех документов. Однако полторы сотни редакторов-специалистов Yahoo обеспечивают отбор и классификацию наиболее ценных документов, отсеивая малозначащие страницы-однодневки.
Поиск по ключевым словам
Это вторая из наиболее распространенных технологий поиска в сети необходимой информации. Она известна также под именами «поисковых указателей», «индексов». Суть технологии заключается в том, что пользователь отсылает запрос, состоящий из ключевых слов, на центральный сервер. Для формирования запроса на web- странице расположено поле для ввода и редактирования текста, которое может служить визитной карточкой такой технологии. Сервер ищет в своей базе данных ключевые слова и выдает список документов, которые их включают. Но это лишь видимая вершина айсберга.
Эта технология берет свое начало с программ мониторинга сети, которые в начале 1990-х годов разрабатывались в ряде американских университетов. Она состоит из нескольких этапов:
Регулярное сканирование web-pecypcoe и получение данных.
Составление из них базы данных, поискового индекса.
Получение запроса от пользователя, нахождение в базе соответствующих ссылок и возвращение результатов пользователю.
Весь процесс автоматизирован, получение и обновление данных идет непрерывно, благодаря чему подобные поисковые системы имеют поистине огромные базы проиндексированных web-страниц.
Основу этой автоматизации составляет технология spider (паук). Первый этап выполняется специальными поисковыми программами-роботами, обобщенно именуемыми «пауками», назначение которых - доползти до самых удаленных уголков web- пространства, раскопать новую информацию и принести ее на центральный сервер.
Рождение нового «паука» начинается с появления на сервере нового web-адреса. В сети достаточно мест, где черпается информация о новых адресах: списки серверов, телеконференции, регистрационные списки различного рода, где оставляются адреса электронной почты и др. Паук устремляется по указанному ему маршруту, просматривает страницу, копирует ее на сервер, выделяет новые ссылки-адреса, которые есть на этой странице. По новым ссылкам устремляются новые пауки, цикл повторяется снова и снова. Посещенные однажды сайты не остаются забытыми. Они просматриваются регулярно, и вновь появившаяся на них информация обновляется также на центральном сервере.
После попадания web-страницы на центральный сервер начинается второй этап - ее обработка и занесение в базу данных, называемую «индексом». Механизмы обработки и индексации обычно не разглашаются фирмами. Но суть заключается в том, что страницы первоначально фильтруются и освобождаются от неключевых слов: предлогов, союзов, местоимений, а также слов, встречающихся настолько часто, что проводить по ним поиск бессмысленно. В результате такой обработки информация может быть ужата до 60 % от первоначальной.
В ряде систем выполняется морфологический анализ, в процессе которого могут выделяться корни слов, находиться родственные формы, например «человек» - «люди» и т. п. Затем документ заносится в базу данных. Базы данных строятся таким образом, чтобы поиск по ним проходил максимально быстро. В простейшем случае это может быть постоянно пополняющийся словарь, каждое слово которого связано со ссылками на web-страницы, где оно встречается.
Третий этап - собственно обслуживание запроса клиента. Ключевые слова, пришедшие в запросе, сравниваются с содержанием миллионов страниц, входящих в индекс, и выдается список нужных.
Отранжированные результаты поиска доставляются клиенту. Они обычно представляют собой список, в котором для каждого документа указан URL, затем следует название, если оно есть, и, возможно, несколько первых строк, помогающих клиенту сориентироваться в назначении документа. Иногда присутствуют даты регистрации документа и его последней проверки.
Найденные ключевые слова выделяются цветом или шрифтом. Иногда присутствует рейтинговое число, выраженное в процентах.
Если результаты поиска не уместились на одной странице, что бывает очень часто, то внизу появляются ссылки на оставшиеся страницы, которые загружаются по мере вызова.
Число страниц, поставляемых вышеописанными поисковыми указателями, обычно велико, поскольку базы данных охватывают до 25 % всех web-ресурсов. Однако качество поиска, выражающееся в том, какой процент ссылок действительно подойдет, оставляет желать лучшего.
У разных поисковых серверов существует свой собственный язык запросов с использованием разных операторов. Чаще всего в «сложном поиске» используют следующие операторы:
AND – «И». Этот оператор подразумевает, что в искомом документе обязательно должны содержаться все слова, которые оператор разделяет в запросе. При этом совершенно безразлично, стоят слова рядом или находятся в разных частях документа. Как правило, логическому «И» в запросе соответствует пробел между словами, однако в большинстве случаев вместо пробела можно использовать знак & или +. Знаки + и – в запросе размещаются не так, как в математике, перед любым из них обязательно ставится пробел, а вот с последующим словом они должны находиться в близком соседстве:
Компьютеры +железо
OR –«ИЛИ». В документе должно находиться хотя бы одно из слов, которые разделяет этот оператор. Например: ( садовая OR лесная) +земляника.
Эквивалент знака | . Например, садовая +земляника |клубника
NOT – «без». Подразумевается, что будут выбраны все документы, содержащие слово перед этим оператором, но исключая содержащие слова после него. Этому оператору соответствуют знаки – или ~. Например: реферат +педагогика ~социальная
NEAR – «близко». Подразумевается, что слова, разделенные этим оператором, должны находиться максимально близко друг от друга. Эквивалент – знак &&.
– поиск точного соответствия - знак «!» перед термом: – поиск страниц, где встречается слово в указанной форме, склонении, падеже и т. п.;
– поиск точной фразы – знак «» – поиск страниц, где искомые слова располагаются строго рядом;
– задание расстояния между слов - «/n», где n – допустимое количество слов, разделяющих искомые;
– ограничение по адресам - команда «#url» и др.
Удвоенный оператор используется в тех случаях, когда разделенные им слова надо искать в пределах одного абзаца.
Например: социальная ~ ~педагогика будут найдены все страницы, в которых в каждом абзаце не встречаются слова социальная и педагогика , а в разных абзацах можно.
Помимо операторов при поиске используются разные символы. Это связано с разными падежами, склонениями и т.д.
-Используются * и ? ( как в шаблонах имен) и @ - поиск слов со всеми словоформами.
На многих серверах существует свой собственный язык запросов. Набор найденных страниц также будет разный, т.к. у каждой поисковой машины своя база данных.
Так в системе Яндекс, который используется для поиска информации только на русском языку, вместо оператора AND используется символ &, вместо OR - |, а вместо NOT – символ ~. При этом условия, ограничеснные этими операторами, действуют только в пределах абзаца. Если надо, чтобы заданные условия относились ко всему тексту документа, а не к отдельной фразе, операторы надо «удвоить» - например, вместо & поставить &&. Так, по запросу « Виталий && Леонтьев» сервер найдет все документы, где встречаются данное имя и фамилия, пусть даже имя будет в начале документа, а фамилия в конце.
Поиск информации в Яндексе
Например, ввели телевизор LG ( без кавычек) – будут искаться страницы, содержащие слово телевизор И/ ИЛИ слово LG..
можно группировать ключевые слова телевизор ( LG | Samsung)
здесь нет операторов + и -, зато есть оператор -- , который аналогичен знаку – в в Google
можно проводить поиск с учетом морфологии и учитывать расстояние между словами. Например, лучший /2 компьютер что означает, что расстояние между указанными словами не должно превышать 2 единицы. Обычно между соседними словами расстояние 1 единица, следовательно, в запросе между указанными словами может стоять еще одно любое слово и будет осуществляться поиск лучший компьютер лучший персональный компьютер лучший портативный компьютер лучший игровой компьютер и т.д.
Google – зарубежная поисковая машина, ищет сайты на разных языках
Поиск информации в Google .
Учитывает морфологию слов , т.е. найдет искомые слова в разных падежах.
Например, ввели телевизор LG ( без кавычек) – будут искаться страницы, содержащие как два слова вместе ( так как пробел является как бы оператором И), так и страницы, содержащие эти слова не рядом. Для конкретизации поиска:
заключить ключевые слова в кавычки
использовать операторы + и – ( + указывает слова, которые обязательно должны быть в результате, а – слова, которых не должно быть в результате, например + телевизор + LG –Samsung в этом случае найдутся телевизоры разных марок, кроме Samsung
при использовании оператора ИЛИ(|) телевизор | LG будут найдены странички, содержащие или одно слово, или другое
использование группировки поисковых слов телевизор ( LG | Samsung) найдутся странички только о телевизорах LG или телевизорах Samsung