Добавил:
ilirea@mail.ru Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
110
Добавлен:
22.08.2018
Размер:
266.75 Кб
Скачать

Роботы индексов или поисковые машины.

Поисковые машины устроены несколько иначе. По сути, это сер­вер с огромной базой данных URL- адресов, который автоматически обращается к страницам WWW по всем этим адресам, изучает содер­жимое этих страниц, формирует и прописывает ключевые слова со страниц в свою базу данных (индек­сирует страницы). Более того, этот сервер обращается по всем встреча­емым на страницах ссылкам, и пе­реходя к новым страницам, проде­лывает с ними то же самое. Так как почти любая страница WWW имеет множество ссылок на другие стра­ницы, то при подобной работе поис­ковая машина в конечном результате теоретически может обойти все сайты вInternetе. Самая популяр­ная поисковая машинаAltaVista' (www.altavista.com) содержит11 миллиардов слов, извлеченных из 30 миллионов WWW-страниц. Как пользоваться этим сервисом? Необ­ходимо продумать строку запроса информации (не более чем 5 слов), как в случае с Yahoo!, и также набрать ее в поле ввода. Над кноп­кой Search (Поиск) находится нис­падающее меню с выбором языка. Перед нажатием Enter или кнопки Search необходимо выбрать язык представления информации. Кро­ме того, в запрос информации мож­но включать специальный символ "*", расширяющий диапазон поис­ка. Скажем, чтобы AltaVista могла найти не только все вхождения слова "легкая", но слова "легкую", "легкой" я т.д., в запросе надо писать "легк**", т.е. изменяющи­еся буквы в окончании заменяем на символ "*".

Как и случае поисковых каталогов, для поиска в русскоязычномInternetеAltaVistaне очень подходит. Наиболее развитый сервис поиска русскоязычной информации пре­доставляет серверЯandex (www.yandex.ru). ВЯandex можно просто написать по-русски фразу, описывающую то, что надо найти. Система сама проанализирует, обработает запрос и найдет все, что относится к теме запроса. В случае, если нужных документов система не обнаружит, можно продолжить поиск черезAlta Vista, куда автоматически передается обработанный системой запрос.

Проблема больше состоит в том, что поисковая машина в результате вашего запроса генериррует гигантский список адресов с короткими описаниями. Яndexпозволяет конкретизировать запрос для сокращения этого списка до разумных пределов.

Стоит вспомнить еще о популярной российской поисковой машинеRambler (www.rambler.ru). У этого сервера еще болееполная база данных адресов URL. Отличительной чертойRamblerявляется то, что этот сервер ведет статистику посещаемости ссылок из собственной базы данных.

Rambler позволяет кроме простого запроса использовать так же запрос с языком запросов. Поддержживаются логические операторы И, ИЛИ, НЕ, метасимвол «*», коэффициентные символ «+» и «-» для уменьшения или увеличения значимости вводимых слов.

Среди рускоязычных поисковых машин можно так же выделить Апорт (www.aport.ru) и АУ (www.au.ru).

Поисковые машины и поисковые каталоги имеют сегодня много общего. У каталогов присутствует возможность поиска информации по строке запроса с использованием логических операторов, а поисковые машины содержат свои собственные тематические каталоги.

Синтаксис запроса Яndex

Оператор

Пример

Результат

пробел или Логическое И (краткое - в пределах одного абзаца)

Пример: легкая промышленность.

Результат: все документы, где в преде­лах одного абзаца встречаются слово 'легкая' и 'промышленность'.

&&логическое И (в пределах документа)

Пример: легкая&&промышленность

Результат: все документы, где встреча­ются слово 'легкая' и 'промышленность'

,или|логическое ИЛИ

Пример: легкая, промышленность

Результат: все документы, где встречает­ся либо слово 'легкая', либо слово 'промышленность"

~ бинарный оператор И НЕ (в пределах одного абзаца)

Пример: производство~газета

Результат:все документы, где е преде­лах одного абзаца встречается слово "производство', но не в словосочетании ' газета производство'

~~бинарный оператор И НЕ (в пределах документа)

Пример: производство~~газета

Результат: все документы, где встречается слово 'производство', но не с словосочетании 'газета производство'

()группирование слов

Пример: (швейное&&производство)~газета

Результат: все документы, где ветречаются слова 'швейное' и 'производство' не в словосочетании со словом 'газета '

/(число) расстояние в словах, где'число" - число слов между словами в запросе плюс единица.

Пример: швейное/* производство

Результат: все документы, где встреч ся словосочетание "швейное производство”

E-mail.

Электронная почта – одна из самых старых служб Interneta. Сегодня, наряду с обычной (классической) электронной почтой (e-mail) широкое распространение получила и другая служба обмена почтовыми сообщениями – почта на основеWWW(Web-mail).

Преимущества e-mail:

  • Электронные сообщения легко посылать и читать, на них легко отвечать, ими легко управлять.

  • Электронная почта оперативна и удобна. В процессе своего развития она из простого сервиса, предлагаемого исследователям для обмена идеями и результатами разработок, превратилась в сложную систему.

  • У электронной почты есть много преимуществ по сравнению с обычными способами передачи сообщений, такими как традиционная почта или факсимильная связь.

  • Значительно легче подготовить электронное письмо, чем. например, написать на бумаге обычное письмо. Электронное письмо может быть написано и прочитано в любой момент. Это позволяет очень занятым людям находить подходящее время для работы со своей электронной корреспонденцией.

  • Электронная почта - это глобальная система, позволяющая передавать письма в любую точку мира за считанные минуты, независимо от времени суток.

  • Кроме этого, электронная почта очень экономична. Переслать электронное сообщение стоит значительно дешевле, чем отправить обычное письмо или сделать междугородный, а тем более международный телефонный звонок.

  • Для электронного письма не нужно бумаги и его легко уничтожить.

Таким образом, электронная почта является великолепным средством общения, которое решает множество проблем и при этом не порождает новых.

Электронная почта является самой старой службой Интернета. Свое существование она начала еще в 70-е годы. Каждый пользователь компьютера, включившись в Интернет, получает свой личный адрес (как, впрочем, и в локальной сети). Теперь он может принимать по Интернету электронные письма, а также отправлять письма другим абонентам сети. Интернетовский адрес - это очень большое двоичное число, по которому можно определить, через какие узлы связи нужно с этим абонентом соединяться. Но поскольку человеку неудобно пользоваться длинным цифровым адресом, каждому абоненту присваивают еще и собственное имя. Машина сама, если требуется, превращает это имя в нужный цифровой адрес.

Для организации службы электронной почты пользователь должен получить электронный адрес. Адрес электронной почты имеет следующий шаблон: имя_пользователя@доменное_имя. Собственное имя – это уникальное имя пользователя или псевдоним.

Значок @ (иногда его называют собачкой, плюшкой и даже загогулиной) есть в алфавите любого компьютера и предназначен для отделения собственного имени в электронном адресе от имени доменного. Доменные имена назначаются компьютеру специальной организацией под названием InterNIC. Существует такая система проверок и регистраций, при которой один и тот же адрес не может быть присвоен разным компьютерам. Составные части адреса, начав с конкретного пользователя, указывают в конце крупную группу (домен), куда он входит. В частности, последняя часть имени означает: edu - американские университеты, образование, com - коммерческие группы, gov - правительственные организации, ru - Россия, ua - Украина, ca - Канада, mv - Мальдивские острова, be - Бельгия, mt - Мальта и так далее. Указав адрес, вы можете любому абоненту Интернета послать письмо, предварительно заготовленное на диске или сразу же набранное на клавиатуре.

Электронная почта основана на взаимодействии серверных и клиентских программ. Для функционирования электронной почты на компьютере пользователя устанавливается программа почтовый клиент. Для пользователей ОС Windowsтаким почтовым клиентом является программаOutlookExpress. Наиболее мощными почтовыми клиентами в настоящее время являютсяThe Bat! и Eudora.

На серверах, занимающихся обслуживанием электронной почты, устанавливаются соответствующие серверные программы.

Прием и отправка почты в системе e-mailрассматриваются как две разные услуги. Соответственно существуют и два разных протокола: протоколSMPT(SimpleMailTransferProtocol) для отправки почты и протоколPOP3 (PostOfficeProtocol) для приема почтовых сообщений.

Наличие двух протоколов в системе электронной почты связано с разным характером отправляемых и получаемых сообщений. При отправке почты протокол SMPTне проверяет данные пользователя – в этом просто нет необходимости. Однако при получении почты данные пользователя проверяются протоколомPOP3 (посторонний пользователь не должен иметь доступа к чужой корреспонденции).

Проблемы e-mail.

Проблема кодировки.E-mailизначально заимствовала принципы работы телеграфа. По обычному телеграфу никто ничего кроме букв и цифр никогда не передавал. Набор букв и цифр кодируется первыми 128 кодами таблицы символовASCII, поэтому протоколUUPI, принятый когда-то для обмена сообщениями вe-mailобрабатывает только первые семь бит в каждом байте, отбрасывая старший, восьмой бит. А это означает:

  • что по e-mailневозможно в принципе переслать ничего, кроме текста, поскольку в рисунках, музыке и т.д. могут использоваться восьмибитные коды от 0 до 255;

  • возникает проблема с отправкой сообщений, написанных на национальных языках, так для их кодировки используются коды от 128 до 255.

Что касается проблемы пересылки нетекстовых файлов, то эта проблема решена просто – вся нетекстовая информация отправляется в виде так называемых «присоединенных файлов» - дополнительных почтовых вложений. Современные почтовые клиенты позволяют присоединить в двоичном коде к почтовому сообщению любой нетекстовый файл.

Что касается национальных алфавитов, то эта проблему существует и особенно остро стоит в странах, где используется для создания сообщений русский язык. Дело в том, что для русскоязычных сообщений одновременно существуют и используются на практике несколько кодировок: кодировка КОИ-8, кодировка Windowsи устаревшая кодировка дляMSDOS. Все кодировки используют 8-битный код. Если письмо с таким кодом пройдет через цепочку зарубежных серверов, то они (основанные на 7-битной кодировке) отрежут «ненужный» 8-ой бит и письмо станет нечитаемым.

Есть несколько способов решения данной проблемы:

  1. Можно использовать так называемую транслитерацию (русскоязычный текст пишется латинскими буквами)

  2. Если зарубежный адресат имеет на своем компьютере крилличные шрифты, то можно написать письмо в обычном текстовом редакторе (MSWord, например), упаковать архиватором и отправить как вложение к пустому письму.

  3. Можно отправить письмо как графику в графическом формате. Чаще всего используют для этой цели формат PDF, который поддерживает бесплатно распространяемая программаAcrobat Reader. ФорматPDFпозволяет достаточно компактно сохранять документы – иногда удается небольшую книжку поместить в несколько Кбайт.

Соседние файлы в папке информатика