Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Организация информационного поиска.docx
Скачиваний:
19
Добавлен:
20.05.2015
Размер:
49.87 Кб
Скачать
  1. Мессенджеры-программы или сервисы для мгновенного обмена сообщениями, голосовой связи и видеосвязи в сети Интернет.

Система мгновенного обмена сообщениями, Система обмена мгновенными сообщениями (англ. Instant messaging, IM) — службы мгновенных сообщений (Instant Messaging Service, IMS), программы онлайн-консультанты (OnlineSaler) и программы-клиенты (Instant Messenger, IM) для обмена сообщениями в реальном времени через Интернет. Могут передаваться текстовые сообщения, звуковые сигналы, изображения, видео, а также производиться такие действия, как совместное рисование или игры. Многие из таких программ-клиентов могут применяться для организации групповых текстовых чатов или видеоконференций.

Почтовые системы на основе WWW обеспечивают обмен сообщениями в режиме оффлайн осуществляется за счет взаимодействие двух программ – почтового сервера и почтового клиента.

Служба IRC (Internet Relay Chat или Чат) является первым средством для онлайнового общения, которая предоставляет большой выбор каналов (тем) для проведения дискуссий. Сеть IRC, разделилась на несколько (DALnet, IRCnet, UNDERnet, RusNet, WeNet, IrcNet.ru и т.д.).

Служба мгновенных сообщений ( Instant Messaging Service, IMS). Кроме текстовых сообщений можно передавать, звуковые сигналы, картинки, видео, файлы.(ICQ , Skype, Miranda IM, Google Talk client, Mail.Ru Agent client, VoxOx ) Протоколы - Jabber , XMPP.

Функции:

  • чат (видеочат, текстовый и голосовой);

  • VoIP сервисы: звонки на компьютер, звонки на стационарные и мобильные телефоны;

  • возможность отправки SMS;

  • передача файлов;

  • инструменты для совместной работы в режиме реального времени;

  • возможность общаться в чате непосредственно на веб-странице;

  • напоминания и оповещения;

  • хранение истории общения по каждому контакту;

  • индикация о сетевом статусе пользователей (в сети, нет на месте и т.д.), занесенных в список контактов.

Организация информационного поиска в Internet.

  1. Особенности структуры WEB. Объем. Поверхностная и скрытая части Web. Графовая структура, сообщества, NK-кланы, ссылки.

WWW – это множество Web-серверов в Internet

Web-сервер - компьютер в Internet, на котором представлены Web-страницы

Web страница - документ, который имеет графический интерфейс и содержимое которого описано так называемым языком HTML (Hypertext Markup Language - язык гипертекстовой разметки документа)

Web-сайт (узел) - совокупность тематически связанных Web-страниц

URL - Uniform Resourse Locator – это универсальный способ обозначения ресурса Internet.

Обозначение URL состоит из трех частей:

первая указывает тип связи, который следует установить с нужным вам источником (протокол),

вторая – имя требуемого сервера,

третья – полное имя ресурса, т.е. имя файла на сервере, включающее путь к нему.

Чаще всего пользователь находит на необходимые ему новые источники в Сети через информационно-поисковые системы, такие как Google, Yahoo! или "Яндекс", которые для многих стали "де-факто" стандартными. Однако кроме видимой для поисковых систем части Web-пространства существует огромное количество страниц, которые ими не охватываются. При этом доступ пользователя к таким ресурсам в принципе возможен (хотя иногда "слегка прикрыт" паролями). Как правило, эти Web-страницы доступны в Интернет, однако выйти на них трудно, а порой невозможно, если не знать точного адреса. Эти ресурсы уже десять лет как имеют собственное название - "скрытый" (deep) Web, которое ввел Джилл Иллсворт (Jill Ellsworth) в 1994 году, обозначив им источники, недоступные для обычных поисковых систем. Сегодня такие ресурсы называют также невидимым (invisible) Web. Они чаще всего охватывают динамически формируемые Web-страницы, содержание которых хранится в базах данных и доступно лишь по запросам пользователей.

В 2000 году американская компания BrightPlanet (www.brightplanet.com) опубликовала сенсационный доклад, в котором утверждается, что в Web-пространстве в сотни раз больше страниц, чем их удалось проиндексировать самыми популярными поисковыми системами. Эта же компания разработала программу LexiBot, которая позволяет сканировать некоторые динамические Web-станицы, формируемые из баз данных, и запустив ее, получила неожиданные данные. Выяснилось, что для традиционных поисковых систем огромная часть Сети попросту невидима. Топология паутины - "галстук-бабочка"

В отличие от данных из обычного хранилища информации, документы из Web-пространства характеризуется большим количеством неявно включенных в них экспертных оценок, реализованных в виде взаимных гипертекстовых ссылок. Именно гиперссылки оказались в свое время основой для построения модели Web-пространства (или, попросту, веба). И именно их остутствие порождает скрытые области в этом пространстве.

Гра́фовая база данных — разновидность баз данных с реализацией сетевой модели в виде графа и его обобщений. Графовую модель данных обычно рассматривают как обобщение RDF-модели или сетевой модели данных[1]. Основными элементами модели являются узлы и связи. В зависимости от реализации узлов и ребер граф-модель данных разделяют на несколько подтипов.

Данный вид баз данных применяется для моделирования социальных графов (социальных сетей)[2], биоинформатике, а также для семантического веб[3].

По мнению некоторых авторов, для задач с естественной графовой структурой данных графовые СУБД могут существенно превосходить реляционные по производительности, а также иметь преимущества в наглядности представления и внесения изменений в схему БД[4].

nk-кланы это входящие-исходящие ссылки интернет-ресурса. это почти как page rank, но только page rank это коэффициент, считающийся по формуле из входящих-исходящих ссылок, а нк-кланы - это просто совокупность таких ссылок. нужны для определения релевантности-нерелевантности запросов

Ссы́лка — это запись, которая идентифицирует документ или его часть. Используется для связи документа с другими документами или частей документа между собой. Более полная идентификация используется в библиотечном деле в виде библиографической записи.

Используют также термины внутренняя ссылка (ссылающаяся на другую часть того же документа) и внешняя ссылка (ссылающаяся на другой документ).

Ссылки как средство указания на источник приводимой информации существуют и в устной речи, и на письме ровно с тех пор, как эти самые средства передачи информации появились. Особенность ссылки — её краткость: не требуется приводить часть текста (цитировать), а достаточно лишь указать источник.