Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Информационно - поисковые системы.docx
Скачиваний:
8
Добавлен:
17.11.2019
Размер:
34.21 Кб
Скачать

Координация понятий в классификационных системах

Координация понятий выражается в использовании различных операций над совокупностью понятий при индексировании документов или при поиске документов.

Выделяются два направления:

  1. Использование только логических операций

  2. Использование определенной грамматики понятий, классов, рубрик в рамках определенного семантического языка

Класс – совокупность (множество) документов, проиндексированных кодом соответствующего класса.

Логические операции над классами приведены в таблице.

Операция

Пояснение

Объединение классов X и Y (логическая сумма, операция ИЛИ, дизъюнкция)

Называется множество документов Х ИЛИ Y, проиндексированных кодом класса Х или Y, либо одновременно кодами обоих классов (Х Y)

Пересечение классов X и Y (логическое произведение, операция И, конъюкция)

Называется множество документов Х И Y, проиндексированных одновременно кодами классов Х и Y (X∩Y)

Дополнение класса Х (логическое отрицание, операция НЕ)

Называется множество документов не проиндексированных кодом класса Х

( Х’ = Х)

Включение класса Х в Y

Называется такое множество Х, когда любой документ, проиндексированный кодом класса Х, одновременно проиндексирован кодом класса Y (Y→X)

Предкоординация понятий предусматривает использование операций над классами при индексировании документов.

Предкоординация понятий предусматривает осуществление операций над классами при поиске документов, т.е. в процессе формирования поискового образа запроса.

Информационно – поисковые тезаурусы

Большую роль в развитие информационно – поисковых систем сыграла система унитермов, согласно которой содержание документа индексируется совокупностью терминов в виде однословных обозначений – унитермов, в качестве которых чаще всего выступают элементы словаря ключевых терминов по определенной предметной области.

Недостатки системы унитермов, приводящие к неоднозначности индексирования документов:

  • Ложная координация

  • Проблема синонимичности и омонимичности

Для преодоления этих недостатков в чисто дескрипторную систему унитермов ввели составные термины, указатели связи и ролей терминов, внося тем самым элементы семантики. Это привело к созданию информационно – поисковых тезаурусов.

Тезаурус:

  1. Классификационная схема: определяется систематизацию дескрипторов по уровням иерархии, исходя из родо – видовых или ролевых отношений

  2. Алфавитный перечень дескрипторов: содержит словарный фонд для индексировании документов

Контрольные вопросы:

  1. Что называется поисковой системой?

ИПС – это информационная система с единым хранилищем единичных элементов данных и с развитым инструментарием их поиска и отбора.

  1. Какие синонимы есть у термина «поисковая система»?

03.10.2012

1.

1.1. Что из себя представляет модель веб – пространства?

Впервые создана в 1999 году в Институте поиска и анализа текстов (США).

Модель опровергла представления об интернете как о едином густом пространстве.

Проследив с помощью поискового механизма 200 млн. web-страниц и несколько миллиардов ссылок ученые пришли к выводу о неоднородной структуре интернета и создали топологическую модель, близкую к модели Bow Tie (галстук-бабочка)

1.2. Что такое отправные веб – страницы?

Это Web-страницы, которые содержат гиперссылки, ведущие в конечном счете к ядру.

Ядро - Компоненты сильной связности (SCC).

Сюда относятся web-страницы, связанные так тесно, что, следуя по гиперссылкам, из любой из них в конечном счете можно попасть на любую другую.

1.3. Что такое конечные веб – страницы?

К этим web-страницам можно прийти по ссылкам из ядра.

2. Музей Виктора Астафьева в городе Чусовом

http://www.chusowoy – rayon.ru/kult – 4.html

Литературный музей Виктора Петровича Астафьева

Посольство Сенегала в России

http://ambassen.ru/contacts.html

Сенегал и Россия

Сайт Пушкинского дома

http://www.pushkinskijdom.ru/

Институт русской литературы (Пушкинский дом) Российской Академии наук

Сайт актрисы Натальи Бондарчук

http://nbondarchuk.ru/

Золотой век

Название сайта, адрес в интернете и его расположение в структуре выбранного каталога

3.