Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
все ответы.docx
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
525.8 Кб
Скачать

39 Дескрипторные информационно-поисковые языки

Дескрипторные языки семантически более сильны, чем класси­фикационные, но более сложны для формальной обработки. Дескриптор — ключевое слово или словосочетание, служащее именем класса эквивалентных ключевых слов (синонимов). Как пра­вило, в качестве дескриптора выбирают — одно, наиболее употреби­мое ключевое слово из класса синонимичных ключевых слов. Внешне координатное индексирование напоминает алфавитно-предметную классификацию. В обоих случаях классы обозначаются словами и словосочетаниями ЕЯ. Однако это сходство чисто внеш­нее. При отыскании документов при координатном индексировании производятся определенные логические операции над классами, обо­значенными этими ключевыми словами. Для алфавитно-предметного индексирования тоже может быть применено несколько предмет­ных заголовков. Но при информационном поиске каждый предмет­ный заголовок выступает самостоятельно без какой-либо связи с другими заголовками, т.е. можно пользоваться только заранее опи­санными классами. При координатном индексировании классы фор­мируются в процессе индексирования. При координатном индексировании поисковое предписание формулируется в виде логических сумм (или), произведений (и) или дополнений (не) классов, соответствующих ключевым словам поис­кового предписания (чаще всего это произведение). Для отыскания документов, отвечающих на запрос, необходимо выполнить определенные логические операции над классами, кото­рые обозначены ключевыми словами ПОД. В простейшем случае, когда поисковое предписание сформули­ровано в виде логического произведения некоторого множества клю­чевых слов, документ считается отвечающим на информационный запрос и подлежит выдаче, если в ПОД одновременно содержатся все ключевые слова поискового предписания. Разработка дескрипторного языка фактически сводится к разра­ботке информационно-поискового тезауруса.

40. Задачи поиска информации. Критерии поиска информации.

  • Полнотекстовый поиск — поиск по всему содержимому документа.

  • Поиск по метаданным — это поиск по неким атрибутам документа, поддерживаемым системой — название документа, дата создания, размер, автор и т. д.

  • Поиск по изображению — поиск по содержанию изображения. Поисковая система распознает содержание фотографии.

Методы поиска

  • Адресный поиск - процесс поиска документов по чисто формальным признакам, указанным в запросе (условия - наличие у документа точного адреса, обеспечение строгого порядка расположения документов в запоминающем устройстве или в хранилище системы)

  • Семантический поиск - процесс поиска документов по их содержанию. (условия: перевод содержания с естественного языка на информационно-поисковый язык и составление поисковых образов документа и запроса, составление поискового описания, в котором указывается дополнительное условие поиска)

  • Документальный поиск - процесс поиска в хранилище информационно-поисковой системы первичных документов или в базе данных вторичных документов, соответствующих запросу пользователя (виды: библиотечный, направленный на нахождение первичных документов; библиографический, направленный на нахождение сведений о документах, представленных в виде библиографических записей)

  • Фактографический поиск - процесс поиска фактов, соответствующих информационному запросу. (виды: документально-фактографический, заключается в поиске в документах фрагментов текста, содержащих факты; фактологический (описание фактов), предполагающий создание новых фактографических описаний в процессе поиска путем логической переработки найденной фактографической информации)

Критерии поиска

  • Критерий соответствия - Признак или совокупность признаков, по которым определяется степень соответствия между запросом или поисковым предписанием и поисковым образом документа, самим документом или записью его части для принятия решения о выдаче или не выдаче конкретного документа на информационный запрос, обрабатываемый системой.

  • Критерий смыслового соответствия, критерий релевантности (документов, данных) - Признак или совокупность признаков, по которым определяется степень смыслового соответствия между содержанием поискового предписания и поискового образа документа, самим документом или записью его части для принятия решения о выдаче или не выдаче конкретного документа на информационный запрос , обрабатываемый системой.

  • Критерий формального соответствия - Признак или совокупность признаков, по которым определяется степень формального соответствия между поисковым предписанием и поисковым образом документа , самим документом или записью его части для принятия решения о выдаче или не выдаче конкретного документа на информационный запрос, обрабатываемый системой.

  • Релевантность  - Характеристика степени соответствия смыслового содержания документа, найденного в результате поиска, содержанию информационного запроса.

  • Пертинентность  - Характеристика степени соответствия документа или данных, найденных в результате поиска, информационной потребности пользователя, выраженной в его запросе .

  • Точность поиска, коэффициент точности поиска/выдачи - Количественная характеристика результатов информационного поиска . Точность поиска определяется путем деления количества выданных в результате выполнения поиска релевантных (см. релевантность ) документов на общее число выданных документов (релевантных и не релевантных). Данный показатель используется также для оценки качества информационно-поисковых систем .

  • Коэффициент информационного шума, коэффициент шума  - Количественная характеристика информационного поиска. Коэффициент информационного шума (ИШ) определяется путем деления количества выданных в результате выполнения поиска нерелевантных документов (см. релевантность ) на общее число выданных документов (релевантных и не релевантных). Будучи выраженным в процентах, ИШ = 100%;- ТП=0 . Данный показатель используется также для оценки качества информационно-поисковых систем .

  • Полнота поиска, коэффициент полноты поиска - Количественная характеристика результатов информационного поиска, которая определяется путем деления количества выданных в результате выполнения поиска релевантных (см. релевантность) документов на общее число релевантных документов, имеющихся в информационно-поисковой системе (выданных и не выданных). Данный показатель используется также для оценки качества информационно-поисковых систем,

  • Коэффициент потерь - Количественная характеристика результатов информационного поиска . Коэффициент потерь (КП) определяется путем деления количества не выданных в результате выполнения поиска релевантных документов (см. релевантность ) на общее число релевантных документов, имеющихся в информационно-поисковой системе (выданных и не выданных). Будучи выраженным в процентах, КП = 100% - полнота поиска . Данный показатель используется также для оценки качества информационно-поисковых систем.

  • Оперативность (время) поиска - время, затрачиваемое на выполнение поиска, с момента формирования задания и выдачи команды на производство поиска до момента получения его результатов; в ЭВМ - Время, затрачиваемое головкой чтения/записи дисковода (накопителя), для того, чтобы достичь определенного элемента данных, записанного на диске, дискете или другом носителе данных внешней памяти ЭВМ.