Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
шпоры документы.doc
Скачиваний:
6
Добавлен:
27.09.2019
Размер:
579.07 Кб
Скачать

28. Информац. -поисковые языки (ипя). Требования к ним.

ИПЯ - искусственный язык для выражения содержания документов или запросов с целью последующего поиска. Перевод текста документа на ИПЯ наз-ся индексированием. Искусственный язык разрабатывается на основе естественного и состоит из алфавита, лексики и грамматики.

Алфавит - латинские буквы, Cyr, цифры, точки, двоеточие, косая черта. Лексика - совокупность слов. Грамматика - набор правил. Морфология - правила построения изменения слов, синтаксис - правила построения изменения соединения слов.

Связи между словами могут быть: парадигматические (существуют независимо от контекста), синтагматические (соотношения слов при соединении и словосочетании).

Требования к ИПЯ: 1) располагать лексико-грамматическими средствами для точного отображения темы запроса 2) не содержать синонимов, омонимов 3) отображать только объективные хар-ки предметов 4) быть удобным для алгоритмического соотношения: поисковый образпоисковое предписание. ИПЯ по способу организаций понятий бывают:

1)классификационные(предкоординируемые) - словарный состав задается в виде фиксированного списка слов, словосочетаний и фраз. Бывают:

а) ИПЯ иерархического типа - язык, представляющий собой перечислительную классификацию, в которой заранее перечислены все классы и подклассы.+: простота индексирования и поиска, удобство использования если набор классов с течением времени не меняется.

б) ИПЯ фасетного типа - каждый класс строится по определенным правилам при проведении индексирования документов из предварительно заданных классов - фасетов. +: допускается многоаспектное индексирование документов.

в) алфавитно-предметная классификация - система классов, каждая из которых соответствует определенной теме, причем классы в алфавитном порядке. Нужна для узко предметного поиска. Θ: невозможность поиска документов но любому заранее незаданному сочетанию признаков.

2) дескрипторные (посткоординируемые).█

29. Дескрипторные информац.-поисковые языки (ипя).

В этих языках дескрипторы или ключевые слова объединяются в поисковый образ документа в процессе индексирования. При формировании поискового образа при дескрипт. индексировании над ключевыми словами производятся логические операции «и или не», классы образуются в процессе индексирования, в итоге по поисковому образу документа формируется поисковое предписание как сложное логическое выражение.

При формировании поискового предписания необходимо иметь информационно-поисковый тезаурус (ИПТ) - служит для поиска слов, выражающих данное понятие. Тезаурус состоит из алфавитного и систематического указателей.

ИПТ используются:1) для перевода текста с естественного на дескрипторный путем замены ключевых слов соответствующими дескрипторами, исключающими многозначность; 2) для отображения парадигматических связей между дескрипторами. Тезаурусы разрабатываются для отдельных областей: тезаурус по документации, дескрипторный словарь по информатике. Требование – исключение многозначности. В отдельных разделах должен быть указан заглавный дескриптор, эквивалентные ключевые слова.

+ поиска по поисковому образу: позволяет снизить расходы памяти, сократить время поиска, не требует дорогого аппаратного и программного обеспечения.

Θ: любой набор ключевых слов не отражает адекватно содержания документа, формирование поискового образа документа состоит в структурировании документа, что искажает его содержание.█

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]