Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
[7 семестр] Расписанные вопросы к экзамену.docx
Скачиваний:
22
Добавлен:
04.06.2015
Размер:
879.86 Кб
Скачать

Предкоординированные — перед поиском устанавливаются координатные связи между лексическими единицами.

Посткоординированные — когда связи между лексическими единицами устанавливаются только при поиске.

Лексические единицы (слова и словосочетания) подразделяются на классы. По словарному составу языка проводится деление документов на классы.

16. Индексирование и кодирование информации. Особенности представления информации в документальной и фактографической ис. Кодирование информации

Код – условное обозначение объекта в виде одного или нескольких знаков. Набор методов и пра­вил условного обозначения — система кодирования.

Классификационная схема — систематизированный перечень наименований объектов, каждому из которых в соответствие дан уникальный код.

Кодирование — это процесс присвоения ус­ловных обозначений (кодов) объектам и классификационным группам в соответствии с определенной системой кодирования. Код в системе кодирования задается тройкой: с=(А, L, S), где

  • А — алфавит (множество символов, используемых при запи­си кода)

  • Lдлина (число позиций в коде);

  • S — структура кода (порядок расположения в коде символов).

Индексирование – на специальном формализованном языке отражаются соответствующие выбранной тематике признаки.

Координатное индексирование состоит в том, что суть документа и необходимой потребности может быть отражена с помощьюх ключевых слов, содержащихся в тексте. Под ключевыми словами понимаются наиболее существенные для этой цели слова и словосочетания.

В фактографических ИС регистрируются факты – конкретные значения данных об объектах реального мира. Основная идея таких систем заключается в том, что все сведения об объектах (фамилии людей и названия предметов, числа, даты) сообщаются компьютеру в каком-то заранее обусловленном формате (например, дата – в виде комбинации ДД.ММ.ГГГГ). Поэтому фактографическая система способна давать однозначные ответы на поставленные вопросы.

Документальные ИС обслуживают принципиально иной класс задач, которые не предполагают однозначного ответа на поставленный вопрос. Базу данных таких систем образует совокупность неструктурированных текстовых документов (статьи, книги и т.д.), снабженная тем или иным формализованным аппаратом поиска. Цель системы, как правило, – выдать в ответ на запрос пользователя список документов или объектов, в какой-то мере удовлетворяющих сформулированным в запросе условиям (может выдать ненужное и может не выдать нужное).

17.Обобщенная схема воспроизводства информации. Характеристика информационных компонент.

Рассмотрим обобщенную схему воспроизводства информа­ции,.С точки зрения задач управления потоками можно раз­личить две совокупности процессов: формирование потока инфор­мации (документов) в соответствии с заданными характеристика­ми и распределение входных и выходных потоков и их составляющих в соответствии с информационными потребностями. По характеру преобразований информации в совокупной системе можно выделить три следующих уровня.

Первый уровеньэто основная деятельность, где объектами являются предметы реального мира, а результатами — новое зна­ние. Носителем информации этого уровня является человеческое сознание, для которого характерны системность организации и ассоциативность выборки, а коммуникационным объектом явля­ется сообщение — знание, адресно отраженное на систему поня­тий предполагаемого приемника-потребителя информации.

Второй уровень — создание общественно-полезной информа­ции — одна из форм овеществления знаний через обобществле­ние результатов, обычно, в документальной форме. Средством представления знаний здесь является язык, а носителем — доку­мент как функционально ориентированное сообщение, структу­рирующее информацию и идентифицирующее ее.

Третий уровеньсобственно информационная деятель­ность — управление потоками информации для обеспечения ос­новной деятельности. Здесь информация (поисковый образ доку­мента) — это хорошо структурированный материал, компактно и системно отражающий содержание документа, а также обеспе­чивающий идентифицируемость документа как в целом, так и на уровне отдельных элементов данных.