Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Информатика - ответы .doc
Скачиваний:
270
Добавлен:
13.07.2019
Размер:
811.52 Кб
Скачать

Процесс индексирования включает:

1. Анализ содержания индексируемого материала и выбор из него т.н. номинативных лексических единиц, существенных для его понимания;

2. Формирование перечня ключевых слов, используемых при свободном индексировании ;

3. Нормализацию ключевых слов по форме и содержанию при помощи словаря используемого ИПЯ пред- или посткоординатного типа;

4. Избыточное индексирование (см. ниже);

5. Заполнение рабочего листа с введением в него грамматических средств.

Тезаурус представляет собой специальным образом организованную совокупность основных и лексических единиц, понятий предметной области и описание парадигматических отношений между ними. Парадигматические отношения выражаются семантическими элементами словаря, не зависящих от любого контекста(абстрагированность смысловых отношений) Генеральный указатель(контрданс) представляет собой перечисление всех слов, имеющихся в документах с указанием координатного местонахождения каждого слова. Так как поисковое пространство отображает полностью весть текст, то такие системы получили название полнотекстовые.

Структурная составляющая ИПЯ семантических информационных систем реализуется в виде смысловых оценок в поисках документов специальном навигационном интерфейсе(гипертекстовые технологии). Поисковая(манипуляционная)составляющая ИПЯ реализуется дескрипторными и сематическими языками запроса.

В дескрипторных языках документы и запросы представляются наборами некоторых лексических единиц(слов, словосочетаний, терминов)-дескрипторов, не имеющих между собой связей, то есть каждый документ или запрос представлен некоторым набором дескрипторов, то есть осуществляется через подбор документов с подходящим набором дескрипторов. В качестве дескрипторов выступают элементы словаря классовых терминов или элементы генерального указателя. Такие языки переменятся в полнотекстовых системах.

По области или по сфере применения информационно-поисковых языков можно выделить:

1. Коммуникативные (общесистемные) ИПЯ - предназначенные для обеспечения взаимодействия между различными (информационными, библиотечными и др.) системами (в т.ч. распределенными по государственной, ведомственной или территориальной принадлежности);

2. Локальные (внутренние) ИПЯ - предназначенные для использования в рамках отдельной системы;

3. Внешние ИПЯ - используемые в других системах и предназначенные для взаимодействия только с ними.

29. Базы данных. Фактографические автоматизированные информационные системы. Основные понятия о системах управления базами данных (СУБД). Реляционные базы данных.

Базы данных - совокупность связанных данных, организованных по определенным правилам, предусматривающим общие принципы описания, хранения и манипуляции данных.

Ядром любой базы данных является модель данных, которая представляет собой структуру данных, соглашения о способах их представления и операций манипулирования ими. Иными словами, это формализованное описание объектов предметной области и взаимосвязей между ними.

Различают три основных типа моделей данных: иерархическую, сетевую и реляционную.

Фактографическая ИС - это массив фактов - конкретных значений данных об объектах реального мира. Информация в фактографической ИС хранится в четко структурированном виде, поэтому она способна давать однозначные ответы на поставленные вопросы. Фактографические ИС используются буквально во всех сферах человеческой деятельности - в науке, материальном производстве и т.д..

СУБД — это комплекс программных и языковых средств, необходимых для создания и эксплуатации баз данных. На этапе разработки баз данных СУБД служит для описания структуры базы данных: определения таблиц; определения количества полей; типа данных, отображающихся в них; размеров полей; определения связей между таблицами. Помимо таблиц большинство СУБД предусматривает создание специальных средств для работы с данными - форм, запросов. Во время эксплуатации баз данных СУБД обеспечивает редактирование структуры базы данных, заполнение ее данными, поиск, сортировку, отбор данных по заданным критериям, формирование отчетов.

Базы данных, которые состоят из двумерных таблиц, называются реляционными. Основная идея реляционного подхода состоит в том, чтобы представить произвольную структуру данных в виде простой двумерной таблицы.