Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ЛЕКЦИИ УИС.docx
Скачиваний:
2
Добавлен:
01.07.2025
Размер:
622.46 Кб
Скачать

Лекция 3

Информационное обеспечение АИС включает в себя две компо­ненты:

  1. Лингвистическое обеспечение (ЛО), к которому относятся:

  • форматная база (типы, форматы, структуры информа­ции — данных, записей, документов);

  • лексическая база (классификаторы, кодификаторы, словари и тезаурусы или иные лексико-лингвистические таблицы, используемые при вводе, обработке, поиске, представлении информации (данных, записей, документов);

  • языковые средства описания (ЯОД, словари данных) и ма­нипулирования (ЯМД) данными.

  1. Собственно информационное обеспечение составляют:

  • файлы операционной системы (именованные совокупности данных, находящиеся под управлением ОС в процессе реа­лизации ею функции управления данными (см. выше));

  • база (базы) данных — именованная взаимосвязанная сово­купность физических файлов ОС ЭВМ, поддерживающая информационную модель предметной области.

Типы данных — это совокупность соглашений о программно-ап­паратурной форме представления и обработки, а также ввода, кон­троля и вывода элементарных данных.

Структуры данных — способы композиции простых данных в агрегаты и операции над ними.

Форматы файлов — представление информации на уровне взаи­модействия операционной системы с прикладными программами.

Форматы данных — соглашения о представлении агрегатов ин­формации при передаче (поэтому часто говорят о коммуникативных или обменных форматах), в том числе:

  • библиотечных и справочных БД;

  • полнотекстовых документов.

Лексическое обеспечение

К данной компоненте лингвистического обеспечения в первую очередь относятся кодификаторы, классификаторы, тезаурусы.

Кодификаторы АИС представляют собой словари, не обязатель­но несущие семантическое соответствие между обозначаемым (класс, понятие, сущность) и обозначающим (код, символ). Напри­мер, в персональной БД атрибут SEX (Пол) может обозначаться либо М/Ж, либо 1/0 или 0/1, либо еще как-то в рамках двухсим­вольного алфавита (домена).

Классификаторы АИС являются словарями, обязательно несу­щими определенную смысловую нагрузку. Они подразумевают ие­рархическое разбиение предметной области на совокупность сужаю­щихся классов и последующее отнесение обозначаемого объекта ре­ального мира (документ, продукт и пр.) к одному из классов (индексирование).

Тезаурусы АИС. Тезаурус (Thesaurus) представляет собой толко­вый дескрипторный словарь, в котором значение каждой стандартной лексической единицы (дескриптора — слова или словосочетания) интерпретируется через связи с другими дескрипторами.

Тезаурус в печатной форме обычно включает две части:

  • систематический указатель дескрипторов;

  • алфавитный указатель.

Лекция 4 структура БД

Логическая структура бд

Логическая структура (рис. 1.19) предполагает следующие уров­ни рассмотрения БД:

база данных (database) — включает одну или несколько подбаз (файлов, таблиц, массивов), каждая из которых состоит из аг­регатов данных (записей, документов)— record. Запись иденти фицируется внутренним номером (ISN — internal sequential number, ВНЗ — внутренний номер записи, SDN — sequential document number и пр.);

  • запись (документ) — совокупность разнотипных и разнострук­турных данных, описывающих (относящихся к) объект реаль­ного мира, элемент предметной области АИС. Запись состоит из полей (field);

  • поле — именованный элементарный или составной фрагмент записи (документа), содержащий информацию об определен­ном аспекте (аспектах) элемента (элементов) предметной об­ласти.

Возможны следующие структуры полей (рис. 1.19, табл. 1.14.):

  • элементарные — имеют фиксированную или ограниченную длину и не содержат входящих в них структур данных;

  • составные (групповые) — образуются как агрегаты элементар­ных и также имеют фиксированную и ограниченную длину (реже — переменную или неопределенную, что связано с ко­личеством вхождений элемента в агрегат);

  • текстовые — поля переменной (неопределенной) длины и сложной внутренней структуры (обычно это иерархическая последовательность типа РАЗДЕЛ — ПОДРАЗДЕЛ — ПРЕДЛОЖЕНИЕ - СЛОВО);

бинарные — данные, интерпретируемые как поля, однако обычно физически не входящие в состав записей БД.