Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
учебное пособие - информационные системы11.doc
Скачиваний:
56
Добавлен:
18.11.2019
Размер:
11.21 Mб
Скачать

Раздел I. Теоретические основы информационных систем

  1. Классификация и кодирование информации

В основе любых информационных систем и технологий лежит понятие информации.

Термин «информация» (от лат. information) означает разъяснение, осведомление, изложение. Существует несколько научных теорий, взглядов на сущность и содержание данного понятия. С позиции материалистической философии информация есть отражение свойств (признаков) объектов реального мира с помощью сведений (сообщений). Для нашего курса будем использовать следующее понятие информации.

Информация — это сведения об окружающем мире и протекающих в нём процессах, представленные в любой среде или форме, осмысленные человеком или зафиксированные специальным устройством.

Предметная область – это определенная часть реального мира, область деятельности, выделяемая для решения задачи и содержащая информацию о совокупности объектов (сущностей), связей и отношений между объектами, процедур преобразования этих объектов.

Пример. Необходимо решить задачу – информационная поддержка деятельности адвокатского бюро. Для этого рассмотрим предметную область «Деятельность адвокатского бюро». Объектами данной предметной области выступают адвокаты, клиенты, дела по представлению и защите интересов различных лиц. Взаимосвязями данных объектов являются отношения между адвокатом и совокупностью его клиентов, отношения между адвокатом и делами, которые он ведет, отношения между адвокатами, возникающие в связи с учреждением и деятельностью адвокатского бюро и др. Решение задачи должно предусматривать выполнение следующих процедур: получение списка действующих адвокатов, получение списка текущих клиентов для конкретного адвоката, определение эффективности представления и защиты интересов, ведение архива дел, получение информации о состоянии определенного дела и др.

Необходимым условием создания информационной системы является систематизация информации о предметной области. Всякая систематизация основана на классификации объектов.

Классификация – система распределения объектов по классам в соответствии с определенным признаком. Под объектом понимается любой предмет, процесс, явление.

При работе с определенным объектом в любой предметной области используется его модель в форме информационного объекта, представляющего собой описание свойств (признаков) объекта и имеющихся взаимосвязей. При построении модели выделяются только те свойства (признаки) объекта, которые будут существенными при решении практических задач создаваемой системы. Например, если в качестве объекта реального мира рассматривается некоторый человек, то в предметной области «Библиотека» его информационный объект может быть представлен следующими признаками: ФИО, дата рождения, уровень и форма образования, специальность, место жительства, направление научных интересов и практической деятельности. Тот же объект в предметной области «Правоохранительные органы – учет лиц» может быть представлен уже другим набором признаков: ФИО, дата рождения, признаки внешности, наличие судимости, свойства папилярных узоров пальцев, социальные связи и др.

Свойства информационного объекта определяются параметрами, называемыми реквизитами.

Реквизит – логически неделимый элемент, описывающий определенное свойство отображаемого объекта.

Пример. Информация о каждом студенте в отделе кадров университета систематизирована и представлена посредством одинаковых реквизитов:

  • фамилия, имя, отчество;

  • пол;

  • дата рождения;

  • место рождения;

  • адрес проживания;

  • факультет и т.д.

Все перечисленные реквизиты характеризуют свойства информационного объекта «Студент». Если данный объект (человек) характеризуется в другой предметной области, тогда для создания его информационной модели могут быть существенными иные свойства объекта.

При любой классификации желательно, чтобы соблюдались следующие требования:

  • полнота охвата объектов рассматриваемой предметной области;

  • однозначность реквизитов;

  • возможность включения новых объектов.

Классификатор – систематизированный свод наименований и кодов классификационных группировок.

Следует различать понятия классификационный признак (свойство объекта) и значение классификационного признака (то есть те значения, которые он может принимать). Например, в качестве признака классификации выбирается возраст, который состоит из трех значений: до 20 лет, от 20 до 30 лет, свыше 30 лет.

Разработаны три метода классификации объектов: иерархический, фасетный, дескрипторный.

Иерархическая система классификации

Исходное множество объектов составляет 0-й уровень и делится в зависимости от выбранного классификационного признака на классы, которые образуют 1-й уровень. Каждый класс 1-го уровня в соответствии с другим признаком делится на подклассы, которые образуют 2-й уровень и т.д.

П ример. Поставлена задача – создать систему классификации для информационного объекта «студенты ИПСУБ» по следующим признакам: специальность, форма обучения. Тогда классификатор имеет следующий вид:

При этом классификация определенного объекта – студента Иванова И.И., обучающегося на очной форме «Юриспруденция», будет иметь вид: Иванов И.И. = {Юриспруденция, очная}.

Достоинствами иерархической системы классификации являются простота построения, использование независимых классификационных признаков в различных ветвях иерархической структуры. Недостатки – жесткая структура, которая приводит к сложности внесения изменений и невозможность группировать объекты по заранее непредусмотренным признакам.

Фасетная система классификации

Эта система позволяет выбирать признаки независимо друг от друга. Совокупность признака классификации и всех возможных его значений называется фасетом. Классификатор по фасетной системе удобнее отображать в виде таблицы.

Пример. Классификатор студентов ИПСУБ в фасетной системе может быть представлен следующим образом:

Фасеты:

специальность

форма обучения

курс

Признаки классификации

юриспруденция

очная

1

ГиМУ

заочная

2

Значения

ДиДОУ

очно-заочная

3

фасетов

ОТЗИ

4

5

6

В данном примере используются следующие фасеты: фасет «специальность» со значениями юриспруденция, ГиМУ, ДиДОУ, ОТЗИ; фасет «форма обучения» со значениями очная, заочная, очно-заочная; фасет «курс» со значениями 1, 2, 3, 4, 5, 6.

Достоинствами фасетной системы классификации являются: возможность создания классификации с использованием большого числа признаков классификации и их значений, возможность простой модификации системы классификации. Недостатком является сложность построения с учетом использования всего многообразия классификационных признаков.

Дескрипторная система классификации

Для организации поиска информации, ведения тезаурусов (словарей) эффективно используется дескрипторная (описательная) система классификации, язык которой приближается к естественному языку описания информационных объектов. Данная система особенно широко используется в библиотечной системе поиска.

Суть дескрипторного метода заключается в следующем:

  1. отбирается совокупность ключевых слов или словосочетаний, описывающих определенную предметную область или совокупность однородных объектов, причем среди ключевых слов могут быть синонимы.

Ключевое слово – лексическая единица, которая в определенных контекстах описывает языковую конструкцию. Слово (словосочетание) естественного языка, выбирается из текста документа и используется для его индексирования. Индексирование – процесс описания содержания документов и запросов в терминах информационно-поискового языка, а также сопоставления документу набора ключевых слов, отражающих его содержание;

  1. выбранные ключевые слова подвергаются нормализации, т.е. из совокупности синонимов выбираются наиболее употребимые;

  2. создается словарь дескрипторов, т.е. словарь ключевых слов, отобранных в результате нормализации.

Пример. В качестве предметной области выбирается учебная деятельность в высшем учебном заведении. Ключевыми словами могут быть: студент, обучаемый, учащийся, преподаватель, педагог, лектор, факультет, подразделение университета, аудитория, комната, лекция, практическое занятие и т.д. После нормализации в словарь дескрипторов можно включить: студент, преподаватель, факультет, аудитория, занятие.

Между дескрипторами устанавливаются связи, которые позволяют расширить область поиска информации.

Примечание. Использование данной системы классификации применительно к правовой информации рассматривается в теме 1 раздела II.

Система кодирования применяется для замены названия объекта на условное обозначение (код) в целях обеспечения удобной и более эффективной обработки информации. Система кодирования – совокупность правил кодового обозначения объектов. Код строится на базе алфавита, состоящего из букв, цифр и других знаков.