Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
254
Добавлен:
02.05.2014
Размер:
3.54 Mб
Скачать

Информационно-поисковые системы и их классификация

Довольно часто возникают ситуации, когда в большом объеме информации разыскивается та, которая нужна в данный момент, при этом для объекта поиска существенными являются значения лишь некоторых признаков. Например, для автомобилей признаками являются: объем двигателя, расход топлива, мощность; для книги: название, фамилия автора, год и месяц издания и т.д. Каждый из нас когда-то занимался подобной рутинной работой: поиск объекта по значению признаков. С появлением компьютеров оказалось, что эту работу можно поручить ЭВМ. Для этого создаются информационно-поисковые системы (ИПС).

Информационно-поисковая система– это прикладная компьютерная среда для обработки, хранения, сортировки, фильтрации и поиска больших массивов структурированной информации.

Каждая ИПС предназначена для решения определенного класса задач, для которых характерен свой набор объектов и их признаков. ИПС бывают двух типов:

1. Документографические. В таких ИПС все хранимые документы индексируются специальным образом, т. е. каждому документу присваивается индивидуальный код, составляющий поисковый образ. Поиск идет не по самим документам, а по их поисковым образам. Именно так ищут книги в больших библиотеках. Сначала отыскивают карточку в каталоге, а затем по номеру, указанному на ней, отыскивается и сама книга.

2. Фактографические. В таких ИПС хранятся не документы, а факты, относящиеся к какой-либо предметной области. Поиск осуществляется по образцу факта.

Каждая ИПС состоит из двух частей: базы данных (БД) и системы управления базами данных (СУБД).

База данных– это поименованная совокупность структурированных данных, относящихся к определенной предметной области.

Система управления базами данных– это комплекс программных и языковых средств, необходимых для создания баз данных, поддержания их в актуальном состоянии и организации поиска в них необходимой информации.

На настоящий момент существует множество различных СУБД. Наиболее широкую известность получили такие как Dbase, Clipper, FoxPro, Paradox, Microsoft Access.

Информационные единицы баз данных

Поле– элементарная единица логической организации данных, которая соответствует неделимой единице информации – реквизиту. Для описания поля используются следующие характеристики:

  • имя, например. Фамилия, Имя, Отчество, Дата рождения;

  • тип, например, символьный, числовой, календарный;

  • длина, например, 15 байт, причем будет определяться максимально возможным количеством символов;

  • точностьдля числовых данных, например два десятичных знака для отображения дробной части числа.

Запись– совокупность логически связанных полей.

Экземпляр записи– отдельная реализация записи, содержащая конкретные значения ее полей.

Файл(таблица) – упорядоченная структура, состоящая из конечного набора однотипных записей.

Модели данных

Ядром любой базы данных является модель данных. С помощью модели данных могут быть представлены объекты предметной области и взаимосвязи между ними.

Модель данных– это совокупность структур данных и операций их обработки. Рассмотрим три основных типа моделей данных: иерархическую, сетевую и реляционную.

Иерархическая модельпредставляет собой совокупность элементов, расположенных в порядке их подчинения от общего к частному и образующих перевернутое по структуре дерево (граф).

К основным понятиям иерархической структуры относятся уровень, узел и связь. Узел– это совокупность атрибутов данных, описывающих некоторый объект. На схеме иерархического дерева узлы представляются вершинами графа. Каждый узел на более низком уровне связан только с одним узлом, находящимся на более высоком уровне. Иерархическое дерево имеет только одну вершину, не подчиненную никакой другой и находящуюся на самом верхнем – первом уровне. Зависимые (подчиненные) узлы находятся на втором, третьем и т. д. уровнях. Количество деревьев в базе данных определяется числом корневых записей. К каждой записи базы данных существует только один иерархический путь от корневой записи.

В сетевой моделипри тех же основных понятиях (уровень, узел, связь) каждый элемент может быть связан с любым другим элементом.

Реляционная модельданных.Понятие реляционный(англ.relationотношение) связано с разработками известного американского специалиста в области систем баз данных Е. Кодда. Объекты и связи между ними представляют в виде таблиц, при этом связи тоже рассматриваются как объекты.

Реляционная модель ориентирована на организацию данных в виде двумерных таблиц.

  • каждый элемент таблицы – один элемент данных;

  • все столбцы в таблице однородные, т.е. все элементы в столбце имеют одинаковый тип (числовой, символьный и т.д.) и длину;

  • каждый столбец имеет уникальное имя;

  • одинаковые строки в таблице отсутствуют;

  • порядок следования строк и столбцов может быть произвольным.

Каждая таблица реляционной модели должна иметь первичный ключ. Под первичным ключомпонимают поле или набор полей, однозначно (уникально) идентифицирующих запись. Первичный ключ должен быть минимально достаточным: в нем не должно быть полей, удаление которых из первичного ключа не отразится на его уникальности.

Между двумя или более таблицами модели могут существовать отношения подчиненности. Отношения подчиненности определяют, что для каждой записиглавнойтаблицы{master,называемойеще родительской}может существовать одна или несколько записей вподчиненнойтаблице{detail, называемой ещедочерней}.

Существует три разновидности связей между таблицами модели:

  • «один-ко-многим»,

  • «один-к-одному»,

  • «многие-ко-многим».

Реляционная модель характеризуются простотой структуры данных, удобным для пользователя табличным представлением и возможностью использования формального аппарата алгебры отношений и реляционного исчисления для обработки данных. Все современные средства СУБД поддерживают эту модель данных.