Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ЛЕКЦИИ_УД.doc
Скачиваний:
74
Добавлен:
16.11.2019
Размер:
2.38 Mб
Скачать

1. Основные понятия банков данных

Данные и информация. Под информацией понимают любые сведения о каком-либо событии, сущности, процессе и т.п., являющиеся объектом некоторых операций: восприятия, передачи, преобразования, хранения или использования.

Перед тем как определить понятие «данные», представим следующую ситуацию. Имеется некоторая система, информация о которой представляет интерес, и наблюдатель, способный воспринимать состояние системы и в определенной форме фиксировать их в своей памяти. В этом случае считают, что в памяти наблюдателя находятся данные, описывающие состояние системы. Таким наблюдателем в общем случае выступает информационная система.

Итак, данные можно определить как информацию, фиксированную в определенной форме, пригодной для последующей обработки, хранения и передачи.

Под информацией понимают любые сведения о каком- либо событии, процессе и т. п., являющиеся объектом некоторых операций: восприятия, передачи, преобразования, хранения или использования.

Информация создается и используется во всех видах человеческой деятельности: снабжения производства информацией; использования информации для принятия решений.

Соответственно двум понятиям «информация» и «данные» различают два аспекта рассмотрения вопросов – инфологический и датологический.

В инфологическом аспекте рассматриваются вопросы, связанные со смысловым содержанием данных независимо от способов их представления в памяти системы.

На этапе инфологического проектирования выделяется часть реального мира, определяющая информационные потребности системы, т.е. её предметную область.

В датологическом аспекте рассматриваются вопросы представления данных в памяти информационной системы.

В основе решения многих задач лежит обработка информации. Для облегчения обработки информации создаются информационные системы (ИС). Автоматизированными называют ИС, в которых применяют технические средства, в частности ЭВМ. Большинство ИС являются автоматизированными, поэтому для краткости просто будем называть их ИС.

Разновидности ИС. По области применения ИС можно разделить на системы, используемые в производстве, образовании, здравоохранении, науке, военном деле, социальной сфере, торговле и других областях.

По целевой функции ИС условно можно разделить на следующие основные категории: управляющие, информационно-справочные, поддержки принятия решений. В организациях, например, могут использоваться ИС, на которые возложены следующие задачи: учет кадров и материально-технических средств, расчет с поставщиками и заказчиками, бухгалтерский учет и т.п.

Общим для ИС является то, что они предназначены для регистрации, хранения и переработки информации с целью поиска и выдачи ответов на запросы пользователей. В настоящее время они разрабатываются как банки данных и банки знаний..

Банк данных (БнД) – это разновидность информационной системы, включающая комплекс методов и средств для поддержания динамической модели предметной области, с целью обеспечения информационных запросов пользователей.

Банк данных является разновидностью информационной системы, в которой реализованы функции централизованного хранения и накопления обрабатываемой информации, организованной в одну или несколько баз данных.

Предметная область. Предметная область (ПО)  это область применения конкретного банка данных. Различают БнД, применяемые в сфере управления предприятиями и организациями, транспортом, в медицине, научных исследованиях и т.д.

Банк данных выступает в роли специальной обеспечивающей подсистемы в составе АСУ различного профиля. БнД должен обеспечивать автоматизированную систему всей необходимой информацией, а в идеальном случае даже той, которая может потребоваться при расширении автоматизированной системы.

Банк данных в общем случае состоит из ряда компонентов: базы (нескольких баз) данных, системы управления базами данных, словаря данных, администратора, вычислительной системы и обслуживающего персонала (Рис.1).

Рис.1. Компоненты БнД

На рисунке 1 представлены следующие обозначения:

БД – база данных;

СУБД – система управления базами данных;

АБД – администратор базы данных;

ВС – вычислительная система;

СД – словарь данных;

ПО – обслуживающий персонал.

База данных. База данных (БД) представляет собой совокупность специальным образом организованных данных, хранимых а памяти вычислительной системы и отображающих состояние объектов и их взаимосвязи в рассматриваемой предметной области.

База данных – совместно используемый набор логически связанных данных (и описание этих данных), предназначенной для удовлетворения информационных потребностей организации.

База данных – это единое, большое хранилище данных, которое однократно определяется, а затем используется одновременно несколькими пользователями из разных подразделений, вместо разноместных файлов с избыточными данными, здесь все данные собраны вместе с минимальной долей избыточности. База данных уже не принадлежит какому-либо единственному отделу, а является общим корпоративным ресурсом.

Логическую структуру, хранимую в базе данных, называют моделью представления данных. К основным моделям относятся следующие: иерархическая, сетевая и реляционная, объективно-ориентированная и ряд других.

Система управления базами данных (СУБД)  это комплекс языковых и программных средств, предназначенный для создания, ведения и совместного использования БД многими пользователями.

Обычно СУБД различают по использованной модели данных. Так, СУБД, основанные на использовании реляционной модели данных называют реляционной СУБД.

Приложение представляет собой программу или комплекс программ, обеспечивающих автоматизацию обработки информации для прикладной задачи. Приложения могут создаваться в среде или вне среды СУБД  с помощью системы программирования, использующей средства доступа к БД. Приложения разрабатываются главным образом в тех случаях, когда требуется обеспечить удобство работы с БД неквалифицированных пользователей или интерфейс, предоставленный СУБД, не устраивает пользователей.

Словарь данных (СД) представляет собой подсистему БнД, предназначенную для централизованного хранения информации о структурах данных, взаимосвязях файлов БД друг с другом, типах данных и форматах их представления, принадлежности данных пользователям, кодах защиты и разграничения доступа и т.п. Иногда эту подсистему называют системным каталогом, а сами элементы системного каталога принято называть метаданными, т. е. «данными о данных». Говорят, что «выполняется генерация системного каталога». Следует знать, что функционально СД присутствует во всех БнД, но не всегда выполняющий эти функции компонент, имеет такое название.

Словарь данных призван: способствовать уменьшению избыточности и непротиворечивости данных, хранить централизованное описание данных, измерять описание существующих, удалять устаревшие типы данных, позволяет пользователям и АБД использовать единообразною терминологию по данной предметной области.

Администратор базы данных (АБД) есть лицо или группа лиц, отвечающих за выработку требований к БД, её проектирование, создание, эффективное использование и сопровождение. АБД следит за функционированием ИС, обеспечивает защиту от несанкционированного доступа, контролирует избыточность, непротиворечивость, сохранность и достоверность хранимой в БД информации.

В вычислительной сети АБД, как правило, взаимодействует с администратором сети, в обязанности которого входит контроль за функционированием аппаратно-программными средств сети, реконфигурация сети, восстановление программного обеспечения после сбоев и т. п.

Основная функция АБД – обеспечение структур данных и взаимосвязей между ними, эффективных для обслуживания всего коллектива пользователей.

Вычислительная система (ВС) представляет собой совокупность взаимосвязанных и согласованно действующих ЭВМ и других устройств, обеспечивающих автоматизацию процессов приёма, хранения, обработки и выдачи информации потребителям. Большое значение имеют такие параметры, как мощность центрального процессора (ЦП), и объемы оперативной и внешней памяти.

Обслуживающий персонал выполняет функции поддержания технических и программных средств в работоспособном состоянии. Он проводит профилактические, регламентные, восстановительные и другие работы по планам, а также по мере необходимости.

Пользователей БнД можно разделить на три большие группы.

Первая  прикладные программисты, которые отвечают за написание прикладных программ, использующих БД.

Вторая  конечные пользователи, которые работают с системами баз данных. Конечный пользователь может получить доступ к базе данных, используя одно из приложений.

Третья группа – администратор базы данных.

В составе информационной системы можно выделить три подсистемы.

Подсистема сбора информации обеспечивает отбор и накопление данных в информационную систему и включает совокупность источников информации, организационно-технологические цепочки отбо­ра информации для накопления в системе. Без правильно орга­низованной, оперативно и эффективно действующей организа­ционно-технологической подсистемы сбора информации невоз­можна эффективная организация функционирования всей информационной системы в целом.

Подсистема представления и обработки информации составляет ядро информационной системы и является отраже­нием представления разработчиками и абонентами системы структуры и картины предметной области, сведения о которой должна отражать информационная система. Подсистема пред­ставления и обработки информации является одним из наибо­лее сложных компонентов при разработке информационной си­стемы.

Подсистема выдачи ин­формации определяет пользователей, или иначе абонентов, системы, реализует целевой аспект назначения и выполнения задач информационной системы.

Информационным ядром (информационным фондом) под­системы представления и обработки информации АИС, или, говоря иначе, внутренним носителем знаний о предметной об­ласти является база данных (БД).

По характеру представления и логической организации хра­нимой информации ИС разделяются на фактографические, документальные и геоинформационные.

Фактографические ИС накапливают и хранят данные в виде множества экземпляров одного или нескольких типов структурных элементов (информационных объектов). Каждый из таких экземпляров структурных элементов или некоторая их совокупность отражают сведения по какому-либо факту, собы­тию и т. д., отделенному (вычлененному) от всех прочих сведе­ний и фактов. Структура каждого типа информационного объекта состоит из конечного набора реквизитов, отражающих

Отсюда и название «фактографические системы».

Основные аспекты и характеристики сведений для объектов дан­ной предметной области. К примеру, фактографическая ИС, накапливающая сведения по лицам, каждому конкретному лицу в базе данных ставит в соответствие запись, состоящую из оп­ределенного набора таких реквизитов, как фамилия, имя, отче­ство, год рождения, место работы, образование и т. д. Комплек­тование информационной базы в фактографических ИС вклю­чает, как правило, обязательный процесс структуризации входной информации из документального источника. Структу­ризация при этом осуществляется через определение (выделе­ние, вычленение) экземпляров информационных объектов оп­ределенного типа, информация о которых имеется в докумен­те, и заполнение их реквизитов.

В документальных ИС единичным элементом информа­ции является нерасчлененный на более мелкие элементы доку­мент и информация при вводе

(входной документ), как прави­ло, не структурируется, или структурируется в ограниченном виде. Для вводимого документа могут устанавливаться некото­рые формализованные позиции —дата изготовления, испол­нитель, тематика и т. д. Некоторые виды документальных ИС обеспечивают установление логической взаимосвязи вводимых документов—соподчиненность по смысловому содержанию, взаимные отсылки по каким-либо критериям и т. п. Определе­ние и установление такой взаимосвязи представляет собой слож­ную многокритериальную и многоаспектную аналитическую задачу, которая не может в полной мере быть формализована.

В геоинформационных АИС данные организованы в виде отдельных информационных объектов (с определенным набо­ром реквизитов), привязанных к общей электронной топогра­фической основе (электронной карте). Геоинформационные си­стемы применяются для информационного обеспечения в тех предметных областях, структура информационных объектов и процессов в которых имеет пространственно-географический компонент, например маршруты транспорта, коммунальное хо­зяйство и т. п.

Другим критерием классификации ИС являют­ся функции и решаемые задачи, основными из которых могут являться:

справочные;

поисковые;

расчетные;

технологические.

Справочные функции являются наиболее распространен­ным типом функций информационных систем и заключаются в предоставлении абонентам системы возможностей получе­ния установочных данных на определенные классы объектов (Лица, Организации, Телефоны, Адреса и т. п.) с жестко или произвольно заданным набором сведений. Видами информаци­онных систем, реализующих чисто справочные функции, явля ются всевозможные электронные справочники, картотеки, про­граммные или аппаратные «электронные записные книжки» и их более развитые аналоги в виде т. н. персональных инфор­мационных систем.

Системы, реализующие поисковые функции, являются наи­более широко распространенным классом информационных си­стем, которые чаще всего называют информационно-поисковы­ми системами (ИПС). ИПС в общем виде можно рассматривать как некое информационное пространство, задаваемое в тер­минах информационно-логического описания предметной об­ласти — «информационные объекты», «информационные свя­зи». Пользователям ИПС предоставляется возможность поиска и получения сведений по различным поисковым образам в та­ком информационном пространстве.

Расчетные функции информационных систем заключают­ся в обработке информации, находящейся в системе, по опре­деленным расчетным алгоритмам для различных целей. К чис­лу подобных задач относится вычисление определенных ста­тистических характеристик и показателей по экземплярам различных типов объектов и отношений, данные по которым накапливаются в системе. Широко применяющейся разновид­ностью расчетных информационных систем являются различ­ные системы автоматического проектирования, всевозможные бухгалтерские и финансово-экономические системы.

Технологические функции информационных систем заклю­чаются в автоматизации всего технологического цикла или от­дельных его компонент, какой-либо производственной или орга­низационной структуры. К системам, обеспечивающим подоб­ные задачи, относится широкий класс автоматизированных систем управления (АСУ, АСУ ТП). Другой разновидностью технологических информационных систем являются системы автоматизации документооборота.

Рассмотренная классификация автоматизированных инфор­мационных систем, как и всякая классификация, условна и на практике конкретная АИС может характеризоваться комплекс­ным характером представления информации (например, являться фактографически-документальной системой) и решать ком­плекс справочных, поисковых, расчетных и технологических задач.

Как правило, со стороны пользователей к БнД предъявляются следующие требования:

  • удовлетворять информационным потребностям пользователей;

  • обеспечивать заданный уровень достоверности хранимой информации и ее непротиворечивость;

  • обеспечивать доступ к данным только пользователям с соответствующими полномочиями;

  • обеспечивать возможность поиска информации по произвольной группе признаков;

  • удовлетворять заданным требованиям по производительности при обработке запросов;

  • иметь возможность реорганизации и расширения при изменении границ предметной области;

  • обеспечивать выдачу информации пользователю в различной форме;

  • обеспечивать простоту и удобство обращения внешних пользователей за информацией;

  • обеспечивать возможность одновременного обслуживания большого числа внешних пользователей и т.п.

Различают БНД, применяемые в сфере управления предприятями, организациями, транспортом, в медицине, научных исследованиях.

В качестве примера рассмотрим место банка данных в фирм, занимающейся закупкой, складированием и продажей товара (Рис.2).

Рис.2. Место банка данных в фирме

Фирма ищет производителей товаров, покупает у них товары высокого качества и размещает их на своем складе. Затем эти товары направляются в магазины клиентов для продажи. В процессе своей деятельности подсистемы закупки, складского учета и продажи обмениваются с производителями товаров, складом фирмы и продавцами, соответствующими документами. Данные по результатам соответствующих операций фиксируются в базе данных БнД.

Стремление к максимальному удовлетворению перечисленных требований приводит к необходимости решения вопроса о централизации управления данными, имеющей ряд преимуществ:

1.Сокращение избыточности хранимых данных. В системах, не использующих БД, каждое приложение имеет свои файлы. Это часто приводит к избыточности данных. Например, как приложение, связанное с учетом персонала, так и приложение, связанное с учетом обучения персонала, могут создать свой собственный файл с информацией о служащих. Эти два файла целесообразно объединить.

Замечание. Следует знать, что в БД полностью избыточность не устраняется. В одних случаях требуется дублировать значения ключевых полей для моделирования связей. А в других некоторые данные требуется дублировать для повышения производительности системы.

2.Устранение противоречивости хранимых данных. Избыточность данных порождает риск противоречий между разными версиями общих данных. Предположим, что сотрудница изменила фамилию. В файловой системе это приведет к следующему: изменения может быть сразу внесено в один файл, через неделю – в другой, а в третий изменения могут быть внесены неверно. По прошествии некоторого времени подобные расхождения могут существенно снизить качество информации, содержащейся в разных файлах. Такая несогласованность может отразиться на точности отчетов. Системы, использующие БД, позволяет избавиться от такой избыточности. Все приложения в этом случае используют один и тот же набор данных.

Замечания. Если избыточность данных все же есть, то противоречивости можно избежать введением системы контроля: если обновление данных осуществляется в одной записи, то оно должно автоматически распространиться на все остальные. Этот процесс называется множественным обновлением. Он применяется в распределенных базах данных.

  1. Многоаспектное использование данных. Это означает, что информационные потребности новых приложений могут быть обеспечены за счет уже имеющихся данных, т.е. обеспечивается реализация принципа однократного ввода и многократного (многоаспектного) использования данных.

  2. Обеспечение возможности стандартизации. Администратор БД может представить данные в определенных стандартах. Стандартизация важна для обмена и переноса данных между системами.

5.Возможность введения ограничений для обеспечения безопасности. Администратор БД может обеспечить доступ к БД через определенные «каналы» с наличием определенных ограничений.

    1. Возможность обеспечения целостности данных. Администратор БД определяет правила целостности, которые применяются при любой попытке проделать какую-либо операцию над данными.

    2. Улучшение показателей производительности работы программистов. В СУБД предусмотрено много стандартных функций, которые в других системах программист должен реализовывать самостоятельно.

    3. Упрощение сопровождения системы. В файловых системах описания данных и логика доступа к данным встроены в каждое приложение, что делает программы зависимыми от данных. В СУБД подход иной: описания данных отделены от приложений, а поэтому приложения защищены от изменений в описаниях данных. Эта особенность называется независимостью от данных.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]