
- •Тема 1. Информационные технологии: основные понятия, терминология и классификация
- •Тема 2. Информационная модель предприятия
- •Тема 3. Технология баз информации
- •Студенческий коллектив
- •Тема 4. Сетевые технологии
- •Оборудование сетевой ассоциации
- •Тема 5. Интернет-технологии
- •Организационная структура Интернета
- •Почтовый_ящик@почтовый.Домен
- •Тема 6. Информационные системы на предприятии
- •Раздел 1. Назначение и цели создания системы
- •Раздел 2. Требования к комплексу технических средств и системному программному обеспечению
- •Раздел 3. Требования к квалификации пользователей
- •Э кономическая эффективность эис
- •Тема7. Автоматизация операционных задач
- •Тема 8. Электронная коммерция и электронный документооборот
- •Интерактивные финансовые операции
- •Особенности технологии справочно-правовых систем
- •Тема 9. Автоматизация задач тактического управления
- •Программный продукт «Альт-Финансы»
- •Программный продуют «Audit Expert»
- •Тема 10. Автоматизация задач стратегического управления
- •Тема 11. Геоинформационные технологии
- •11.2. Пример компьютерной обработки данных дистанционного зондирования
- •Тема 12. Безопасность информационных систем
- •Тема 12. Геоинформационные технологии
Тема 3. Технология баз информации
Автоматизированный банк данных.
Базы данных и требования к ним
Модели описания данных.
Системы управления базами данных.
Автоматизированные банки документов и знаний.
АВТОМАТИЗИРОВАННЫЙ БАНК ДАННЫХ
Современной формой организации информационных систем являются банки данных, которые представляют собой:
систему информационных, математических, программных, языковых, организационных и технических средств, предназначенных для централизованного накопления и коллективного использования с целью получения необходимой информации;
сложную информационную систему, на вход которой поступают исходные данные, а на выходе пользователь получает результатную информацию;
информационную модель объекта, информация о котором необходима для обеспечения управления этим объектом.
Автоматизированный банк данных включает:
вычислительную систему;
одну или несколько баз данных;
набор прикладных программ пользователей;
систему управления базами данных;
языковые средства (языки программирования, языки запросов и ответов, языки описания данных);
методические средства (инструкции и рекомендации по созданию и функционированию банков данных, выбору системы управления базами данных);
техническую составляющую, основой которой является компьютер, удовлетворяющий по своим техническим характеристикам определенным требованиям.
Преимущества работы с банком данных:
повышается производительность труда пользователей и уровень удовлетворения их информационных потребностей;
прикладные программисты освобождаются от необходимости организации данных за счет централизованного управления ими;
обеспечивается независимость прикладных программ от данных;
снижаются затраты на создание и хранение данных и поддержание их в актуальном состоянии;
уменьшаются потоки циркулирующих в системе данных.
взаимодействие пользователя
с банками информации
Взаимодействие пользователя с банками информации осуществляется посредством информационных языков и языков запросов.
Информационные языки — это искусственные языки, являющиеся основным средством представления информации для ввода, хранения, поиска и обработки и предназначенные для записи семантической (смысловой) информации с целью последующего ее использования в различных системах. Информационный язык должен:
однозначно представлять информацию на лексическом и грамматическом уровне, так как различная трактовка в представлении данных неизбежно приведет к искажению информации;
иметь достаточную для решения задач степень полноты и детализации представления информации, подлежащей хранению и обработке. Документальная автоматизированная база данных создается под круг интересов пользователей и при этом безразлично, каковы состав и глубина описаний сведений, которые пользователь будет извлекать из найденного документа. Фактографический автоматизированный банк данных создается под задачи, решаемые на основе хранимой в нем информации, и они определяют набор хранимых сведении и глубину их описания;
быть ориентированным на пользователя-непрограммиста, максимально опираться на элементы привычного для него естественного языка;
обеспечивать стандартное описание однотипных элементов информации и высокую надежность идентификации описаний. Если одни и те же сведения, поступающие в базу данных, будут описаны по-разному, они будут рассматриваться как различные и храниться раздельно, что приведет к избыточности данных. Кроме того, банк данных не сможет осуществлять обобщение сведений, относящихся к одному и тому же объекту;
допускать возможность внесения изменений и дополнений без изменения основ языка. Необходимость изменения языка определяется как непрерывным совершенствованием задач, так и введением новых задач, которые могут повлечь за собой расширение состава и глубины описания фактов.
Языки запросов (языки общения) включают не только средства описания фактов, но и средства, указывающие, какую именно обработку отобранных фактов следует провести, какие элементы описаний и в какой форме следует выдавать.
С автоматизированным банком данных взаимодействуют источники и пользователи информации (внешние пользователи) и персонал банка данных (внутренние пользователи). Источниками информации могут быть конкретный работник, техническое устройство, взаимодействующая с банком данных система, которые передают автоматизированному банку сведения, предназначенные для корректировки хранимых в нем данных.
Потребители информации посылают в систему различного вида запросы, которые должны быть гибкими и позволять пользователю просматривать данные так, как это ему необходимо. Запрос содержит следующие обязательные элементы: категорию срочности, номер, указатель отбора, указатель обработки, код пользователя, адрес ответа, указатель выдачи. От автоматизированного банка данных к пользователю поступают сообщения сигнального информирования, сообщения о неправильно составленных запросах с отметкой о месте ошибки. Сообщение, содержащее ответы на запросы пользователя, содержит обязательные элементы: категорию срочности, номер или содержание запроса, ответ на запрос, время выдачи ответа.
БАЗЫ ДАННЫХ И ТРЕБОВАНИЯ К НИМ
Под базой данных (БД) понимается совокупность взаимосвязанных данных некоторой предметной области, хранимых в памяти ЭВМ и организованных таким образом, чтобы эти данные могли быть использованы для решения многих задач многими пользователями. Базы данных хранятся на магнитных дисках и по мере необходимости считываются в оперативную память ЭВМ, в которой происходит непосредственно их обработка.
База данных — это компьютерная информационная модель внешнего мира, некоторая его предметная область. В ней, как правило, хранятся данные об обьекгах, их свойствах и характеристиках, поскольку во внешнем мире обьекгы взаимосвязаны между собой, в БД эти связи находят отражение.
Успешное функционирование БД может быть осуществлено только при выполнении ряда требований к ее организации.
Неизбыточность данных. Это требование тесно связано с «интег-рированностыо» БД. Неизбыточность данных предполагает, что в идеале любые данные будут храниться в БД в одном экземпляре. Дублирование данных не только увеличивает объем требуемой памяти, но и, самое главное, может легко привести к «противоречивости» данных. Кроме того, дублирование данных увеличивает трудоемкость корректировки базы.
Совместное использование данных. Одни и те же данные базы могут использоваться несколькими пользователями (задачами). При этом желательно, чтобы каждый пользователь (задача) получал эти данные в удобном для него виде. В случае одновременного использования одних и тех же данных разными пользователями (задачами) должен быть обеспечен мультидоступ к данным базы.
Расширяемость базы данных. БД должна обладать способностью к расширению, которое может быть за счет:
увеличения числа экземпляров однотипных данных;
введения в БД новых типов объектов или новых типов взаимосвязей.
Необходимо, чтобы введение новых типов объектов или связей не требовало каких-либо изменений в уже существующих в БД данных.
Простота работы с базой данных. В условиях разработки и эксплуатации крупной системы обработки данных важное значение приобретает простота работы с данными БД, т.е. необходимо, чтобы:
структура данных была логичной и ясной;
операции доступа к данным обладали ясными и четко очерченными функциями;
без больших трудозатрат выполнялись различные обслуживающие операции (копирование, перепись с носителя на носитель, расширение базы и др.).
Эффективность доступа к базе данных. Под эффективностью здесь понимается обеспечение временных ограничений при доступе пользователей (задач) к данным.
Целостность базы данных. Под целостностью базы данных в общем случае понимается ее готовность к работе. Целостность базы данных — сложное понятие, имеющее много аспектов. Укажем на следующие из них:
физическая целостность, т.е. сохранность информации на магнитных носителях и корректность форматов данных;
логическая целостность, под которой понимается непротиворечивость данных в базе;
актуальность данных, т.е. соответствие данных реальному положению вещей.
Потеря целостности базы данных может произойти от сбоев аппаратуры ЭВМ, ошибок в программном обеспечении, при вводе и корректировке данных, низкой достоверности самих данных и т.д., поэтому обеспечить целостность базы реального объема весьма сложно. В то же время потеря целостности данных ведет к самым серьезным последствиям вплоть до полной перегрузки данных базы. Если учесть, что обычно базы данных накапливаются годами или даже десятками лет, то потеря целостности БД зачастую влечет очень тяжелые последствия.
Конфиденциальность данных. Обеспечение защиты данных от несанкционированного доступа и модификации, заключающейся в том, что пользователю, не владеющему правами и ключом доступа, полностью закрыт доступ к БД или какой-либо ее части.
Жизненный цикл базы данных включает:
стадию анализа, когда происходит формулирование требований концептуального проектирования. Основная его цель состоит в согласовании целей пользователей и их представлений об информационных потоках;
стадию проектирования, здесь производится реализация базы данных. Результатом логического проектирования является логическая структура базы данных — функциональное описание программных модулей и наборов запросов. Результатом физического проектирования является подготовка базы данных к эксплуатации — выбор физической структуры базы данных, отладка программных модулей;
стадию реализации, когда решаются задачи разработки программ доступа к базе данных.
Структура базы данных может меняться с изменениями в предметной области. Проектирование базы данных начинают с анализа предметной области и выявления требований к ней конечных пользователей.
Администратор базы данных определяет, какие именно данные будут храниться в базе в процессе концептуального проектирования, учитывает и объединяет требования разных групп пользователей. После этого создается обобщенное описание создаваемой базы данных с использованием естественного языка, математических формул, графиков.
Следующим этапом является непосредственно формализация представления данных в базе данных.
Модели описания данных.
Ядро любой БД — модель данных, представляющая собой множество структур данных, ограничений целостности и операций манипулирования данных. В настоящее время наибольшее применение получили иерархическая, сетевая и реляционная модели данных.
Модель данных описывает набор базовых признаков, которыми должны обладать все конкретные базы данных. База данных оперирует с различными объектами (сущностями), какими, к примеру, могут быть:
покупатель (атрибуты: название, адрес, телефон, факс, ИНН, расчетный счет, корреспондентский счет);
номенклатура (атрибуты: название, единица измерения, группа номенклатуры);
документ (атрибуты: тип документа, номер документа, дата выписки) и т.д.
Типы объектов предприятия, для управления которыми создается информационная технология, изменяются во времени достаточно редко, поэтому и структура данных для этих объектов достаточно стабильна. По этой причине возможно построение информационной базы с постоянной структурой и изменяемыми значениями данных. Взаимосвязи между логическими записями и элементами базы данных классифицируются по следующим видам:
«один к одному», когда одна запись может быть связана только с одной записью;
«один ко многим», когда одна запись взаимосвязана со многими другими;
«многие ко многим», когда одна и та же запись может входить в отношения со многими другими записями в различных вариантах.
Названные варианты взаимосвязей определяют три основные модели баз данных.
Иерархическая модель предполагает использование для описания базы данных древовидных структур, состоящих из определенного числа уровней. «Дерево» представляет собой иерархию элементов, называемых узлами. В качестве примера простой иерархической структуры можно привести административную структуру высшего учебного заведения, элементам которой являются: «Университет» — «Факультет» — «Группа». Пример построения иерархической структуры приведен на рис. 3.1.
Рис.
3.1. Пример
построения иерархической структуры
На каждом уровне иерархии данной структуры могут быть использованы различные атрибуты. Например, атрибутами третьего уровня (Группа) могут быть: специализация группы, численный состав, фамилия старосты группы и другие. В данной модели имеется корневой узел или просто корень — «Университет», который находится на самом верхнем уровне иерархии, а потому не имеет узлов, стоящих выше его. Каждый узел модели имеет только один исходный, находящийся по отношению к нему на более высоком уровне корень. На последующих уровнях классификации он может иметь один, два или большее количество узлов, либо не иметь их вообще.
Принципы построения иерархической структуры:
иерархия всегда начинается с главного узла;
главный узел называется корневым или просто корнем, причем одно дерево может иметь только один корень;
узел может содержать один или несколько атрибутов, описывающих находящийся в нем объект;
порожденные узлы могут встраиваться в «дерево» как в горизонтальном так и в вертикальном направлении;
доступ к порожденным узлам возможен только через исходный узел, поэтому существует только один путь доступа к каждому узлу.
Достоинством модели является наличие промышленных систем управления базами данных, поддерживающих ее, простота понимания принципа иерархии. Однако такая система обладает жесткой, заранее задаваемой структурой, что не позволяет осуществлять классифицирование объектов по не предусмотренным ее схемой признакам. Иерархия усложняет операции включения информации о новых объектах и удаления устаревшей информации из базы данных, что затрудняет использование системы.