
Лекции
Цели и задачи курса
Получить представление о банках данных и знаний, об их роли в информационных системах, об организации систем управления данными , об администрировании баз данных, и о тенденциях их развития.
Понятие информации
Термин информация происходит от латинского слова informatio – объяснение, изложение, сведения. Информация настолько общее понятие, что в него вкладывают различные смыслы в технике, науке, быту.
Информация- сведения об объектах, явлениях окружающей среды, их параметрах, свойствах и состоянии.
Свойства информации
Достоверность
Полнота
Срочность
Ценность
Своевременность
Понятность
Защищенность
Краткость и т.д.
Динамические свойства информации
1.Рост.
В результате деятельности людей информация об определенном объекте может увеличиваться.
2. Повторяемость.
Информация способна многократно распространяться.
3.Старение.
С течением времени интенсивность использования информации объекта может уменьшиться.
4.Рассеиваемость.
Информация может рассосредотачиваться по различным источникам и отражена в различной форме.
Данные
Информация об объекте или отношениях объектов, выраженная в знаковой форме, образует данные.
Д
анные
можно перекодировать, т.е. переводить
из одной знаковой системы в другую без
потери информации.
Системы управления базами данных (СУБД)
Системы управления базами данных (СУБД) – основа современной информационной технологии. Они представляют собой базы данных, т.е. набор файлов, содержащих интересуемые пользователя данные и систему управления базами данных (СУБД).
СУБД предоставляет пользователю услуги для использования базами данных. Роль СУБД - посредник между приложением (MS Access), с которым работает человек, и физическими файлами в памяти ЭВМ.
Требования к СУБД
В зависимости от характера информации, сохраняемой в файлах, различают 2 класса баз данных:
Документальные;
Фактографические
Документальные базы данных содержат документы на естественном языке. Примерами таки баз данных являются книги, публикации в периодике, тексты законов и т.д. Они обеспечивают смысловой анализ при неполном, приближенном представлении смысла.
Фактографические системы оперируют со сведениями, представленными в виде формализованных записей данных.
СУБД- программная среда, предназначенная для создания на ЭВМ общей базы данных для одного или нескольких приложений, поддержании ее в актуальном состоянии, обеспечения эффективного доступа пользователей к данным в рамках представленных им полномочий.
Доступ к базам данных отдельных пользователей возможен только посредством СУБД.
Классификация СУБД
1. По используемому языку общения:
а) замкнутые (имеют самостоятельные языки общения пользователей с базами данных, позволяет пользователю непосредственно общаться с базами данных без программиста посредством диалога);
б) открытые (для общения с базами данных используется язык программирования, но при этом необходимо присутствие программиста).
2. По числу поддерживаемых уровней моделей данных.
Теоретически выделяют 3 уровня моделей данных, но на практике для ПЭВМ часто объединяют концептуальный и внутренний уровень представления
3.По выполняемым функциям:
а) операционные(позволяют получать информацию в явном виде баз данных путем какой-либо обработки информации)ж
б) информационные (позволяют хранение, поиск и выдачу нужных данных из баз данных).
4.По сфере применения:
а) универсальные (которые можно настроить на любую предметную область путем использования прикладных программ)
б) проблемно-ориентированные (ориентация на те процедуры обработки данных, которые присущи конкретной области применения).
5.По числу пользователей:
а) однопользовательская;
б) многопользовательская.
6.По поддерживаемой модели данных:
а) реляционные:
а) сетевые;
б)иерархические;
б) объектные;
Реляционные базы данных хранят данные в виде таблиц. В объектных базах данных данные организованы в виде объектов.
В реляционных базах данных данные представлены в виде таблиц. Каждая строка такой таблицы есть запись, поля которой содержат характеристики какого-то конкретного объекта окружающего мира. Например, студента Иванова. Столбцы этой таблицы называются атрибутами. Тип каждого атрибута задается отдельно, а формат картежей (записей) одинаков.
Обычно используется сетевая организация баз данных. При этом каждая таблица имеет один или несколько ключевых оборотов. Если этот столбец объявлен ключевым, то в нем не может быть двух одинаковых значений в строках. Связи между таблицами устанавливаются благодаря ключевым атрибутам. Например, одна таблица базы данных содержит общие сведения о студентах, вторая- о рейтинге, третья- о их состоянии здоровья и т.д. Все эти таблицы должны иметь какой-то общий ключевой атрибут. Этим атрибуту не может быть фамилия, поскольку однофамильцы встречаются часто. Поэтому вводится какой-то неповторяющийся атрибут. Например, номер зачетки или код студента. Этот атрибут, содержащий код студента, должен содержаться во всех таблицах. Но если в таблице с основными сведениями он должен быть ключевым, то в остальных таблицах это необязательно. Например, если студент несколько раз обращался к врачу, то в «медицинской» таблице может быть несколько строк, относящихся к нему по атрибуту код студента, т.е. один и тот же код будет содержаться в нескольких строках, и поэтому этот атрибут не будет ключевым в «медицинской» таблице, но он необходим для связи «медицинской» и общей таблицы.
Иерархические базы данных
Их особенность состоит в том, что попасть в таблицу какого-либо уровня (кроме первого) можно только с таблицы первого уровня (с корневого узла), т.е. попасть на i+1 уровень можно только из таблицы i-того уровня.
Таблицы при этом содержат один или несколько атрибутов, устанавливающих связь, если надо, с таблицей следующего уровня. Обычно это бывает один или несколько атрибутов нужной таблицы следующего уровня.
В настоящее время иерархические базы данных применяются очень мало, поскольку в среднем они менее быстродействующие. Сейчас же при огромных объемах баз данных быстродействие - значимый параметр.
=====================================================================
Банки данных
Под банком данных понимается организационно-техническая система, представляющая совокупность баз данных, пользователей, технических и программных средств формирования и ведения этих баз, и администраторов, обеспечивающих функционирование системы, а также самих данных, хранимых в базах данных.
Составные части банка данных
Банки данных содержат адекватное информационное отображение какой-то предметной области и обеспечивают хранение, обновление, выдачу необходимых данных, а сама база данных - совокупность хранимых во внешней памяти ЭВМ данных большого объема.
Основное отличие банка данных от СУБД в том, что это понятие включает себя персонал (администраторы баз данных).
Администраторы БД
Администратор ответственен за общее управление системой баз данных.
Обязанности администратора:
Определение информационного содержания баз данных
(т.е. принимает решение о том, какая информация должна содержаться в базе данных и определяет их логическую организацию, т.е. разрабатывает так называемую логическую модель данных)
Взаимодействие с пользователем
Администратор имеет глобальное представление об организации данных и несет ответственность за их сохранность. Он помогает пользователям формулировать корректные задания при работе с базами данных. С другой стороны, он должен быть в курсе того, какие именно данные требуются пользователю для работы. Это необходимо для выполнения пункта 1.
Определение структуры памяти и стратегии доступа.
Администратор решает, каким образом представляются данные в памяти, т.е. разрабатывает физическую организацию данных.
Определение стратегии отказа и восстановления.
В случае повреждения всей базы данных или ее части, надо предусмотреть возможность восстановления данных с минимальной задержкой и без влияния на сохранившуюся часть данных, т.е. он определяет стратегию восстановления.
Модернизация и эффективность работы баз данных.
На практике для выполнения своих функций администратор использует набор вспомогательных программ. Например, программа ведения системного журнала, где хранятся сведения о каждом обращении к базе данных, и программы анализа статистики использования базы данных. На практике администратор - не один человек, а группа лиц. Они имеют полномочия по корректировке баз данных, отвечают за целостность данных, и за защиту их от несанкционированного доступа.
Пользователи БД
Работающие с базами данных пользователи обладают различными навыками и знаниями и сталкиваются с решением различных задач.
Спектр пользователей:
Конечные пользователи
Разработчики БД
Разработчики приложений
Администраторы БД
Конечные пользователи – это либо специалисты, которым по роду их деятельности требуются данные, содержащиеся в БД, либо случайные пользователи. Например, база данных о наличии билетов на поезда может использоваться как обычным покупателем билета (чтобы узнать расписание поездов и наличие свободных мест), так и кассиром, который осуществляет свои профессиональные обязанности путем работы с базой данных.
Разработчики баз данных – это специалисты в области программного обеспечения, определяющие содержимое базы данных и создающие ее.
Порядок работы разработчиков баз данных при создании базы данных:
Интенсивные консультации с пользователями для определения круга решаемых задач
Далее проводится анализ всевозможных документов, чтобы определить, какую информацию и как надо ее хранить в базе данных
Формализация той информации, которую будет содержать база данных
Создание спецификации(перечня) содержимого базы данных и подписание соглашения с пользователями на основе этой спецификации
Написание программного обеспечения.
Разработчики приложений проектируют и разрабатывают приложения, которые используют БД. Например, система MS Access, интерфейс пользователя, программы анализа данных, информационные системы, администраторы (см. выше).