Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
19
Добавлен:
20.02.2016
Размер:
346.11 Кб
Скачать

1 вопрос. Информация, знания, данные.

Знание - форма сущ. и систематизац. результатов познават. деятельности чел-а; совокупность понятий, теоретических построений и (широкий смысл); данные, информация (узкий смысл).

Данные – не подвергшиеся обработке сведения, факты, измерения, сигналы, имеющие отношение к событиям. Они являются «сырым» материалом для дальнейших преобразований.

Информация – совокупность фактов, явлений, событий, представляющий интерес, подлежащих регистрац.,обработке - это обработаны, осмысленные данные.

Знания — информация о мире, включающ. в себя информацию о свойствах объектов, закономерностях процессов и явлений, правилах исполь. этой информации для принятия решений. Правила использования включают систему причинно-следственных связей. Ответ на вопрос «Как ?».

Знания м.б.: 1)декларативные (о структуре нек.понятий), 2)процедурные (редставл.о ср-вах,путях получения новых знаний); 1)научные (эмпирические, теоретические) и 2)вненаучные (паранаучные, псевдоначные,антинаучные, повседневно-обыденные, личностные); 1)явные (на дисках,в книгах) и 2)неявные (в голове у человека).

2 вопрос. Экономическая информация.

ЭК.ИНФ – это совокупность различных сведений эк-ого хар-ра, используемых для планирования, учёта, контроля, анализа и управления нар-ым хо-вом и его звеньями.Эк.инф. включ. сведения о трудовых, матер-ых и денежн. рес-ах и деят-ти эк.-их объектов на определённый момент. Эти сведения представляются натур-ыми и стоимостными показателями.

Классификация:

1)по ф-циям управления: а)учётная, б)плановая, в)оперативного управления, г)статистическая; 2)по месту возниновения: а)внутренняя; б)внешняя; 3)по стадиям образования: а)первичная (на начальн.стадиях управления) и б)вторичная(в рез-те обработки первичной); 4) по способу представления – цифровая, алфавитно-цифровая, графическая; 5) по стабильности – переменная, условно-постоянная, постоянная; 6) по полноте – недостаточная, достаточная, избыточная; 7) истинности – достоверная, недостоверная; 8) по временному периоду возникновения – периодическая и непериодическая

Требования к экон.инф-ции:

1)корректность (однозначносе вопоиятие всему) 2)полезность (способствует достижению цели) 3)оперативность (актуальность) 4)точность 5)достоверность 6)устойчивость 7)достаточность 8) своевременность подачи 9)простота кодирования 10) доступность подачи 11)мин. расходов на обработку

Структурн.единицы эк.инф-ции:

- резвизиты (совокупность формальн.эл-тов , выражающ.опред.св-ва объекта): реквизит-признак(ФИО,время,место действия) и реквизит-показатель(объём продукции,цена), - показатели (сочет.реквизита-основания с неск. реквизит-признак.), - документы (совокупность логич.связ.реквизитов,имеющ.юридич.силу), - массивы (соков.док.,связ.по опред.признаку).

3 вопрос. Файловая организация данных.

При реш-ии задач автоматизир-ой обраб-ки данных приходится иметь дело с > объемами обрабатываемой инф-ции. Данные имеют сложную стр-ру, а алгоритмы их обраб-ки сравнительно просты. При этом предъявляются высокие требования к надежности хранения инф-ции и скорости ее обраб-ки. На начальном этапе машинной обраб-ки данных длительность хранения инф-ции во внешней памяти была огранич. возможностями магнитных лент и магнитных барабанов.

- магнитные ленты (данные хранятся в последовательных файлах, где запись располагается за записью и для поиска конкретной записи нужно прочесть файл от начала до этой записи. При этом скорость обмена информацией с магнитными лентами была низкой).

- магнитные барабаны (давали возможность произвольного доступа к данным, но имели очень ограниченный объем памяти и также невысокую скорость обмена информацией).

В 60-е гг. ХХ в. появились сменные магнитные диски. Эти устройства внешней памяти имели существенно больший объем, обеспечивали хранение данных в файлах произвольного доступа и удовлетворительную скорость доступа к данным.

Файловая организация данных для обработки больших массивов информации имела ряд недостатков: 1) высокую степень избыточности данных в файлах. (для обеспечения автоматизированной обработки данных приходилось хранить несколько копий одного и того же файла с рассортированными по разным полям записями);

2) жесткую связь данных и прикладных программ. (При разработке программ описание данных включалось непосредственно в программу. Если изменялась структура данных, то переделывалась и программа. 3) отсутствие возможности установки связи между данными разных файлов; 4) ограниченный контроль данных; 5) недостаточные возможности управления данными.

Перечисленные недостатки файловой организации, а также необходимость централизации данных с целью коллективного доступа к ним, повышенные требования к скорости обработки и достоверности данных стали причинами, обусловившими появление и быстрое развитие баз данных.

4 вопрос. Понятие БД.

БД – это именованная совок-ть данных, отображ-ая сост-ие объектов, их св-ва и взаимоотно-ия в некот-ой предметной области. Объект - предмет, вещ-во, событие, лицо, явл-ие, абстрактн. понятие, т.е всё, что м. харак-ться набором знач-ий некот-ой совок-ти атрибутов. Атрибут – это инф-ционное отображ-ие св-ва объекта. Предметная область – это часть реального мира, кот. описыв-ся и моделир-ся с помощью БД.

Преимущества БД.

1)В БД инф-ция хранится централизованно (многие одновременно имеют возм-ть доступа, просмотра и изменеия данных. Позволяет легче изменять данные, соглас-ть их, экон-ть досковое прост-во); 2)организация данных в базах даёт возмож-ть поиска и отображения данных; 3)обращение к данным без знания физического расположения их в памяти компьютера., вследствие чего доступ к данным и их обработка более просты.

Приложения БД

- запросы (требование пользователя на отбор данных из бады и/или на выполнение опред-ых действий); - формы (исп-ся главным образом для ввода, просмотра и редактирования данных; - отчёты (представление инф-ции из БД в виде, удобном для её восприятия и анализа пользователем); - web-страницы (предназначены для публикации БД в сети Интернет); - прикладные программы.

Данными, входящими в состав БД, управляет программная система, называемая системой управлния БД (СУБД).

Компоненты БД

- данные пользователей; - метаданные (описание стр-ры БД, произведённое СУБД, чаще всего хранится в форме таблиц, называемых системными); - данные, призванные улучшить производительность и доступность БД (состоят из индексов); - метаданные приложений (это описания стр-ры и формата пользовательских запросов, форм, отчётов и др. приложений, выполненные СУБД).

5. Понятие СУБД

Предшественницей системы управления базой данных была файловая система.

К причинам, вызвавшим появление СУБД, относят следующие: растущие объемы обрабатываемой информации, сложные структуры организации данных, необходимость коллективного доступа к данным, высокие требования к скорости обработки и достоверности получения результата и др.

Это привело к созданию единой базы логически связанных данных для всех задач конкретной предметной области и разработке одной общей программы, которая позволяет создать базу и манипулировать ее данными и которая получила название СУБД. Концепция СУБД была разработана в 1972г. в США фирмой IBM . Первые СУБД создавались для больших и мини-ЭВМ. Впоследствии были созданы СУБД и для персональных компьютеров. Система управления базами данных – это совокупность программных и языковых средств, предназначенных для управления данными, ведения базы данных и обеспечения взаимодействия с прикладными программами.

В комплекс программных средств СУБД входят программы защиты от несанкционированного доступа, контроля достоверности данных и др.

В целом СУБД представляет собой универсальное программное средство, предназначенное для: - создания общей базы данных для множества приложений; - поддержания ее в актуальном режиме; - обеспечения эффективного доступа пользователей к содержащимся в базе данным; - поддержания защиты и восстановления данных, их целостности и непротиворечивости.

Система управления базами данных включает в себя: средства создания базы данных, средства работы с базой данных, сервисные средства.

Кроме понятий: база данных (БД) и система управления базой данных (СУБД, – в литературе встречается и понятие банка данных (БнД). Банк данных включает следующие основные компоненты: базу данных (или несколько баз); систему управления базой данных; словарь-каталог данных; вычислительную систему; администратора базы данных; обслуживающий персонал. Банк данных – это система информационных, математических, программных, языковых, организационных и технических средств, предназначенных для централизованного накопления и коллективного многоаспектного использования данных для получения необходимых результатов.

6.Архитектура типичной СУБД. Средства проектирования, подсистема обработки, ядро СУБД.

Современные СУБД различаются по своим характеристикам и выполняемым ими функциям. Однако практически во всех из них можно выделить три компоненты :

подсистему средств проектирования,

подсистему средств обработки

ядро.

Подсистема средств проектирования представляет собой набор инструментов, обеспечивающих проектирование и реализацию баз данных и их приложений. Обычно включает в себя средства для создания таблиц, форм, запросов и отчетов.

Подсистема обработки обеспечивает работу с компонентами, созданными с помощью средств проектирования. Это – процессор форм, процессор запросов, генератор отчетов, средства обработки, основанные на процедурных языках.

Ядро системы выполняет функцию посредника между подсистемами проектирования и обработки и данными. Ядро СУБД получает запросы от двух других компонентов и преобразует их в команды операционной системы, выполняющие запись и чтение данных с физического устройства. Ядро является основной резидентной частью СУБД. Оно обладает собственным интерфейсом, не доступным непосредственно пользователям.

7.1. Классификация СУБД. Функциональные возможности СУБД. Производительность СУБД. Показатели производительности СУБД. Режимы работы пользователя с СУБД.

Основным признаком классификации СУБД является тип поддерживаемой модели данных. Согласно этому признаку СУБД делят на иерархические, сетевые, реляционные и др. По степени универсальности различают два класса СУБД: системы общего назначения и специализированные системы. По режиму работы современные СУБД делят на однопользовательские (настольные) и многопользовательские.

Функциональные возможности СУБД были сформулированы Э. Коддом в 1982 году в виде восьми основных функций. Хранение, извлечение и обновление данных – это самая фундаментальная функция СУБД. Наличие доступного конечным пользователям каталога, в котором хранится описание элементов данных. Поддержка механизма транзакций. Транзакция представляет собой набор действий, выполняемых отдельным пользователем или прикладной программой для доступа или изменения содержимого базы. Поддержка механизма, гарантирующего корректное обновление данных при параллельном выполнении операций обновления многими пользователями. Поддержка средств восстановления базы при ее повреждении или разрушении. Гарантия доступа к базе только санкционированным пользователям. Обеспечение безопасности данных за счет их шифрования, защиты паролем. Способность к интеграции с коммуникационным программным обеспечением для осуществления обмена данными с терминалами, за которыми работают пользователи. Обеспечение целостности данных, т.е. наличие средств, позволяющих удостовериться, что содержимое базы всегда остается полным и корректным.

7.2. Классификация СУБД. Функциональные возможности СУБД. Производительность СУБД. Показатели производительности СУБД. Режимы работы пользователя с СУБД.

Производительность современных СУБД оценивается по следующим параметрам:

время выполнения запросов;

скорость поиска информации в неиндексированных полях;

скорость создания индексов и выполнения таких массовых операций, как обновление, вставка, удаление данных;

максимальное число параллельных обращений к данным в многопользовательском режиме;

время генерации отчета;

время выполнения операций импортирования базы данных из других форматов.

На производительность СУБД оказывают влияние и такие факторы, как:

СУБД, которые следят за соблюдением целостности данных, несут дополнительную нагрузку, которую не испытывают другие СУБД;

производительность собственных прикладных программ существенно зависит от правильного проектирования и построения базы данных.

Современный пользователь может работать с СУБД в следующих режимах: командном, программном, меню.

8.Понятие модели данных. Классификация моделей данных

Первоначально исследования в области БД были направлены на разработку способов структуризации данных, получивших название «модели данных». Модель данных – это совокупность принципов организации БД. модели данных различаются принципами определения, манипулирования и хранения данных в базе. Но наиболее важным является способ организации связей между данными в базе. Классическими являются иерархическая, сетевая и реляционная модели данных. Кроме того, при разработке БД в последнее время активно используются такие модели как постреляционная, объектно-ориентированная, объектно-реляционная и многомерная модели.

9. Трёхуровневая модель организации БД

В настоящее время используется трёхуровневая модель организации БД, предложенная в 1975 г. комитетов по стандартизации Ansi. Одна и та же БД имеет различные уровни описания.

Внешний уровень – это представление о БД отдельных пользователей и прикладных программ. Каждый пользователь, каждая прикладная программа видят и обраб-ют только те данных предметной области, которые им необходимы.

На концептуальном ур-не БД представл-ся обобщенно – объедин-ся данные, используемые различными пользователями и прикладными программами. Концепт-ый ур-нь фактически определяет обобщённую модель предметной области и не содержит никаких сведений о методах хранения данных.

Внутренний ур-нь поддерживает представление БД в памяти компьютера.

11 вопрос. Сетевая модель

Представлениа сетев.структурами типа запись данных, связ.отношениями «один-к-одному» и «один-ко-многим». Это структура, у которой любой элемент может быть связан с любым другим элементом. 1 или неск. элементов имеют более 1 исх. элемента.

Более универсальны, так как взаимосвязи большинства предметных областей имеют сетевой характер.

Технология работы удобна для пользователя: возможен непоср. доступ к элементам данных. Сетевая БД состоит из наборов записей, которые связаны между собой так, что записи могут содержать явные ссылки на другие наборы записей. Так они образуют сеть. Связи между записями могут быть произвольными, и эти связи явно присутствуют и хранятся в базе данных.

Достоинство: высок эфф-ть затрат памяти;оперативность обработки данных. Недостаток – сложность и жесткость схемы базы;сложность понимания;ослаблен контроль целостности, тк в ней допускается устанавливать произвольные связи между записями.

Исп.связей «мног-ко-многим» позвол.устанить недост. иерархич.модели: низк.приспосабливаемость к описанию данных иерархич.структуры и слабую гибкость при развитии системы.

Сравнивая иерархич и сетевые: сетевые обеспеч достат быстрый доступ к данным, (тк осн структура представл инфы имеет форму сети: каждая вершина (узел) может иметь связь с любой другой. Данные в сетевой более равноправны: доступ к ним мб осуществлен, начиная с любого узла.

12 вопрос. Реляционная модель

Описание 1970-71 Кодда. Основана на процедурном языке обработки таблиц данных и языке запросов. Она породила все современные известные СУБД. Её детищем является SQL, благодаря реляц.модели возможно создание распределенных БД.

В реляц.БД все данных хранятся в виде прямоуг.таблиц, при этом все операц. над БД сводятся к манипуляции с таблицами. Данные в таблицах координир-ся путём установл. коючевых полей в разл.таблицах.

Отсутств. иерархия элементов. Строки и столбцы мб просмотрены в люб. порядке: гибкость выбора люб подмножества Эл-тов в строках и столбцах всока.

Таблица сост из строк, которые называют записями, и столбцов, кот наз. полями. На их пересеч.нах-ся конкретн. значения данных. Для кажд. поля определяется множество его значений, например(поле «Месяц» -12)

Поименованный столбец отношения называется атрибутом, а множество допустимых значений 1 или неск атрибута – доменом. Кажд атрибут определяется на некотором домене. Строки отношения со значениями разных атрибутов называют кортежами.

Терминолония альтернативна: математ.термины: отношение, кортежь, атрибут = экономичеким терминам таблица – строка-столбец = терминам БД файл-запись-поле.

13.1 Структура данных, Виды отношений.

Структура таблицы в реляционной базе характеризуется следующим:

1) она состоит из совокупности столбцов; каждый столбец имеет уникальное, то есть не повторяющееся в других столбцах, имя; последовательность столбцов в таблице не существенна; 2) все строки таблицы организованы по одинаковой структуре, то есть имеют одно и то же количество реквизитов и имеют одинаковую длину; в таблице нет одинаковых строк; 3) количество строк в таблице практически не ограничено; последовательность строк в таблице не существенна; при выполнении манипуляций с таблицей все строки и столбцы могут просматриваться в произвольном порядке безотносительно к их содержанию и смыслу.

Требования к реляц.таблице:

1)значения в ячейках должны быть одиночными; 2)все записи в столбце должны быть 1 типа; 3)кажд.столбец должен иметь уникальн.имя; 4)в таблице не Мб 2х одинак.строк; 5)порядок строк не имеет знач.

Реляй.табл.должна облад. первичным ключом – поле (группа полей), по кот.однозначно можно найти 1 единств.запись в таблице. Он мб простым (1 поле) и составным(2 и более). Он должен быть макс.коротким и как правимеет числовой тип. Ключ – это атрибут (или несколько атрибутов), значения которого в данной таблице не повторяется и не является нулевым. Кроме первич ключа мб вторичные ключи, или внешн ключами, или индексами. Индекс – атрибут\совокупность атрибутов внутри отношения, кот соответствует ключу некот отношения, и ее значения явл-ся своеобраз номерами кортежей в некотором отношении, имеются в неск отношениях и является первичным ключом в одном из них. Значения индекса могут повторяться в нек таблице. Он обеспеч логич последовательность записей в таблице,прямой доступ к кажд записи. Введение индексов не изменяет физич располож записей в таблице, но влияет на последовательность просмотра.

13.2 Структура данных, Виды отношений.

По первич ключу отыскивается 1 строка, по вторичному – группа строк с одинак значениями первичн ключа. Ключи нужны для идентификации и упорядоч записей таблицы,а индексы для упорядочения и ускорения поиска.

Отношение, в кот есть первич ключ-базовое(материнск) отнош,связанное с вторичным – дочернее.

При попытке присвоить первичн ключу значение, уже имеющееся в другой записи таблицы, выдается сообщение об ошибке первичного ключа. Если это не контролировать, то может произойти нарушение целостности. Целостность – св-ва БД, означ, что она содерж полную, непротиворечивую инфу, адекватно отражающ предметн область. Контроль целостности обесп такое взаимод между данными, что возникающ противоречия устраняются в процессе этого взаимодействия.

1)Физич. целостн.(данные не утрач., к ним есть физич.доступ

2)логич.целостность(нет логич.оишбок в базе-не наруш.структура)

Целостность обесп-ся выполнен.условий, кот.должна выполн. храним. в БД инфа.(например - год рождения не больше 4х символов)

Требование целостности сущностей состоит в том, что в базовом отношении ни один атрибут первичного ключа не может содержать отсутствующих значений. Требования ссылочной целостности состоит в том, что для каждого значения внешнего ключа дочернего отношения должна найтись запись в базовом (материнском) отношении с таким же значением первичного ключа. Например, в ведомости на зарплату должны быть фамилии только тех, кто работает на предприятии и имеется в списке его работников.

14 вопрос. Постреляционная модель

Минусы реляционной модели:

1)Ограниченность в структурах представлен данных. Она предполаг. неделимость данных, хранящихся в полях таблицы, но на практ. это иногда снижает эфф-ть работы. 2)Данные пассивны, для описания их поведения требуется создавать прикладные программы. 3)Возможности рел модели недостаточны, когда объекты данных сложны( мультимедийные базы, базы с проектной документацией).

Постреляционная модель снимает ограничение неделимости данных, допуская многозначные поля, значения кот сост из подзначений, и набор значений восприним-ся как самостоятельная таблица, встроенная в главн таблицу. Она явл-ся расширением реляционной модели.

В пострел БД данные хранятся более компактно, и не требуется выполнять операции связи двух таблиц. Такое хранение обеспечивает высокую наглядность представления данных и повышение эффективности их обработки.

Достоинство: это совок. связ.реляц.такблиц в одной. Длина полей и их кол-во без ограничений - большую гибкость по ср с реляционной.

Недостаток: сложность обеспечения целостности и непротиворечивости данных.

10.Иерархическая модель. Понятие, достоинства и недостатки.

В иерарх. модели связи между данными можно представить с помощью дерева. Данные в такой модели расположены на разных иерархич. ур-нях и наз-ся сегментами. Самый высокий сегмент имеет название «корневой». Сегменты, расположенные на более низком ур-не, наз-ся сегментами-потомками; на более высоко ур-не – сегментами-предками. Каждый сегмент может иметь только одного предка на более высоком ур-не и одного или нескольких потомков на более низком ур-не. Доступ к опред-му сегменту осущ-ся по цепочке – от сегмента-предка к сегменту-потомку начиная слева.

Иерархич. модель исп-ся для представления организационных структур, по своей природе являющихся иерархическими. Организовать более сложные связи в этой модели не возможно.

Недостатки: громоздкость модели для обработки данных со сложными логическими данными.

Достоинство: эф-ное использ-ие памяти компа при хранении данных.

15.1 Объектно-ориентированная модель

Cтруктура, кот можно изобразить графически в виде дерева, узлами кот явл-ся объекты. связи между записями и ф-циями их обраб.уст.как в объектно-оринт. Поиск - выяснение сходства между объектом, задаваемым пользователем, и тем, что есть в БД. Определяемый пользователем объект называют объектом-целью. Такая модель позволяет идентифицировать отдельные записи базы.

Объект- уник идентифицируемая сущность, кот содержит атрибуты, описывающ состояние объектов реальн мира, и связанные с ними действия. Св-ва объекта:1)уник.индентифицир.,принадл. к опред.классу 2)может посылать сообще др обектам 3)имеет внутр строен.

Класс –набор объектов, схожих по поведению и др характеристикам. Структура и поведение объектов в объектной среде полностью определяется его классом. Класс, в свою очередь, является коллекцией объектов, при этом структура и поведение объектов одного класса одинакова.

Св-ва:1)это попытка применить идеологию объектно-ориентированного программирования к технологии бд; 2)сост из объектов, каждиз которых принадлежит к определенному классу; 3)поведение объекта полностью определяется его принадлеж к опред классу; 4)процесс проектирования об-ориент базы основан на выявлении классов.

Для вып действий над данными в объек-ор модели примен логич операции, усиленные объек-ор механизмами инкапсуляции, наследования, полиморфизма.

15.2 Объектно-ориентированная модель

Инкапсуляц - объединение в единое целое данных и алгоритмов (функций и методов) их обработки, что повыш. надежность разрабатываемого ПО.

Модуляризация- объект представляет собой «черный ящик», который может быть создан и изменен независимо от остальной системы.

Наследование позволяет образовать новый класс объектов на основе уже существующего базового (родительского) класса. Менее общие классы -подклассами, более общие – суперклассами. Наследование распространяет множество свойств и методов на всех потомков объекта. ( Мужчина и Женщина как наследующие класс Человек)

Полиморфизм позвол в объектах разн типов иметь методы (процедуры и функции) с одинаки именами, что означ возможн объектов по-разному реагировать на 1и то же событие.

Достоинство: 1)возможн отображ информации о сложных взаимосвязях объектов; 2)идентиф отдельные записи в базе и опред функции их обработки, позволяющими воспользоваться преимуществами объектной технологии; 3) пользователю не нужно знать о взаимодействии объектов: он просто обращается к конкретному объекту и использует конкретный метод. А то, что при этом осуществляется воздействие на другие объекты базы, скрыто от пользователя.

Недостаток: в сложности понимания сути и низкой скорости выполнения запросов.

16.1. Многомерная модель

К ним появ.интерес лишь в 90-х гг хх в.инфа в многом.модели представл.в виде многомерных массивов (гиперкубах). в одной бд может храниться множество гиперкубов. конечн. пользователь в кач-ве внешней модели данных получ.для анализа опред.срезы или проекции кубов,представл-е в виде обычн.двухмерных таблиц или графиков.

Многом.модели хорошо обслужив.аналитическую обработку данных и обеспеч.> быстрый поиск и чтение данных по ср.с реляц-ми мод.,+избавляют от необход-ти многократного связывания таблиц. среднее время ответа у них на сложный вопрос в десятки раз <,чем при исп-нии реляц-й модели.они обычно явл.узко специализирован-ми.

Осн.понятиями,исп-ми в многом.м, явл.:

-агрегируемость(обознач.рассмотрение и возмож-ть анализа дан.на разн.уровнях обобщения:для пользов-ля,аналитика, руковод-ля); -историчность(обознач.привязку данных ко времени и высокий ур-нь неизменности их и их взаимосвязей); -прогнозируемость данных(предполаг.задание функций прогнозир-ия и примен-е их к разл.врем-м интервалам).

Многомерность модели данных – это многомерное логич.представление стр-ры данных при их описании и в операциях манипулиров-я ими, а не мнгомер-ть их визуализации.

16.2. Многомерная модель

По ср-ю с реляц-й мод-ю многомерн.организ-я данных облад.>высокой информативностью.сегодня исполь-ся обычно 2 схемы организ-и данных:

1.гиперкубическая(все показ-ли определ-ся одним и тем же набором измерений,имеют одинаков.размерность и совпадающие измерения).

2.поликубическая(в базе м.б.определено несколько гиперкубов с разл.размерн-ю и измерениями в кач-ве граней.пример:сервер oracle express server).

Для многом.мод. примен.спец.операции:

срез - подмножество гиперкуба,получ-е в рез-те фиксации 1-го или неск.измерений.

вращение – измен.порядок измерений при визуальном прдставл-и данных.

агрегация и детализация – означ.переход соответст-но к > общему и >детальному представл-ю данных.

достоинства мног.мод:

удобство и эффект-ость анализа больших объемов данн.,им-их временн.связь; быстрота реализ-и сложных нерегламентиров-х запросов.

недостатки:

громоздкость в случ. ее исполь-я для решения стандартн.задач опретивной обработки.она неэффек-о исп.память,т.к. в ней резервируется место для всех значений, даже если некот.из их бедет отсутствовать.

применение: когда объем базы невелик и гиперкуб исп-т стабильный по времени набор измерений.мног.модели поддерж.след.системы: essbase,cache.

18.1.Этапы проектирования базы данных и их процедуры.

1.концептуальное проектир-е(в рез-те получ. концептуальн. модель дан-х) процедуры:-определ.сущностей и их описание (определ.объекты,кот. существ. незав-мо от др.). для кажд.объекта опис.их cв-ва, имена объектов и их опис-е заносятся в словарь дан-х.

-опред.связей м-ду сущностями и их опис-е(обычно описыв.как.-л действие)

-созд-е так назыв-й мод-и er - прогр-ы,кот.позв. строить модели er-win.

-подробн.опис-е св-в(сущностей,атрибутов).кажд.атриб-у присваив-ся свое имя,тип и размерность значений.атрибут м.иметь неопред.значения.

-опред.значений атрибутов и их описание.

-определ-е первичных ключей для сущности.

-обсуждение концепт-й мод-и с закачиком и ее исправление.

2.логическое проектирование(преобраз-е коцепт.мод-и на основе выбранной мод-и данных в логич.модель).

процедуры:-выбор мод.данных(чаще всего реляц-я,т.к.масая простая)

-опред-е набора таблиц,исходя их er-модели(кажд.сущность соответ-ет 1 таблице).

-нормализация таблиц.

-проверка логич.модели дан.на предмет возмож-ти выполн-я транзакции (неделимая операция,кот.заверш. либо полным отказом, либо полн.согласием).

-опред-е треб.поддержки целостности данных и их документиров-ие, требования целост-ти-огранич-я, кот. вводятся с целью предотвращ-я похищения 1 бд противоречивых данных. должны быть записаны след.типы ограничений:

18.2 Этапы проектирования базы данных и их процедуры.

  • обязат-е данные,таким образом выявл.те атриб-ы,кот.могут заполняться, а могут и нет.

  • ограничения для значений атрибутов(опред.допустим.значения атрибутов).

  • целостн-ть сущностей,кот.достиг-ся тем,что первич.ключ не содерж. неопред.значений.

  • ссылочная целостность,знач-я внешнего ключа(поля др.таблицы),должно обязат-но присутствовать в первич.кл-е одной из строк табл.для родительской сущности.

  • огранич-я,накладываемые бизнес-правилами(правила установки и технолог-й операции,принятые в организ-и).

-созд-е окончат-го варианта логич.модели и обсуждение его с заказч-м(на эт.этапе можно найти еще ошибки).

3.физическое проектирование (опис-е конкретной реализ-и бд. на этом этапе выбир.наилучшая файлов.организ-я для таблиц. выбир.наиболее важн.транзакции и оценив-ся их пропускная спос-ть,т.е.кол-во транз-й,кот. м.б.обработано за указ.период времени.оценивается время ответа,т.е. промеж-к врем-и, необходимый для выполн-я одной транзакции).

процедуры:-проектир-е таблиц бд ср-ми выбранной субд.

-реализация бизнес-правил в среде выбранной субд

-проектиров-е физич.организ-и данных,созд.индексов для ускорения поиска данных.

-разработка стратегий защиты бд(пароли,шифрование).

-организ-я мониторинга функциониров-я бд и ее настройка.

19 вопрос. Нормализация таблиц. Первая нормальная форма.

Нормальные формы – линейн.последоват-ть правил,применяемых к бд,причем,чем выше норм.форма,тем совершеннее структура бд.

нормализация – многомтупенчат.процес уменьшения избыточности инф-ции в бд, при кот-м таблицы бд организ-ся, разъединяются и данные приводятся в порядок. хотя существует много уровней, обяно достаточно выполнять норм-цию до 3-й нормальной формы (3 нф).

уровни нармализации:

1 нормальная форма (1нф):

задает существ-е в кажд.позиции,определенной строкой или столбцом, только одного значения, а не массива или списка значений.

20 вопрос. Вторая нормальная форма (2нф):

1) она удовлетворяет условиям 1нф(задает существ-е в кажд.позиции,определенной строкой или столбцом, только одного значения, а не массива или списка значений.)

2) любое неключев.поле однозначно идентифицируется полным набором ключевых полей,т.е. кажд.неключевое поле должно полн-ю зависеть от первичного ключа.

21 вопрос. Третья НФ. Нормальные формы более высоких порядков.

3 НФ. Удовлетворяет 2 НФ (сущ-ние в каждой позиции, определяемой строкой или столбцом, только одного значения, а не массива или списка + каждое неключевое поле полностью зависит от первичного ключа) и все неключевые столбцы взаимно независимы.

Нормальная форма Бойса-Кодда

Нормальная форма Бойса-Кодда требует, чтобы в таблице был только один потенциальный первичный ключ. Чаще всего у таблиц, находящихся в третьей нормальной форме, так и бывает, но не всегда. Если обнаружился второй столбец (комбинация столбцов), позволяющий однозначно идентифицировать строку, то для приведения к нормальной форме Бойса-Кодда такие данные надо вынести в отдельную таблицу.

Четвертая нормальная форма

Для приведения таблицы, находящейся в нормальной форме Бойса-Кодда, к четвертой нормальной форме необходимо устранить имеющиеся в ней многозначные зависимости. То есть обеспечить, чтобы вставка / удаление любой строки таблицы не требовала бы вставки / удаления / модификации других строк этой же таблицы.

Пятая нормальная форма

Таблицу, находящуюся в четвертой нормальной форме в некоторых случаях еще можно бывает разбить на три или более (но не на две!) таблиц, соединив которые, мы получим исходную таблицу. Получившиеся в результате такой, как правило, весьма искусственной, декомпозиции таблицы и называют находящимися в пятой нормальная форме. Формальное определение пятой нормальной формы таково: это форма, в которой устранены зависимости соединения. В большинстве случаев практической пользы от нормализации таблиц до пятой нормальной формы не наблюдается.

24 вопрос. Типы полей, поддерживаемые Access 2000

СУБД Access может обрабатывать данные полей следующих типов:

Текстовый. В поля такого типа помещают текст или комбинацию текстовых и числовых значений. Объём текста не должен превышать 255 символов.

Поле MEMO. Длинный текст (до 65535) символов.

Числовой. Числовые данные, используемые в математических вычислениях, за исключением денежных расчётов. Размеры числовых полей – 1,2,4,8,12 байтов.

Дата/вермя. Значения даты и времени. Даты из диапазона 100 по 9999 год.

Денежный. Денежные значения. Их макс. точность сост-ет 15 знаков слева от десятичной запятой и 4 знака справа от неё.

Счётчик. Уникальные последовательные с шагом 1 номера, автоматически присваиваемые записям при их вставке в таблицу БД.

Логический. Поле этого типа моет иметь только одно значение из пары значений, таких как Да/Нет, Истина/Ложь или Вкл/Выкл.

Поле объекта OLE. Объекты других приложений, которые могут быть связаны или внедруны в таблицу БД Access.

Гиперссылка. В поле этого типа хранятся гиперссылки - путь к файлу на жестком диске либо адрес в сети Интернет или Интранет.

22.1. Модель «сущность-связь».

Средством моделирования предметной области на этапе концептуального проектирования является модель «сущность-связь», кот. часто наз-ют ER-моделью. Моделирование структуры данных предметной области в ней базируется на использовании графических средств – ER-диаграмм. ER-диаграмма- графическое представление связи между сущностями.

Основн. понятия ER-диаграммы: сущность, атрибут, связь.

Сущ-ть – это некоторый объект реального мира, кот. может сущ-ть независимо. На ER-диаграмме сущность изображается прямоугольником, в кот. указывается её имя.

Сущность имеет экземпляры, отличающиеся др от др значениями атрибутов и допускающие однозначную идентификацию. Экземпляр сущности – конкретный объект, характеризующийся набором значений атрибутов сущности. Атрибут – это поименованная характеристикак сущности.

пример:

Атрибут, кот. уникальным образом идентифицирует экземпляры сущности, называется ключом. Ключ может быть составным, т.е представляющим комбинацию нескольких атрибутов.

Связь– взаимодействие между сущностями. Она характеризуется мощностью, кот. показывает, сколько сущностей участвует в связи. Связь между двумя сущн-ями наз-ся бинарной. На ER-диаграмме сущность изображается ромбом.

Важной характеристикой связи явл-ся тип связи (кардинальность).

22.2. Модель «сущность-связь».

Связь типа «многие-ко-многим» (каждый экземпляр сущности А может быть связан с несколькими экземплярами сущности В, а каждый экземпляр сущности В – с несколькими экземплярами сущности А).(М:N)

Связь типа «один-к-одному» (каждый экземпляр сущности А может быть связан не более чем с одним экземпляром сущности В).(1:1)

Связь типа «один-ко-многим» (каждый экземпляр сущности А может быть связан более чем с одним экземпляром сущности В, а каждый экземпляр сущности В – не более чем с одним экземпляром сущности А).

Класс принадлежности сущности.(1:М)

Если каждый экземпляр сущности связан с экземпяром сущности В, то класс принадлежности сущности А является обязательным. Этот факт отмечается на ER-диаграмме чёрным кружком, помещённым в прямоугольник, смежный с прямоугольником сущности А.

Если не каждый экземпляр сущности А связан с экземпляром сущности В, то класс принадлежности сущности А явл-ся необязательным. Этот факт отмечается на ER-диаграмме чёрным кружком, помещённым на линии связи возле прямоугольника сущности А.

23.1. Общая хар-ка СУБД Microsoft Access 2000

СУБД Microsoft Access 2000 предназначена для работы с реляционными базами данных. Это комплекс программных средств, предназначенных для создания структуры новой базы данных, наполнения её содержимым, редактирования содержимого, отбора данных в соответствии с заданными критериями, их упорядочивания, оформления, печати.

Эта СУБД является компонентом офисного пакета Microsoft Office 2000 в варианте Professional, Premium и Developer. Данный компонент работает в среде Windows 95/98, Windows NT Workstation 4.0 и выше.

Access представляет собой не просто ср-во для работы с базами данных, а мощный инструмент для создания специализированных информационных систем, предоставляющих пользователям доступ к данным в локальных и глобальных сетях. Эта СУБД имеет инструментальные ср-ва для создания и работы:

- с локальными базами данных небольшого и среднего размера

- централизованными базами данных в локальных сетях с файловым сервером

- проектами – клиентскими приложениями, обеспечивающими эф-ый, естественный доступ к базам данных Microsoft SQL Server.

В Access база данных обозначает файл, содержащий набор информации. Каждая база данных в Access состоит из основных объектов: таблиц, запросов, форм, отчётов, страниц, макросов и модулей. Access может работать одновременно только с одной базой данных. Но одна БД Access может включать сотни таблиц, форм, запросов, отчётов, макросов и модулей, которые хранятся в одном файле с расширением mdb.

При работе с многопользовательской базой данных СУБД Access может обслуживать одновременно до 255 пользователей.

23.2. Общая хар-ка СУБД Microsoft Access 2000

В Access уделено большое внимание вопросам взаимодействия БД с сетями Интернет и Интранет – имеются ср-ва для создания Web-страниц, обеспечивающих динамический доступ к данным базы.

Access поддерживает механизм OLE - связывание и внедрение объектов различных приложений Windows в базу данных Эта СУБД позволяет импортировать данные таблиц:

• других баз данных Access;

• баз данных dBase, Microsoft FoxPro, Paradox, Oracle, Microsoft SQL Server;

• табличного процессора Microsoft Excel.

Внешними для Access могут быть также: данные почтовой программы Microsoft Exchange; таблицы и списки HTML на сервере локальной, корпоративной сети (сети масштаба пред­приятия), сети Internet. Access может экспортировать объекты базы данных в другие приложения, отправлять содержимое ба­зы данных по электронной почте.

В данной СУБД имеется возможность разработки прикладных программ, работающих с базой данных, на встроенном языке программирования Visual Basic for Applications.

Access располагает удобными средствами для настройки пользовательского интерфейса, а также для администрирования БД, которые позволяют осуществлять восстановление, сжатие, репликацию, защиту БД, даёт возможность конвертировать БД из предыдущих версий в текущую и наоборот.

Эта СУБД снабжена развитой справочной системой.

Минимальные требования к компьютеру:

- процессор с тактовой частотой не ниже 75 МГц

- оперативная память не меньше 32 Мб

- около 90 Мб свободного дискового пространства

- операционная сис-ма Windows 95 и выше

25 вопрос. Свойства полей

Каждому типу поля присущ определенный набор свойств. Свойства позволяют управлять сохранением, обработкой и отображением данных поля.

Некоторые свойства полей

Размер поля определяет максимальную длину текстового или числового поля. Так, для числового поля с целыми значе­ниями используются следующие размеры:

байт — целые числа от 0 до 255 (поле занимает 1 байт);

целое — целые числа от - 32 768 до 32 767 (2 байта);

длинное целое — целые числа от - 2 147 483 648 до 2 147 483 647 (4 байта).

Для числовых полей с дробными значениями применяются раз­меры: одинарное с плавающей точкой, двойное с плавающей точкой, действительное.

Формат поля определяет способ отображения текста, чисел, дат и значений времени на экране и на печати. Число десятичных знаков дает возможность указывать для чисел количество дробных знаков. Маска ввода задает маску ввода, облегчающую ввод данных в поле. Подпись определяет текст, который выводится в качестве наименований полей в таблицах, запросах, формах, отчетах. Значение по умолчанию позволяет указать значение, авто­матически вводящееся в поле при создании новой записи. Условие на значение определяет множество значений, кото­рые можно вводить в поле таблицы.

Сообщение об ошибке позволяет указать текст сообщения, выводящегося на экран при вводе недопустимого значения. Обязательное поле указывает, требует ли поле обязательно­го ввода значения. Пустые строки определяют, допускается ли ввод в тексто­вое поле пустых строк (« »). Индексированное поле служит для создания индекса. Сжатие Юникод разрешает или запрещает сжатие Unicode для поля.

26 вопрос. Запросы.Виды,примеры.

Запрос – это важнейший инструмент для извлечения информации из одной или нескольких таблиц БД. Посредством запроса можно  вносить изменения в саму БД. З. может служить источником данных для форм, отчетов и страниц доступа к данным. Его результатом является новая таблица, которая может быть просмотрена, проанализирована, а затем сохранена или не сохранена.

СУБД  Access  позволяет создавать запросы трех типов:

1) З. на выборку является наиболее часто используемым типом запроса. Он дает возможность: выбирать записи, удовлетворяющие условиям отбора; включать в результирующую таблицу  поля из одной или нескольких таблиц в нужном порядке; осуществлять вычисления над полями БД; выполнять статистические расчеты для групп записей. Рез-том выполн-я з. явл-ся набор записей, собр -х в табл.(RecordSet-динамич. времен-й набор данных)

2) Перекрестный з. представляет собой специальный запрос итогового типа. Он отображает результаты итоговых статистических расчетов  над  значениями некоторого  поля в виде перекрестной таблицы. В ней   значения одного или нескольких столбцов слева образуют заголовки строк,  верхняя строка – заголовки столбцов из значений определенного поля, а на пересечении строк и столбцов – итоговые значения.

3) З. на внесение изменений  – это запрос, который вносит изменения в саму БД. (1- з. на удаление 2- з. на обновление - 3- з. на добавление 4- з. на создание таблицы )

По сп-бу формирования:  QBE (Query By Example) – запрос по образцу ;

 SQL ( Structured Query Language ) – структурированный язык запросов.

27 вопрос. Формы. Структура.св-ва.

Формы служат удобным средством для ввода, просмотра и редактирования информации БД. Формы для ввода представляют бланк, подлежащий заполнению, и дают возможность  осуществить контроль вводимых данных и исключить ввод неверных. Бланк-форма  упрощает процесс заполнения базы данными, благодаря чему  в БД может вводить информацию пользователь невысокой квалификации. При просмотре и редактировании имеют дело с маской, накладываемой на набор данных. Маска-форма позволяет  ограничить доступ пользователя к информации БД, заблокировав  отдельные (служебные или засекреченные) поля или записи. Формы есть простые и составные (включающие другие формы). Они могут содержать различные элементы: поля БД и подписи к ним, списки, флажки, переключатели, кнопки, вкладки и др.  В них возможны вычисления для отдельных записей и их групп, а также наглядное графическое представление данных в виде диаграмм. Форму можно спроектировать на базе одной или нескольких таблиц и/или запросов. На основе одной таблицы или запроса можно построить несколько форм. В форме имена полей берутся из описания таблицы, а сами поля  пользователь располагает в соответствии со своими вкусами  и требованиями  и вносит различные элементы оформления: линии, рисунки, заливку  и др.

Форма создается «вручную» - с помощью конструктора форм, автоматизированным способом - с помощью Мастера форм  и автоматически  -  с использованием   автоформы. Конструктор форм  предоставляет пользователю набор инструментов, с помощью которого пользователь может создать форму  соответственно своим вкусам и требованиям. Мастер форм руководит процессом проектирования форм. Он задает пользователю вопросы о структуре и оформлении формы, предлагая на выбор несколько вариантов. В результате диалога пользователя и Мастера  форм появляется “готовая к употреблению” форма. Автоформа на основе выбранной таблицы автоматически создает  одну из форм: в столбец ,  ленточную,  табличную, сводная табл,диаграмма.

33 вопрос. Запр. на выб-ку данных на языке SQL. Вложенные запросы

Вложенным запросом называется запрос, помещаемый в инструкцию SELECT, INSERT, UPDATE или DELETE или в другой вложенный запрос. Подзапрос может быть использован везде, где разрешены выражения. Вложенный запрос по-другому называют внутренним запросом или внутренней операцией выбора, в то время как инструкцию, содержащую вложенный запрос, называют внешним запросом или внешней операцией выбора. Многие инструкции языка Transact-SQL, включающие подзапросы, можно записать в виде соединений. Другие запросы могут быть осуществлены только с помощью подзапросов.

Вложенный во внешнюю инструкцию SELECT запрос, имеет следующие компоненты: -обычный запрос SELECT, включающий обычные компоненты списка выборки; -обычное предложение FROM, включающее одно или более имен таблиц или представлений; -необязательное предложение WHERE; -необязательное предложение GROUP BY; -необязательное предложение HAVING.

Инструкции, включающие вложенные запросы, обычно имеют один из следующих форматов:

WHERE expression [NOT] IN (subquery)

WHERE expression comparison_operator [ANY | ALL] (subquery)

WHERE [NOT] EXISTS (subquery)

Существуют три основных типа подзапросов, которые:

- работают в списках, вставленных после ключевого слова IN, или тех, которые оператор - - сравнения изменил с помощью ключевого слова ANY или ALL;

- вставлены оператором немодифицированных сравнений и должны возвращать одно значение;

- являются тестами на существование, начинающимися с ключевого слова EXISTS.

28.1 Язык SQL в СУБД.Назн-е,стан-ты,дост-ва

SQL представляет собой непроцедурный (декларативный) язык, используемый для управления данными реляционных СУБД. Термин «непроцедурный» означает, что на данном языке можно сформулировать, что нужно сделать с данными, но не требуется указывать, как именно это следует сделать. Язык SQL главным образом ориентирован на удобную и понятную пользователям формулировку запросов выбора из БД, однако его функции шире – с самого начала этот язык задумывался как полный язык БД. Под этим понимается, что (по крайней мере, теоретически) для выполнения любых осмысленных действий с базой данных, управляемой SQL-ориентированной СУБД, достаточно знать язык SQL.

Первоначально официального стандарта в области БД  не существовало, что в определенном смысле сдерживало развитие технологий баз данных. В результате совместных усилий двух организаций: ANSI (American National Standarts) и ISO (International Standarts Organisation) в 1986 году был принят стандарт SQL-86 (SQL-1). После появления первого международного стандарта языка работа в этой области продолжилась, и в 1992 г. был принят второй международный стандарт SQL-92 (SQL-2), в 1999 г. появляется  объектно-ориентированный язык SQL:1999 (SQL-3), а в 2003 г. принят стандарт SQL:2003. Каждый стандарт представляет собой многостраничный документ сложной структуры.

Язык SQL можно использовать для доступа к БД в двух режимах: при интерактивной работе и в прикладных программах.

28.2 Язык SQL в СУБД.Назн-е,стан-ты,дост-ва

С помощью SQL пользователь может в интерактивном режиме быстро получить ответы на любые, в том числе достаточно сложные запросы, тогда как для программной реализации этих запросов на другом языке пришлось бы разрабатывать  соответствующую программу.

Работа с яз-м SQL : пользователь на языке SQL обращается к СУБД с запросом. СУБД выбирает необходимые данные из базы и возвращает их пользователю. Язык SQL можно использовать в двух режимах: интерактивный, прикладные программы. SQL – язык интерактивных запросов. Пользователи вводят команды SQL в интерактивных программах с целью выборки данных и отображения их на экране. Это удобный способ выполнения специальных запросов.

Назначение. SQL-это1 – язык программирования баз данных.2 – язык администрирования баз данных.3– язык создания приложений клиент/сервер.4– язык распределенных баз данных.5– язык шлюзов баз данных. Достоинства:1- Независимость от конкретных СУБД;2- Межплатформенная переносимость;3- Наличие стандартов;4- Поддержка со стороны компании Microsoft (протокол ODBC и технология ADO ) и IBM ;5- Реляционная основа;6- Высокоуровневая структура , напоминающая английский язык;7- Возможность выполнения специальных интерактивных запросов;8-Обеспечение программного доступа к базам данных;9- Возможность различного представления данных;10-Полноценность как языка, предназначенного для работы с базами данных;11-Возможность динамического определения данных;12-Поддержка архитектуры клиент/сервер;13- Расширяемость и поддержка объектно-ориентированных технологий;14- Возможность доступа к данным в среде Internet ;15- Интеграция с языком Java (протокол JDBC ).

29.Создание БД на SQL.

Создание базы данных выполняется с помощью оператора CREATE DATABASE.

Синтаксис оператора CREATE DATABASECREATE DATABASE [IF NOT EXISTS] db_name [CHARACTER SET charset] [COLLATE collation];

db_name

- Имя, которое будет присвоено создаваемой базе данных.

IF NOT EXISTS

- Если не указать этот параметр, то при попытке создания базы данных с уже существующим именем, возникнет ошибка выполнения команды.

CHARACTER SET, COLLATE

- Используется для задания стандартной кодировки таблицы и порядка сортировки. Если при создании таблицы эти параметры не указываются, то кодировка и порядок сортировки вновь создаваемой таблицы берутся из значений, указанных для всей базы данных. Если задан параметр CHARACTER SET, но не задан параметр COLLATE, то используется стандартный порядок сортировки. Если задан параметр COLLATE, но не задан CHARACTER SET, то кодировку определяет первая часть имени порядка сортировки в COLLATE.

Кодировка, заданная в CHARACTER SET, должна поддерживаться сервером (latin1 или sjis), а порядок сортировки должен быть допустимым для текущей кодировки.

Примеры использования CREATE DATABASE Следущий пример создает базу данных "my_db": CREATE DATABASE `my_db` или CREATE DATABASE `my_db` CHARACTER SET utf8 COLLATE utf8_general_ci;

Для того, чтобы посмотреть настройки уже существующей базы данных необходимо выполнить оператор SHOW CREATE DATABASE

30. Манипуляция данными на языке SQL

Следующая группа операторов предназначена для манипулирования данными в таблицах. В нее входят операторы выбора (SELECT) строк из таблицы (или таблиц), уничтожения (DELETE) строк в таблице, вставки (INSERT) строк, и изменения (UPDATE) значений.

Заполнение таблицы и добавление записей в уже заполненную таблицу выполняет инструкция Insert. Наименьшей единицей информации, которую можно добавить в базу данных, является одна строка таблицы. Синтаксис этой инструкции таков:

Insert Into Имя_Таблицы [Имена_Полей]

Values (Значен ия _Полей);

Удаление записей из таблицы. Для того чтобы таблица находилась в актуальном состоянии, в нее следует не только добавлять новые записи, но и удалять устаревшие. Наименьшей единицей информации, которую можно удалить из базы данных, является запись. Эту функцию выполняет инструкция Delete. Синтаксис этой инструкции таков:

Delete From Bvz _ Nf,kbws

[ Where Eckjdbt ]$

Обновление данных. Обновление выполняет инструкция Update. При обновлении данных в таблице обновляются выбранные столбцы во всех строках, удовлетворяющих некоторому условию. Синтаксис инструкции Update таков:

Update Имя _ Файла

Set Имя _ Столбца = Выражение

Where Условие ;

Предложение Where указывает, в каких строках должно быть проведено обновление. А

предложение Set указывает, какие столбцы должны быть обновлены и какие новые значения должны быть внесены.

31.1. Запросы на выборку данных на языке SQL. Структура оператора SELECT

Все запросы на получение практически любого количества данных из одной или нескольких таблиц выполняются с помощью единственного предложения SELECT. В общем случае результатом реализации предложения SELECT является другая таблица. К этой новой (рабочей) таблице может быть снова применена операция SELECT и т.д., т.е. такие операции могут быть вложены друг в друга.

Предложение SELECT может использоваться как:

-самостоятельная команда на получение и вывод строк таблицы, сформированной из столбцов и строк одной или нескольких таблиц (представлений);

-элемент WHERE- или HAVING-условия (сокращенный вариант предложения, называемый "вложенный запрос");

-фраза выбора в командах CREAT VIEW, DECLARE CURSOR или INSERT;

-средство присвоения глобальным переменным значений из строк сформированной таблицы (INTO-фраза).

31.1. Запросы на выборку данных на языке SQL. Структура оператора SELECT

Оператор SELECT имеет следующую структуру:

SELECT [STRAIGHT_JOIN]

[SQL_SMALL_RESULT][SQL_BIG_RESULT][SQL_BUFFER_RESULT]

[SQL_CACHE|SQL_NO_CACHE][SQL_CALC_FOUND_ROWS][HIGH_PRIORITY]

[DISTINCT | DISTINCTROW | ALL]

select_expression,...

[INTO {OUTFILE | DUMPFILE} 'file_name' export_options]

[FROM table_references

[WHERE where_definition]

[GROUP BY {unsigned_integer | col_name | formula} [ASC | DESC], ...]

[HAVING where_definition]

[ORDER BY {unsigned_integer | col_name | formula} [ASC | DESC], ...]

[LIMIT [offset,] rows | rows OFFSET offset]

[PROCEDURE procedure_name(argument_list)]

[FOR UPDATE | LOCK IN SHARE MODE]]

SELECT применяется для извлечения строк, выбранных из одной или нескольких таблиц. Выражение select_expression задает столбцы, в которых необходимо проводить выборку. Кроме того, оператор SELECT можно использовать для извлечения строк, вычисленных без ссылки на какую-либо таблицу.

34.1. Модели представления знаний

В искусственном интеллекте основными универсальными моделями представления знаний являются: семантические сети, фреймы, продукционные системы и логические модели.

Продукционная модель

Продукционная модель, или модель, основанная на правилах, позволяет представить знания в виде предложений типа: Если (условие), то (действие). Под условием понимается некоторое предложение-образец, по которому осуществляется поиск в базе знаний, а под действием — действия, выполняемые при успешном исходе поиска (они могут быть промежуточными, выступающими далее как условия, и терминальными или целевыми, завершающими работу системы).

Семантические сети

Термин семантическая означает смысловая, а сама семантика — это наука, устанавливающая отношения между символами и объектами, которые они обозначают, т.е. наука, определяющая смысл знаков.

Семантическая сеть — это ориентированный граф, вершины которого — понятия, а дуги — отношения между ними.

Понятиями обычно выступают абстрактные или конкретные объекты, а отношения — это связи типа: "это" ("is"), "имеет частью" ("has part"), "принадлежит", "любит". Характерной особенностью семантических сетей является обязательное наличие трех типов отношений:

• класс — элемент класса;

• свойство — значение;

• пример элемента класса.

34.2. Модели представления знаний

Формальные логические модели

Традиционно в представлении знаний выделяют формальные логические модели, основанные на классическом исчислении предикатов I порядка, когда предметная область или задача описывается в виде набора аксиом. Мы же опустим описание этих моделей по следующим причинам. Исчисление предикатов I порядка в промышленных экспертных системах практически не используется. Эта логическая модель применима в основном в исследовательских "игрушечных" системах, так как предъявляет очень высокие требования и ограничения к предметной области.

Фреймы

Фрейм - структура знаний для восприятия пространственных сцен. Эта модель, как и семантическая сеть, имеет глубокое психологическое обоснование.

Различают фреймы-образцы, или прототипы, хранящиеся в базе знаний, и фреимы-экземпляры, которые создаются для отображения реальных ситуаций на основе поступающих данных.

Модель фрейма является достаточно универсальной, поскольку позволяет отобразить все многообразие знаний о мире через:

• фреймы-структуры, для обозначения объектов и понятий (заем, залог, вексель);

• фреймы-роли (менеджер, кассир, клиент);

• фреимы-сценарии (банкротство, собрание акционеров, празднование именин);

• фреймы-ситуации (тревога, авария, рабочий режим устройства) и др.

Важнейшим свойством теории фреймов является заимствованное из теории семантических сетей наследование свойств. И во фреймах, и в семантических сетях наследование происходит по АКО-связям (A-Kind-Of = это). Слот АКО указывает на фрейм более высокого уровня иерархии, откуда неявно наследуются, т.е. переносятся, значения аналогичных слотов.

36.1. Фреймовые модели

Теории представления знаний фреймами была разработана М.Минским в 70-е годы XX века. В ее основе лежит восприятие фактов посредством сопоставления полученной извне информации с рамками, определенными для каждого объекта в памяти человека. Слово "фрейм" в переводе с английского языка означает "рамка". Фрейм является единицей представления знаний об объекте, которую можно описать некоторой совокупностью понятий и сущностей. Под фреймом понимается абстрактный образ или ситуация. В психологии и философии известно понятие абстрактного образа. Например, слово «комната» вызывает у слушателя образ комнаты: «жилое помещение с четырьмя стенами, полом, потолком, окнами и дверью, площадью 6-20 м2». Из этого описания ничего нельзя убрать (например, убрав окна, мы получим чулан, а не комнату), но в нем есть «дырки», или «слоты», - это незаполненные значения некоторых атрибутов – количество окон, цвет стен, высота потолка, покрытие пола и т.д.

Фрейм имеет определённую внутреннюю структуру, состоящую из множества элементов, называемых слотами. Каждый слот в свою очередь, представляется определенной структурой данных, процедурой, или может быть связан с другим фреймом. Значением слота может быть практически что угодно (числа или математические соотношения, тексты на естественном языке или программы, правила вывода или ссылки на другие слоты данного фрейма или других фреймов).

Фрейм можно определить и как формализованную модель для отображения образа.

Во фреймовых моделях фиксируется жестка структура информационных единиц, которая называется протофреймом (фреймы-образцы)

В качестве значения слота может выступать набор слотов более низкого уровня, что позволяет во фреймовых представлениях реализовать "принцип матрешки".

При конкретизации фрейма ему и слотам присваиваются конкретные имена и происходит заполнение слотов. Таким образом, из протофреймов получаются фреймы - экземпляры. Переход от исходного протофрейма к фрейму - экземпляру может быть многошаговым, за счет постепенного уточнения значений слотов.

Структуру фрейма можно представить так:

ИМЯ ФРЕЙМА:(имя 1-го слота: значение 1-го слота), (имя 2-го слота: значение 2-го слота), (имя N-го слота: значение N-го слота).

36.2. Фреймовые модели

Фрейм может содержать процедуры, которые будут выполняться при определенных условиях (при записи или удалении информации из слота, при обращении к слоту, в котором отсутствуют данные и т.д.) С каждым слотом может быть связано любое количество процедур. Процедуры, связанные с определенным слотом фрейма, зависят от конкретной прикладной системы, использующей фреймовые структуры для представления знаний.

Существует несколько способов получения слотом значений во фрейме-экземпляре:

-по умолчанию от фрейма-образца; -через наследование свойств от фрейма, указанного в слоте АКО (A-Kind-Оf, это); -по формуле, указанной в слоте; -через присоединенную процедуру; -явно из диалога с пользователем; -из базы данных.

В качестве значения слота может выступать имя другого фрейма. Тогда образуются сети фреймов. Существование сетей фреймов обусловлено тем, что между различными объектами можно провести некоторые аналогии. Поэтому фреймы, представляющие такие образы, выстраиваются в иерархическую систему. При этом сложные объекты представляются комбинацией нескольких подчиненных фреймов. В сетях фреймов происходит наследование свойств по АКО-связям. Слот АКО указывает на фрейм более высокого уровня, откуда неявно наследуются (переносятся) значения слотов. Основным преимуществом фреймов как модели представления знаний является то, что она отражает концептуальную основу организации памяти человека, а также ее гибкость и наглядность. Кроме того, отмечают однородность представления знаний и возможность их типового текстового описания с помощью специальных языков. В сетях фреймов используются такие специальные языки представления знании, как FRL (Frame Representation Language) и KRL (Knowledge Representation Language). Они позволяют эффективно строить промышленные экспертные системы. Широко известны такие фрейм-ориентированные экспертные системы, как ANALYST, МОДИС, TRISTAN, ALTERID.

37.1. Эволюция концепции обработки данных

Обработка данных со временем претерпела некоторую эволюцию. В развитии концепций обработки данных можно выделить следующие этапы:

· обработка БД на мэйнфреймах с помощью СУБД;

· обработка БД с помощью систем удаленной обработки данных;

· обработка локальных БД на ПК с помощью настольных СУБД;

· использование систем совместного использования (работа с централизованной базой данных с помощью сетевых версий настольных СУБД);

· использование клиент/серверных систем;

· использование систем обработки распределенных баз данных.

В общем случае обработка данных вкл. в себя ввод данных по каким-либо критериям и вывод данных и результат их обраб. в любом виде. Концепции обраб. данных прошли эволюцион. путь развития, связанный с развитием вычислительн. техники в целом. Исторически можно выделить сл. концепции обработки данных:

ОБРАБОТКА НА mainframe В ПАКЕТНЫХ РЕЖИМАХ

Для обработки данных в этом режиме польз-ли создавали задания на выполн-я опр. операций над исходной инф. Задания, запис. на спец. языке, а также текст программы наносились на бумажный носитель-перфокарту. Они складывались в пакет заданий. Пользователи передавали свои пакеты заданий в вычислит. центр для обработки на mainframe. Оператор последовательно вводил пакеты:перфокарт в вычислит. машину. Mainframe обраб. пакеты в порядке очерёдности их поступления. Распечатан. рез-ты обработки данных польз-ли получали только на след.день. Отсутствие непосредственного контакта польз-ля с компьютером существенно увеличивают время получения рез-та. В наст. время пакетный режим исп. редко, только при обработке рез-в ЦТ и обр-ке банковских трансакций.

37.2. Эволюция концепции обработки данных

ОБРАБОТКА В МНОГОТЕРМИНАЛЬН. СИСТЕМАХ

Появились по мере удешевления компьютеров и позволили пользователямнепосредственно обращаться к mainframe без оператора.

Терминал - устройство или набор устройств, предназнач. для взаимодейств. с вычислительн. системой или сетью. Они подключались к mainframe, распол. в вычисл. центре, и были рассредоточены по всему предприятию. Они выполняли операции ввода/вывода, передавали запросы к БД.

ОБРАБОТКА ДАННЫХ НА АВТОНОМНЫХ ПК

На ПК польз-ля устанавл. СУБД, там же создавалась локальная БД и производилась обработка данных. Данные и рез-ты передавались с компьютера на компьютер на внешних носителях. Эта концепция обеспечивала хорошее быстрое действие при работе с небольшими БД.

ОБРАБОТКА ДАННЫХ С ИСПОЛЬЗОВАНИЕМ КОМПЬЮТЕРНЫХ СЕТЕЙ

Обмен данных между компьютерами происходит в автоматическим режиме по средствам линии связи и спец. коммуникационного оборудования. В 1-х комп. сетях были реализованы функции обмена файлами, синхронизация файлов. При объединении ПК в сеть совокупная вычислит. мощность достатосна для решения сложных задач, обработки данных, совместного использ-я переферийных устройств и дисковых массивов.Эта обработка является в наст. время самой распространённой.

Наблюдается тенденция к унификации техн. боработке данных в локальных сетях и в Интернете.

38 вопрос. Принципы передачи данных по сети

Компьютеры различной конфигурации должны при работе сети выполнять строгоустановл.правила преобразов.инф.в электрич.сигналы. Для решения этой задачи весь процесс преобразов.инф.разбивается на отдельн.уровни,к-е взаимодействуют друг с другом согласно протаколам передачи данных.В начале 80-х 20-го в. была разработана стандартная модель сетевого взаимодействия огткрыт.сетей.В ней протоколы сети делятся на 7 уровней:

-физический, -канальный, -сетевой, -транспортный, -сеансовый, -уровень представления, -прикладной

В наст.время большинство соврем.сетей исп.4 уровня:

- прикладной

- транспортный

- уровень межсетевого взаимодействия(соотв.сетевому)

- уровень сетевых интерфейсов(соотв.физическому)

Сообщение на прикладном уровне разбивается на небольшие блоки, называемые пакетами, и передаётся транспорт.уровню с опр.служ.инф.(номер пакета, адрес отправителя, адр.получателя, инструкция по дальн.обработке пакета)

Эта инф. называется заголовка. После обработки транспортн. уровнем пакет передаётся межсетевому, где также снабжается служебной инф. и отправляется на уровень сетевых интерфейсов, где он превращается в кадр в виде электрическ. или оптического сигнала. Сигнал передаётся по сети, на принимающем компьютере происходит сборка таких пакетов в сообщения.

39 вопрос. Удалённая обработка данных

Классической архитектурой обработки многопользовательских БД является удаленная обработка.

Пользователи обрабатывают данные в пакетном режиме. Интерактивный режим доступа осуществляется с помощью терминалов, которые не обладают собственными вычислительными ресурсами. Программы управления коммуникациями (связью), прикладные программы, СУБД и ОС работают на едином центральном компьютере. Поскольку вся обработка производится единственным компьютером, то пользовательский интерфейс систем удаленной обработки обычно достаточно прост.

Пользователи работают с терминалами, которые передают данные и сообщения о транзакциях центральному компьютеру (компьютер удаленной обработки). Функции управления данными возложены на операционную систему. Часть ОС, отвечающая за управление связью, принимает сообщения и данные и передает их соответствующим прикладным программам. Программы обращаются к СУБД, а СУБД выполняет операции с БД, используя ту часть ОС, которая отвечает за обработку данных. Когда транзакция завершается, подсистема управления связью возвращает результаты пользователям, сидящим у терминалов. Поскольку их пользовательский интерфейс достаточно прост и имеет в основном текстовую ориентацию, все команды форматирования вывода генерируются процессором центрального компьютера и передаются по линии связи. Такие системы, подобные описанной называются системами удаленной обработки, поскольку связь между входами и выходами осуществляется через находящийся на расстоянии центральный компьютер, ведущий обработку данных.

Преимуществом такой обработки является возможность коллективного использования ресурсов и оборудования, централизованное хранение данных, а недостатком – отсутствие персонализации рабочей среды (все программное обеспечение хранится централизованно и используется коллективно). Исторически системы удаленной обработки были наиболее распространенной альтернативой многопользовательским системам баз данных. Но по мере того, как ПК стали появляться в офисах и выросла их мощь в качестве серверов данных, возникли новые архитектуры многопользовательских систем обработки данных.

40.1. Архитектура файл/сервер

При наличии компьютерной сети открывается возможность хранить и использовать в многопользовательском режиме централизованные БД, размещаемые на одном компьютере – сервере сети. В этом случае каждый пользователь своего ПК получает доступ к общей для всех пользователей централизованной БД. Существуют различные концепции сетевой обработки данных.

Рассмотрим архитектуру с совместным использованием файлов, которая была разработана до клиент/серверной архитектуры и во многих отношениях является достаточно упрощенной.

Почти во всех системах с совместным использованием файлов применяются локальные сети. Для этой архитектуры характерен коллективный доступ к общей БД на сервере, который является файловым сервером. Файловый сервер содержит файлы, необходимые для работы приложений и самой СУБД. Он обеспечивает функционирование той части сетевой версии СУБД, которая осуществляет управление данными в БД. Однако пользовательские приложения и сама сетевая СУБД размещены и функционируют на отдельных рабочих станциях и обращаются к файловому серверу по мере необходимости.

Рассмотрим организацию архитектуры файл/сервер с использованием настольной СУБД.

Сетевые версии настольных СУБД отличаются от локальных версий тем, что они обладают некоторыми специальными механизмами, позволяющими многим пользователям совместно обращаться к общим ресурсам данных из централизованной базы данных. СУБД на каждой рабочей станции посылает запросы файловому серверу по всем необходимым ей данным, которые хранятся на диске файлового сервера. Все данные из БД пересылаются на компьютер пользователя, независимо от того, сколько реально их нужно для выполнения запроса. В результате на компьютере пользователя создается локальная копия БД (время от времени обновляемая из реальной БД на сервере). Затем СУБД пользователя выполняет запрос.

40.2. Архитектура файл/сервер

Недостатки архитектуры файл/сервер

1. Поскольку файловый сервер не может обрабатывать SQL-запросы, то при совместном использовании файлов по локальной сети передаются большие объемы данных (полные копии БД перемещаются по сети с сервера на компьютер клиента). При такой архитектуре трафик[1] в локальной сети достаточно большой.

2. С увеличением объема хранимых данных и числа пользователей снижается производительность настольных СУБД. Из-за этих проблем системы с совместным использованием файлов редко используются для обработки больших объемов данных.

3. При такой архитектуре вся тяжесть выполнения запроса к БД и управления целостностью БД ложится на СУБД пользователя.

4. На каждой рабочей станции должна находиться сама сетевая версия настольной СУБД, что требует наличия больших объемов оперативной памяти на компьютере пользователя.

5. Доступ к одним и тем же файлам могут осуществлять сразу несколько пользователей, что усложняет управление целостностью, восстановлением БД на сервере.

41.1. Клиент/серверные системы.

Клиент-сервер (англ. Client-server) — сетевая архитектура, в которой устройства являются либо клиентами, либо серверами. Клиентом (front end) является запрашивающая машина (обычно ПК), сервером (back end) — машина, которая отвечает на запрос. Оба термина (клиент и сервер) могут применяться как к физическим устройствам, так и к программному обеспечению. В зависимости от того, как распределены логические компоненты приложения между клиентами и серверами, различают четыре модели архитектуры клиент-сервер:

-модель"файл-сервер";

-модель"сервер/БД";

-модель"сервер/транзакций";

- модель "сервер приложений".

В информационных технологиях клиент — это аппаратный или программный компонент вычислительной системы, посылающий запросы серверу. Программа, являющаяся клиентом, взаимодействует с сервером, используя определенный протокол. Она может запрашивать с сервера какие-либо данные, манипулировать данными непосредственно на сервере, запускать на сервере новые процессы и т. п. Полученные от сервера данные клиентская программа может предоставлять пользователю или использовать как-либо иначе, в зависимости от назначения программы. Программа-клиент и программа-сервер могут работать как на одном и том же компьютере, так и на разных. Во втором случае для обмена информацией между ними используется сетевое соединение.

Тем не менее, не всегда под клиентом подразумевается компьютер со слабыми вычислительными ресурсами. Чаще всего понятия «клиент» и «сервер» описывают распределение ролей при выполнении конкретной задачи, а не вычислительные мощности. На одном и том же компьютере могут одновременно работать программы, выполняющие как клиентские, так и серверные функции.

41.2. Клиент/серверные системы.

Сервер— в информационных технологиях — программный компонент вычислительной системы, выполняющий сервисные (обслуживающие) функции по запросу клиента, предоставляя ему доступ к определённым ресурсам или услугам.

Основной принцип технологии "клиент-сервер" заключается в разделении функций приложения на три группы:

- ввод и отображение данных (взаимодействие с пользователем);

- прикладные функции, характерные для данной предметной области;

- функции управления ресурсами (файловой системой, базой даных и т.д.)

Поэтому, в любом приложении выделяются следующие компоненты:

компонент представления данных

прикладной компонент

компонент управления ресурсом

Связь между компонентами осуществляется по определенным правилам, которые называют "протокол взаимодействия".

Основной принцип технологии "клиент—сервер" применительно к технологии баз данных заключается в разделении функций стандартного интерактивного приложения на 5 групп, имеющих различную природу:

  • функции ввода и отображения данных (Presentation Logic);

  • прикладные функции, определяющие основные алгоритмы решения задач приложения (Business Logic);

  • функции обработки данных внутри приложения (Database Logic);

  • функции управления информационными ресурсами (Database Manager System);

  • служебные функции, играющие роль связок между функциями первых четырех групп.

42 вопрос. Устройства для хранения БД

Устройством (device) в SQL Server называется множество файлов операционной системы, используемых для хранения баз данных и/или журналов транзакций (database and log device) или их резервных копий (dump device). Прежде чем база данных будет создана, должно быть создано устройство для неё. На каждом устройстве может храниться более одной базы данных и каждая база данных может размещаться более чем на одном устройстве.

При установке сервера создаются следующие устройства:

- устройство MASTER, содержащее служебные базы master, model, tempdb и, как правило, pubs (демонстрационная база);

- устройства MSDB и MSDBLog, содержащие базу данных msdb и её журнал транзакций; msdb используется сервисом SQL Executive;

- устройство резервных копий DISKDUMP, ассоциированное с системным устройством NUL.

Устройства баз данных (database devices) могут размещаться в дисковых файлах или на неразмеченных разделах жестких дисков (RAW partitions), устройства резервных копий (dump devices) могут быть ассоциированы с дисками, съемными накопителями, устройствами записи на магнитные ленты и именованными каналами (для систем распределенного резервного копирования). Для устройств баз данных может применяться режим "горячего зеркала" собственными средствами SQL Server. При этом на лету создаётся полностью работоспособная копия как данных, так и журналов. Устройства базы данных MASTER также может быть дублировано.

Правом создавать, модифицировать и удалять устройства обладает только SA.( пользователь, наделенный всеми административными полномочиями - это System Administrator или SA.)

Все операции по созданию устройств и баз данных могут выполняться как через графический интерфейс административной консоли, так и при помощи хранимых процедур.

45 вопрос. Индексирование и хеширование

Важнейшим элементом любой СУБД является наличие средств ускоренного поиска данных. Этот механизм обычно реализуется введением так называемых индексных файлов с расширением idх и cdx. Один файл базы данных может быть проиндексирован по нескольким полям и иметь любое число индексов. Эти файлы содержат один элемент, так называемый индексный ключ. Этот ключ позволяет отсортировать записи данных в алфавитном, хронологическом или числовом порядке для поля, по которому выполнено индексирование. Допускается индексирование и по логическим полям.

Различают два типа индексных файлов:

- простой индексный файл; - составной индексный.

1) Простой индексный файл имеет расширение файла IDX и содержит один индексный ключ. Существуют также компактные простые индексные файлы, которые благодаря сжатию данных, занимают приблизительно в шесть раз меньше места по сравнению с обычным индексным файлом. 2) Составной (мультииндексный) файл имеет расширение CDX и может осуществлять управление одновременно несколькими индексными ключами, хранящихся в индексном выражении. Отдельные ключи называются тегами. Каждый тег имеет свое имя.

Составные файлы могут быть двух видов:

- структурный составной файл; - обычный составной файл.

Структурный составной файл имеет такое же имя файла как и файл базы данных. Данный индексный файл всегда автоматически открывается вместе со своей базой данных. Его нельзя закрыть до ее закрытия, но можно сделать не активным.

Обычный составной файл имеет произвольное имя файла, не совпадающее с именем файла базы данных.

Хешированием называется процесс выделения элемента индексного массива непосредственно по информации,  которая содержится в массиве.  Полученный индекс называется хеш-адресом.  Хеширование обычно используется для уменьшения времени доступа к дисковым файлам.  Однако,  тот же метод можно использовать для реализации разреженных матриц.

46 вопрос. Сжатие данных

С целью сокращ. диско пространства, необх. для хранения набора данных, исп-ся технол. сжат. данн. При этом доступ к данным меньшего размера требует меньшего кол-ва диск. операций ввода-вывода

Наиболее распр. технология сжатия на основе различий, когда некоторое знач-е замен-ся сведениями об его отлич. от предыд. знач. Для реализац. такой технол.треб-ся размещать данные последовательно, т. к. для их распаковки надо иметь знач-е предыд. данного.

Другой тип технол. сжатия основан на иерархическом сжатии данных (сжатие, при котором постоянные части записей, логически объединённых в группы, записываются один раз).

Сущ-т технология сжатия, основанная на кодировании Хаффмана. Суть этого метода состоит в кодир-ии отд. символов битовыми строками разн. длины. Наиб. часто встречающиеся символы кодир-ся строками наименьшей длины. При этом код некоторого символа длиной n не должен совпадать с первыми n символами следующего за ним кода другого символа.

47 вопрос. Администрирование БД

Администрирование базы данных предусматривает выполнение функций, направленных на обеспечение надежного и эффективного функционирования базы данных, а также адекватности ее содержания информационным потребностям пользователей, отображения в базе данных актуального состояния предметной области.

Функции администратора базы данных весьма обширны и по-разному трактуются в различных организациях. В администрировании базы данных можно выделить следующие направления:

- администрирование предметной области, обеспечивающее адекватность отображения в концептуальной схеме базы данных тех изменений, которые происходят в предметной области; - администрирование приложений, ответственное за обеспечение представления базы данных для различных групп пользователей в соответствии с их потребностями; - администрирование базы данных (хранения данных), включающее сохранность базы данных и максимизацию ее производительности; - администрирование безопасности данных, которое обеспечивает представление пользователям полномочий на доступ к данным в базе данных и соответствующим образом настраивает системные средства защиты от несанкционированного доступа.

В достаточно полный набор функций администратора баз данных включаются следующие:

- контроль целостности и восстановление базы данных; - настройка СУБД на конкретные условия применения; - настройка СУБД для эффективной обработки данных и обслуживания пользователей; - сбор и анализ статистики функционирования базы данных; - реорганизация (реструктуризация) базы данных в соответствии с изменениями предметной области; - подключение новых разработчиков и пользователей, назначение паролей, привилегий доступа к конкретным данным; - контроль изменения объема базы данных, определение целесообразности модернизации оборудования; - консультирование пользователей по особенностям используемой версии СУБД и инструментов разработки запросов и других приложений; - разработка процедур использования типичных средств СУБД и документации, регламентирующей действия пользователей по отношению к БД.

48.1. Защита данных.

База данных является ценным корпоративным ресурсом. Возможность доступа к данным, хранимым в ней, является необходимым условием для выполнения бизнес-процессов практически во всех сферах деятельности. Безвозвратная потеря данных подвергает бизнес серьезной опасности.

Разрушение и потеря данных в базе могут быть вызваны рядом причин: сбои оборудования; физические  воздействия  на аппаратные средства базы данных; стихийные бедствия;  ошибки  санкционированных  пользователей; умышленные вредоносные действия несанкционированных пользователей или программ; программные ошибки СУБД или операционной системы; ошибки в прикладных программах;  совместное выполнение конфликтных запросов пользователей  и др.

Для обеспечения безопасности баз данных существуют следующие меры следующего уровня :

- законодательного (законы, нормативные акты, стандарты и т.п.);

- административно-организационного (действия общего характера, предпри­нимаемые руководством организации, и конкретные меры безопасности, на­правленные на работу с людьми);

- программно-технического (конкретные технические меры).

Меры законодательного уровня очень важны для обеспечения безопасности баз данных. К этому уровню можно отнести весь комплекс мер, направленных на создание и поддержание в обществе негативного (в том числе карательного) отношения к нарушениям и нарушителям безопасности

Меры администратпивно- организационного уровня. Администрация организа­ции должна сознавать необходимость поддержания режима безопасности и выделения на эти цели соответствующих ресурсов.

48.2. Защита данных.

К комплексу организационных мер относятся меры безопасности, реализуемые людьми. Можно выделить следующие группы организационных мер:

управление персоналом; физическая защита; поддержание работоспособности; реагирование на нарушения режима безопасности; планирование восстановительных работ

Программно-технический уровень обеспечивает в современных СУБД специальные средства для защиты баз данных, такие как защита паролем, шифрование данных, разграничение прав доступа.

Для подтверждения подлинности пользователя существуют три последовательные процессы:

Идентификация -это процесс распознавания пользователя по его идентификатору (логин и пароль).

Аутентификация - это процесс под­тверждения достоверности идентификатора пользователя. Процесс может быть, например, реализована секретным выражением.

Авторизация - предоставление пользователю только тех данных, на которые он имеет право, т. е. разграничение прав доступа

Разграничение прав доступа является необходимой функцией любой многопользовательской СУБД. Это достаточно гибкая и развитая система, позволяющая администратору баз данных настраивать права доступа пользователей в соответствии с их служебными обязанностями.

База данных может быть зашифрована и храниться на диске в зашифрованном виде.

Шифрование – это преобразование исходных данных по специальным алгоритмам в новое представление, скрывающее содержание исходной информации.

Дешифрование – это обратный шифрованию процесс. При шифровании базы данных ее файл кодируется и становится недоступным для просмотра информации с помощью служебных программ

49 вопрос. Восстановление и хранение БД

Восстановление базы данных осуществляется в случае ее физического повреждения или нарушения целостности.

В число часто используемых средств восстановления базы данных входят резервное копирование и журнал изменений базы данных.

При осуществлении резервного копирования базы данных необходимо выполнять следующие требования: - копия создается в момент, когда состояние базы данных является целостным; - копия создается на иных внешних устройствах, чем то, на котором располагается сама база. Это вызвано тем, что в случае выхода из строя этого устройства восстановить базу данных будет невозможно

Журнал изменений базы данных – это особая часть базы данных, недоступная пользователям СУБД, в которую поступают записи обо всех изменениях основной части базы данных. Для эффективной реализации функции ведения журнала изменений базы данных необходимо обеспечить повышенную надежность хранения и поддержания в рабочем состоянии самого журнала. В большинстве современных реляционных СУБД журнал изменений называется журналом транзакций. В нем регистрируются в хронологическом порядке все изменения, вносимые в базу данных каждой транзакцией.

Для хранения и восстановления данных в настоящее время широкое распространение получили упомянутые в предыдущей лекции RAID – массивы.

RAID-массивы (Redundant Arrays of Inexpensive Disks) представляют собой объединения нескольких сравнительно дешевых жестких дисков (винчестеров) в одно логическое устройство с целью повышения общей емкости, быстродействия и надежности.

Для хранения баз данных, объем у которых превышает 1 Тбайт, используются специальные системы хранения. В настоящее время на рынке продолжают сосуществовать три основные архитектуры систем хранения:

- системы прямого подключения типа DAS (Direct-Attached Storage);

- устройства хранения данных, подключаемые к сети NAS (Network Attached Storage);

- сети хранения данных SAN (Storage Area Network).

50 вопрос. Оптимизация работы БД

Оптимизация работы базы данных является весьма непростой задачей и включает в себя решение целого комплекса взаимосвязанных проблем. Это обеспечение приемлемого быстродействия и функциональности базы данных, удобства работы пользователей, оптимизация потребляемых ресурсов, например, по критерию минимизации затрат памяти и максимизации использования сети и др. Важнейшим аспектом оптимизации является повышение производительности БД.

Для повышения производительности базы данных можно использовать общие методы повышения быстродействия программ, такие как увеличение мощности аппаратных средств, конфигурирование операционной системы, оптимизация структуры внешних носителей и размещения базы данных на них и др. Кроме того, используются специальные средства оптимизации работы базы данных, встроенные в СУБД. В частности, большинство современных реляционных СУБД, имеют в своем составе специальный компонент – оптимизатор запросов, позволяющий максимально быстро и эффективно обрабатывать запросы выбора и запросы манипулирования данными. Например, СУБД Access имеет анализатор быстродействия, который выдает пользователю рекомендации по повышению производительности базы данных.

Распространенный способ оптимизации работы базы данных – это сжатие базы данных. Оно обеспечивает оптимизацию размещения объектов базы данных на внешних носителях и возвращение освободившегося дискового пространства для дальнейшего использования

Многие фирмы-производители СУБД в состав документации по созданию и сопровождению БД включают спец. руководства по оптимизации работы базы данных.В Access: - «Повышение быстродействия для таблиц»; - «Повышение быстродействия для связанных таблиц»; - «Повышение быстродействия для запросов»; - «Повышение быстродействия при поиске и замене данных»; - «Повышение быстродействия для форм и подчиненных форм»; - «Повышение быстродействия для отчетов и подчиненных отчетов»; - «Повышение быстродействия для страниц доступа к данным»; - «Оптимизация проекта Microsoft Access»

35. Семантические сети.

Модель, в которой структура знаний предметной области формализуется в виде ориентированного графика с помеченными вершинами и дугами.

Отношения:

  • связи типа «часть-целое»;

  • функциональные связи, определяемые глаголами (производит, влияет…);

  • количественные (>, <, = и др.);

  • пространственные (далеко от, близко к …);

  • временные (раньше, позже …);

  • атрибутивные (иметь сво-во, иметь значение);

  • логические (и, или, не и др.);

  • лингвистические и др.

17. 1.Требования, предъявляемые к БД

Проектирование БД – это процесс создания БД, предназначенной для поддержки функционирования экономич. объекта и способствующей достижению его целей. Оно представляет собой трудоемкий процесс, требующий совместных усилий аналитиков, проектировщиков и пользователей. При проектировании БД необходимо учитывать тот факт, что она должна удовлетворять комплексу требований:

  • целостность БД – требование полноты и непротиворечивости данных;

  • многократное использование данных;

  • быстрый поиск и получение информации по запросам пользователей;

  • простота обновления данных;

  • минимизация избыточности данных;

  • защита данных от несанкционированного доступа, искажения и уничтожения.

ЖЦБД – это процесс проектирования, реализации и поддержки БД, состоящий из 7 этапов:

  1. предварительного планирования;

  2. проверки осуществимости

  3. определения требований

  4. концептуального проектирования

  5. логического проектирования

  6. физического проектирования

  7. оценки работы и поддержки БД

17.2 Требования, предъявляемые к БД

  1. Собирается инф-ция об используемых и наход-ся в процессе разработке прикладных программах и файлах, связанных с ними. Помогает установить связи между текущими приложениями. Позволяет определить будущие требования к БД. Инф-я документируется в виде обобщенной концептуальной модели данных.

  2. Подготовка отчетов по трем вопросам: 1) есть ли технология – необходимое оборудование и ПО для реализации запланированная БД (технологич. обуществимость); 2) имеются ли персонал, ср-ва и эксперты для успешного осущ. плана создания БД (операционная осуществимость); 3) окупится ли запланированная БД (экономическая эффективность).

  3. Формулируются цели БД; информационные потребности различных структурных подразделений и их руководителей; требования к оборудованию; требования к ПО.

  4. Создаются подробные модели пользовательских представлений данных предметной области., которые затем интегрируются в концептуальную модель, которая фиксирует все элементы корпоративных данных, подлежащих загрузке в БД. Эту модель называют концептуальной сменой БД.

  5. Осуществляется выбор типа модели данных. Концептуальная модель отображается в логическую модель, основанную на структурах, характерных для выбранной модели.

  6. Логическая модель расширяется характеристиками, необходимыми для определения способов физического хранения БД, типа уст-в для хранения, методов доступа к данным базы, требуемого объема памяти, правил сопровождения БД.

  7. Опрос пользователей на предмет выяснения, какие их информационные потребности остались неучтенными. При необходимости вносятся изменения. Пользователи обучаются работе с БД. По мере расширения и изменения потребностей бизнеса поддержка БД обеспечивается путем внесения изменений, добавления новых данных, разработки новых прикладных пр-м, работающих с БД.