
- •60 Критерии выбора субд.
- •62 Тенденции развития современных технологий управления базами данных.
- •5. Управление данными в отдельных проектах
- •63 Какие критерии оптимизации бд можно выбрать?
- •Оптимизация структур данных
- •64 Как можно улучшить структуру бд? Оптимизация структур данных
- •65 Какие методы оптимизации можно применить?
- •Оптимизация структур данных
- •66 Что из себя представляет многомерная модель?
- •Пользователя редко интересуют все потенциально возможные комбинации значений измерений. Для этого используются срезы, отображения страниц, вращение, нарезка на кубики, агрегация, детализация.
- •73 Назовите характеристики технических носителей
- •78 Назовите перспективные технологии хранения данных
- •79. Кто отвечает за сохранность данных и как это делается?
60 Критерии выбора субд.
Определение критериев выбора СУБД. Выбору СУБД предшествуют работы по анализу их функциональных возможностей, определению критериев оценки и сравнения их на основе изучения литературы и тестовой загрузки СУБД. Критериями выбора СУБД могут быть стоимость программных средств; объем памяти на диске; требуемый объем оперативной памяти; быстродействие; простота использования структуры данных; удобный доступ к БД через Интернет.
Требования к функциональности и производительности программного обеспечения могут меняться довольно быстро, поэтому требования, предъявляемые к СУБД, должны иметь некий резерв по производительности аппаратно - программных средств. Полезно разработать два документа; один с функциональными и технологическими требованиями к системе, а другой — с требованиями к ее поставщику. Очень важно сравнивать СУБД одного класса.
Очень важными функциональными возможностями СУБД являются поддержка языка XML, доступ к данным с мобильных устройств, наличие версии с открытым кодом, интеграция с офисными пакетами, наличие программ визуализации данных, управление неструктурированными данными, унифицированный интерфейс.
У современных СУБД необходимо рассматривать:
модель данных;
особенности архитектуры и функциональные возможности;
возможности контроля работы СУБД;
особенности разработки приложений;
производительность;
доступность БД - постоянная возможность получения ответа на запрос;
надежность работы БД, то есть минимальная вероятность сбоев, а также наличие средств восстановления данных после сбоев, технического резервирования и дублирования данных;
наличие средств защиты данных от несанкционированного доступа;
поддержку стандартных механизмов доступа к данным (ODBC, JDBC, OLE DB);
требования к рабочей среде (поддерживаемые аппаратные платформы и ОС, под управлением которых способна работать СУБД, минимальные требования к оборудованию, максимальные размеры адресуемой памяти - какой максимальный объем физической памяти они могут использовать, возможность использования триггеров, хранимых процедур, средств поиска - некоторые современные системы имеют встроенные дополнительные средства контекстного поиска;
качество и полноту документации;
возможность использования национальных языков;
логическую и физическую организацию хранения данных (распределение таблиц, индексов и других объектов БД по файлам, областям, пакетам, владельцам, схемам);
аутентификацию, распределение прав доступа и система безопасности (пользователи, группы, роли);
структуру БД (типы данных и размеры полей, ограничения на поля, индексы и т.п.);
ссылочную целостность (первичные и внешние ключи, ссылки между таблицами);
возможности программирования триггеров, хранимых процедур и пользовательских функций (встроенные языки программирования сценариев), SQL-запросы, команды и операторы (поддержка уровня ANSI, конструкции запросов, встроенные функции и т.п.);
преобразование данных (обработка пустых полей и значений NULL, конвертирование дат в числа или строк в числа и т.п.);
программный интерфейс клиентской части для прямого доступа к программам, составляющим СУБД, например, Oracle Call Interface (поддержка связанных переменных, обработка массивов записей в пакетном режиме, обработка результатов запросов);
драйверы верхнего уровня (ODBC, JDBC, OLEDB, ADO, др.);
администрирование и сопровождение сервера, резервные копии, оптимизация производительности и масштабируемости, балансировка нагрузки;
поддержку ОС Unix (Sun Solaris, HP-UX, IBM AIX, Linux) и Windows, протоколов взаимодействия клиента с сервером и поддержка транспортного уровня (TCP/IP, IPX/SPX, NetBIOS).
61 Технология хранилищ данных: основные положения и допущения, модели данных для хранилищ данных.
создание хранилищ данных (Data warehouses), то есть процесс сбора, отсеивания и предварительной обработки данных с целью предоставления результирующей информации пользователям для статистического анализа (а нередко и создания аналитических отчетов). Ральф Кимбалл (Ralph Kimball), один из авторов концепции хранилищ данных, описывал хранилище данных как место, где люди могут получить доступ к своим данным (Ralph Kimball, The Data Warehouse Toolkit: Practical Techniques for Building Dimensional Data Warehouses, John Wiley & Sons, 1996 и «The Data Web house Toolkit: Building the Web-Enabled Data Warehouse», John Wiley & Sons, 2000). Он же сформулировал и основные требования к хранилищам данных:
поддержка высокой скорости получения данных из хранилища;
поддержка внутренней непротиворечивости данных;
возможность получения и сравнения так называемых срезов данных (slice and dice);
наличие удобных утилит просмотра данных в хранилище;
полнота и достоверность хранимых данных;
поддержка качественного процесса пополнения данных.
Удовлетворять всем перечисленным требованиям в рамках одного и того же продукта зачастую не удается. Поэтому для реализации хранилищ данных обычно используется несколько продуктов, одни из которых представляют собственно средства хранения данных, вторые - средства их извлечения и просмотра, третьи - средства их пополнения и т.д.Типичное хранилище данных, как правило, отличается от обычной реляционной базы данных. Во-первых, обычные базы данных предназначены для того, чтобы помочь пользователям выполнять повседневную работу, тогда как хранилища данных предназначены для принятия решений. Например, продажа товара и выписка счета производятся с использованием базы данных, предназначенной для обработки транзакций, а анализ динамики продаж за несколько лет, позволяющий спланировать работу с поставщиками, с помощью хранили- ща данных. Во-вторых, обычные базы данных подвержены постоянным изменениям в процессе работы пользователей, а хранилище данных относительно стабильно: данные в нем обычно обновляются согласно расписанию (например, еженедельно, ежедневно или ежечасно - в зависимости от потребностей). В идеале процесс пополнения представляет собой просто добавление новых данных за определенный период времени без изменения прежней информации, уже находящейся в хранилище. И, в-третьих, обычные базы данных чаще всего являются источником данных, попадающих в хранилище. Кроме того, хранилище может пополняться за счет внешних источников, например статистических отчетов.