
- •Недостатки файловых систем по сравнению с системами баз данных.
- •Понятие системы и информационной системы. Классификация информационных систем.
- •3. По выполняемым функциям и решаемым задачам:
- •4. По масштабу и интеграции компонент:
- •5. По характеру обработки информации на различных уровнях управления предприятием:
- •6. По уровням управления:
- •7. Классификация ис по функциональному признаку:
- •12. Классификация по сфере применения
- •13. По степени распределённости ис отличают:
- •Понятие системы баз данных и ее упрощенная схема.
- •Понятия интегрированности и разделяемости данных, независимости от данных и целостности данных применительно к системам баз данных.
- •Жизненный цикл базы данных. Этапы концептуального, логического и физического проектирования базы данных.
- •Понятия модели и модели данных. Логические модели данных.
- •Иерархическая модель данных, ее достоинства и недостатки.
- •Сетевая модель данных, ее достоинства и недостатки.
- •Реляционная модель данных. Ее отличие от графовых моделей (иерархической и сетевой).
- •Основные понятия реляционной алгебры.
- •Определение сущности в реляционной алгебре. Свойства сущности.(сложный, если честно)
- •Понятия возможного, первичного и альтернативного ключей.
- •Операции реляционной алгебры. Базовые реляционные операции.
- •Теоретико-множественные реляционные операции. Свойства реляционной операции декартова произведения.
- •Специальные реляционные операции.
- •Реляционные операции селекции и проекции.
- •Операция выборки
- •Операция проекции
- •Реляционная операция соединения. Ее разновидности.
- •Реляционная операция естественного соединения и ее свойства. Естественное соединение
- •Реляционная операция деления.
- •Примитивные и не примитивные реляционные операции. Оператор соединения
- •Оператор пересечения
- •Оператор деления
- •21. Типы связей между сущностями.
- •22. Связь между сущностями типа «один ко многим». Свойства внешнего ключа.
- •23. Связь между сущностями типа «многие ко многим». Ее преобразование при переходе к физической модели. Связи "многие ко многим"
- •24.Нормализация данных. Первая нормальная форма.
- •1 Нормальня форма
- •25.Нормализация данных. Вторая нормальная форма.
- •2 Нормальная форма
- •Нормализация данных. Третья нормальная форма и нормальная форма Кодда-Бойса.
- •27.Нормализация данных. Четвертая и пятая нормальные формы.
- •28. Целостность и непротиворечивость данных.
- •29.Основные и дополнительные правила ссылочной целостности.
- •30. Язык sql: основные команды манипулирования данными.
- •31. Язык sql: вставка новой записи в таблицу.
- •32. Язык sql: удаление записей из таблицы.
- •33. Язык sql: использование операторов in, between, like и ключевого слова null в условиях отбора данных.
- •34. Язык sql: обновление записей в таблице.
- •35. Язык sql: выборка данных из таблиц. Использование агрегатных функций и вычисляемых полей.
- •36. Язык sql: группировка строк набора данных.
- •Язык sql: соединение таблиц (внутреннее и внешнее).
- •Язык sql: использование подзапросов.
- •Язык sql: операторы exists, any, all в командах с подзапросом.
- •Язык sql: основные команды определения данных.
- •Язык sql: создание и использование представлений (просмотров) и индексов.
- •Назначение и функции субд.
- •Управление словарем данных и обеспечение безопасности данных в субд.
- •Обеспечение целостности данных в субд.
- •Управление многопользовательским доступом к данным в субд.
- •Управление резервным копированием и восстановлением данных в субд.
- •Механизм тиражирования (репликации) данных в субд.
- •Блочная репликация
- •Физическая репликация
- •Логическая репликация
- •Типы баз данных.
- •Иерархическая база данных, структура иерархических баз данных
- •Сетевая база данных, структура сетевых баз данных
- •Реляционные базы данных, структура реляционных баз данных
- •Особенности реляционных баз данных
- •Распределенные базы данных. Двенадцать правил Дейта для распределенных баз данных.
- •Системы «клиент/сервер».
- •Системы поддержки принятия решений.
- •Классификации
- •Структура
- •Преимущества
- •52. Хранилища данных. Их отличия от операционных баз данных
- •53 Подготовка данных применительно к хранилищам данных
- •54 Магазины (витрины) данных. Банки оперативных данных Красный – в рот я ебал такие вопросы
- •55 Многомерные базы данных. Разработка (извлечение) данных
- •ERwin: сильные и слабые связи между сущностями. Операции прямого и обратного проектирования.
- •Операции прямого и обратного проектирования
- •Sql Server: курсоры и триггеры, их виды, процесс использования.
53 Подготовка данных применительно к хранилищам данных
На этапе подготовки данных аналитик готовит набор данных, содержащий достаточно информации, для того чтобы создать точные модели на последующих этапах. В случае с FSC, точная модель должна помочь прогнозировать, с какой вероятностью клиент купит продукты, рекламируемые в новом каталоге. Поскольку эти прогнозы основаны на факторах, потенциально влияющих на покупки клиентов, множество данных в модели будет включать в себя всех клиентов, отреагировавших на рассылаемые по почте каталоги за последние три года, их демографическую информацию, десять самых дорогих продуктов, которые приобрел каждый клиент, а также информацию о каталоге, послужившем стимулом для этих покупок.
Подготовка данных может включать в себя сложные запросы с объемными результатами. К примеру, подготовка множества данных FSC предусматривает соединение таблицы клиентов и таблицы продаж, а также выявление 10 самых дорогих покупок для каждого клиента. Все эти вопросы, касающиеся эффективной обработки запросов для поддержки принятия решения, одинаково актуальны в контексте добычи данных. Фактически, платформы добычи данных используют реляционные серверы или серверы OLAP для решения своих задач по подготовке данных.
Как правило, добыча данных включает в себя итеративно создаваемые модели на основе подготовленного множества данных, а затем применение одной или нескольких моделей. Поскольку создание моделей на больших множествах данных может оказаться весьма дорогостоящим, аналитики часто сначала работают с несколькими выборками множества данных. Платформы добычи данных, таким образом, должны поддерживать вычисления на случайно выбранных экземплярах данных в сложных запросах.
54 Магазины (витрины) данных. Банки оперативных данных Красный – в рот я ебал такие вопросы
Витрина данных (англ. Data Mart; другие варианты перевода: хранилище данных специализированное, киоск данных, рынок данных) — срез хранилища данных, представляющий собой массив тематической, узконаправленной информации, ориентированный, например, на пользователей одной рабочей группы или департамента.
Концепция :
Концепция витрин данных была предложена Forrester Research ещё в 1991 году. По мысли авторов, витрины данных — множество тематических баз данных (БД), содержащих информацию, относящуюся к отдельным аспектам деятельности организации.
Концепция имеет ряд несомненных достоинств:
Аналитики видят и работают только с теми данными, которые им реально нужны.
Целевая БД максимально приближена к конечному пользователю.
Витрины данных обычно содержат тематические подмножества заранее агрегированных данных, их проще проектировать и настраивать.
Для реализации витрин данных не требуется высокомощная вычислительная техника.
Но концепция витрин данных имеет и очень серьёзные пробелы. По существу, здесь предполагается реализация территориально распределённой информационной системы с мало контролируемой избыточностью, но не предлагается способов, как обеспечить целостность и непротиворечивость хранимых в ней данных.