- •16. Набор данных и их атрибутов
- •17. Измерения и шкалы
- •18. Типы наборов данных
- •19. Форматы хранения данных
- •20. Базы данных. Основные положения
- •21. Системы управления базами данных(субд)
- •22. Классификация видов данных
- •23. Метаданные
- •24. Принципы обработки и анализа данных
- •25. Структурированные данные
- •26. Подготовка данных к анализу и обработке
- •27. Технологии kdd и Data Mining (dm)
- •28. Аналитические платформы
- •29. Алгоритмы Data Mining
- •30. Консолидация данных
21. Системы управления базами данных(субд)
Система управления базой данных - это программное обеспечение, контролирующее организацию, хранение, целостность, внесение изменений, чтение и безопасность информации в базе данных.
СУБД (Database Management System, DBMS) представляет собой оболочку, с помощью которой при организации структуры таблиц и заполнения их данными получается та или иная база данных.
СУБД имеет программные, технические и организационные составляющие.
22. Классификация видов данных
реляционные - данные из реляционных баз (таблиц)
многомерные - данные, представленые в кубах OLAP
измерение или ось - в многомерных данных - это собрание данных одного и того же типа, что позволяет структурировать многомерную базу данных
переменные - данные, которые изменяют свои значения в процессе решения задачи
постоянные - данные, которые сохраняют свои значения в процессе решения задачи (математические константы, координаты неподвижных объектов) и не зависят от внешних факторов
условно-постоянные - данные, которые могут иногда изменять свои значения, но эти изменения не зависят от процесса решения задачи, а определяются внешними факторами
справочные
оперативные
архивные
23. Метаданные
Метаданные (Metadata) - это данные о данных. Они содержат сведения о составе данных, содержании, статусе, происхождении, местонахождении, качестве, форматах и формах представления, условиях доступа, приобретения и использования, авторских, имущественных и смежных с ними правах на данные и др.
В состав метаданных могут входить: каталоги, справочники, реестры.
Метаданные - важное понятие в управлении хранилищем данных.
Метаданные хранилища обычно размещаются в репозитории. Это позволяет использовать метаданные совместно различным инструментам, а также процессам при проектировании, установке, эксплуатации и администрировании хранилища.
24. Принципы обработки и анализа данных
Можно выделить следующие основные принципы анализа и обработки данных:
Научность – реализуется путем совершенствования анализа хозяйственной деятельности, применения методик и ЭВМ.
Объективность, конкретность и точность – должены базироваться на достоверной, проверенной информации, а выгода его должна обосновываться точными аналитическими расчетами. Из этого требования вытекает необходимость постоянного совершенствования организации учета, внутреннего и внешнего аудита, а так же методики анализа с целью повышения его точности и достоверности расчета.
Системность и комплексность – каждый изучаемый объект рассматривается как сложная динамическая система, состоящая из ряда элементов, определенным образом связанных между собой.
Оперативность и своевременность – предусматривает умение быстро и четко проводить анализ, принимать управленческие решения и проводить их в жизнь.
Действенность – активное воздействие на ход процесса производства и его результатов.
Плановость и систематичность – анализ проводится по плану и периодически.
Демократичность – предполагает участие всех в проведении анализа и предполагает доступность информации всем.
Эффективность – затраты на его проведение должны давать многократный эффект.
