- •16. Набор данных и их атрибутов
- •17. Измерения и шкалы
- •18. Типы наборов данных
- •19. Форматы хранения данных
- •20. Базы данных. Основные положения
- •21. Системы управления базами данных(субд)
- •22. Классификация видов данных
- •23. Метаданные
- •24. Принципы обработки и анализа данных
- •25. Структурированные данные
- •26. Подготовка данных к анализу и обработке
- •27. Технологии kdd и Data Mining (dm)
- •28. Аналитические платформы
- •29. Алгоритмы Data Mining
- •30. Консолидация данных
28. Аналитические платформы
Аналитические платформы - это средства построения прикладных решений в области анализа.
Аналитическвя платформа - основа для создания законченных прикладных решений в области анализа данных. Реализованные в ней технологии позволяют на базе единой архитектуры пройти все этапы построения аналитической системы от создания хранилища данных до автоматического подбора моделей и визуализации полученных результатов.
Аналитическая платформа реализует практически все современные подходы к анализу структурированной табличной информации: хранилища данных (Data Warehouse), многомерный анализ (OLAP), добыча данных (DATA MINING), обнаружение знаний в базах данных (KDD).
29. Алгоритмы Data Mining
искусственные нейронные сети
деревья решений, символьные правила
методы ближайшего соседа и k-ближайшего соседа
метод опорных векторов
байесовские сети
линейная регрессия
корреляционно-регрессионный анализ
иерархические методы кластерного анализа
неиерархические методы кластерного анализа, в том числе алгоритмы k-средних и k-медианы
методы поиска ассоциативных правил, в том числе алгоритм Apriori
метод ограниченного перебора
эволюционное программирование и генетические алгоритмы
разнообразные методы визуализации данных и множество других методов.
30. Консолидация данных
Консолидация данных - это способ получения итоговой информации, который выполняется в соответствии с выбранной функцией обработки.
Результат консолидации находится в области-назначения. Таблица консолидации создается путем применения функции обработки к исходным значениям. Области-источники могут находиться на различных листах или рабочих книгах. В консолидации может участвовать до 255 областей-источников.
Варианты
консолидации данных:
с помощью формул, где используются ссылки;
по расположению данных дляодинаково организованных областей-источников (фиксированное расположение);
по категориям для различающихся по своей структуре области данных;
с помощью сводной таблицы;
консолидация внешних данных.
