Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
МЕТОДЫ АНАЛИЗА ДАННЫХ Экзамен.doc
Скачиваний:
217
Добавлен:
06.03.2017
Размер:
93.7 Кб
Скачать

27. Многомерные кубы в olap

Кубы данных OLAP (Online Analytical Processing — оперативный анализ данных) позволяют эффективно извлекать и анализировать многомерные данные. В отличие от других типов баз данных, базы данных OLAP разработаны специально для аналитической обработки и быстрого извлечения из них всевозможных наборов данных. На самом деле существует несколько ключевых различий между стандартными реляционными базами данных, такими как Access или SQL Server, и базами данных OLAP.

28. Виды аналитической обработки данных

-Хранилища данных

-Реляционные хранилища данных

-Таблица фактов

-Таблицы измерений

-OLAP и многомерные хранилища данных

-Data Mining

-Регрессионный, дисперсионный и корреляционный анализ

-Методы анализа в конкретной предметной области

-Метод "ближайшего соседа"

-Кластерные модели

-Алгоритмы ограниченного перебора

-Эволюционное программирование

29. Хранилища данных (Data Warehouse)

Хранилище данных, Data Warehouse - предметно-ориентированная информационная база данных, специально разработанная и предназначенная для подготовки отчётов и бизнес-анализа с целью поддержки принятия решений в организации. Строится на базе систем управления базами данных и систем поддержки принятия решений. Данные, поступающие в хранилище данных, как правило, доступны только для чтения. Данные из OLTP-системы копируются в хранилище данных таким образом, чтобы построение отчётов и OLAP-анализ не использовал ресурсы транзакционной системы и не нарушал её стабильность. Как правило, данные загружаются в хранилище с определённой периодичностью, поэтому актуальность данных может несколько отставать от OLTP-системы.

Принципы организации хранилища

-Проблемно-предметная ориентация.

-Интегрированность.

-Некорректируемость.

-Зависимость от времени.

30. Интеллектуальный анализ данных (Data Mining)

Главным предназначением технологий интеллектуального анализа данных является извлечение и представление знаний из накопленной в базах данных, информационных хранилищах и других источниках информации.

Основными задачами интеллектуального анализа являются:

-выявление взаимозависимостей, причинно-следственных связей, ассоциаций и аналогий, определение значений факторов времени, локализация событий или явлений по месту;

-классификация событий и ситуаций, определение профилей различных факторов;

-прогнозирование хода процессов, событий.

31. Принцип многомерного представления данных

Сущность многомерного представления данных состоит в следующем. Большинство реальных бизнес-процессов описывается множеством показателей, свойств, атрибутов и т.д. Например, для описания процесса продаж могут понадобиться сведения о наименованиях товаров или их групп, о поставщике и покупателе, о городе, где производились продажи, а также о ценах, количествах проданных товаров и общих суммах. Кроме того, для отслеживания процесса во времени должен быть введен в рассмотрение такой атрибут, как дата. Если собрать всю эту информацию в таблицу, то она окажется сложной для визуального анализа и осмысления. Более того, она может оказаться избыточной: если, например, один и тот же товар продавался в один и тот же день в различных городах, то придется несколько раз повторить одно и то же соответствие «город — товар» с указанием различных суммы и количества. Все это способно окончательно запутать и сбить с толку любого, кто попытается извлечь из такой таблицы полезную информацию с целью анализа текущего состояния продаж и поиска путей оптимизации процесса торговли. Указанные проблемы возникают по одной простой причине: в плоской таблице хранятся многомерные данные.