
- •1.Определение одномерной случайной величины
- •6. Характеристики многомерной случайной величины
- •7. Корреляционная функция одномерной случайной величины
- •8. Корреляционная функция многомерной случайной величины
- •9. Определение корреляционной функции
- •10. Дисперсия одномерной случайной величины
- •11. Дисперсия многомерной случайной величины
- •12. Оценка вида закона распределения одномерной случайной величины
- •13. Оценка вида закона распределения многомерной случайной величины
- •14. Проверка статистических гипотез о виде закона распределения
- •15. Корреляционный анализ
- •16. Регрессионный анализ
- •17. Дисперсионный анализ
- •18. Построение уравнения регрессии
- •19. Метод наименьших квадратов
- •20. Остаточная дисперсия
- •27. Многомерные кубы в olap
- •28. Виды аналитической обработки данных
- •29. Хранилища данных (Data Warehouse)
- •30. Интеллектуальный анализ данных (Data Mining)
- •31. Принцип многомерного представления данных
- •32. Многомерный olap (molap)
- •33. Системы оперативной аналитической обработки реляционных данных
- •34. Реляционные субд
- •35. Многомерные субд
- •36. Постреляционные субд
- •37. Три стадии интеллектуального анализа данных
- •38. Многомерный интеллектуальный анализ данных
- •39. Интеллектуальный анализ данных с непосредственным использованием обучающих данных
- •40. Интеллектуальный анализ данных с выявлением и использованием закономерностей
27. Многомерные кубы в olap
Кубы данных OLAP (Online Analytical Processing — оперативный анализ данных) позволяют эффективно извлекать и анализировать многомерные данные. В отличие от других типов баз данных, базы данных OLAP разработаны специально для аналитической обработки и быстрого извлечения из них всевозможных наборов данных. На самом деле существует несколько ключевых различий между стандартными реляционными базами данных, такими как Access или SQL Server, и базами данных OLAP.
28. Виды аналитической обработки данных
-Хранилища данных
-Реляционные хранилища данных
-Таблица фактов
-Таблицы измерений
-OLAP и многомерные хранилища данных
-Data Mining
-Регрессионный, дисперсионный и корреляционный анализ
-Методы анализа в конкретной предметной области
-Метод "ближайшего соседа"
-Кластерные модели
-Алгоритмы ограниченного перебора
-Эволюционное программирование
29. Хранилища данных (Data Warehouse)
Хранилище данных, Data Warehouse - предметно-ориентированная информационная база данных, специально разработанная и предназначенная для подготовки отчётов и бизнес-анализа с целью поддержки принятия решений в организации. Строится на базе систем управления базами данных и систем поддержки принятия решений. Данные, поступающие в хранилище данных, как правило, доступны только для чтения. Данные из OLTP-системы копируются в хранилище данных таким образом, чтобы построение отчётов и OLAP-анализ не использовал ресурсы транзакционной системы и не нарушал её стабильность. Как правило, данные загружаются в хранилище с определённой периодичностью, поэтому актуальность данных может несколько отставать от OLTP-системы.
Принципы организации хранилища
-Проблемно-предметная ориентация.
-Интегрированность.
-Некорректируемость.
-Зависимость от времени.
30. Интеллектуальный анализ данных (Data Mining)
Главным предназначением технологий интеллектуального анализа данных является извлечение и представление знаний из накопленной в базах данных, информационных хранилищах и других источниках информации.
Основными задачами интеллектуального анализа являются:
-выявление взаимозависимостей, причинно-следственных связей, ассоциаций и аналогий, определение значений факторов времени, локализация событий или явлений по месту;
-классификация событий и ситуаций, определение профилей различных факторов;
-прогнозирование хода процессов, событий.
31. Принцип многомерного представления данных
Сущность многомерного представления данных состоит в следующем. Большинство реальных бизнес-процессов описывается множеством показателей, свойств, атрибутов и т.д. Например, для описания процесса продаж могут понадобиться сведения о наименованиях товаров или их групп, о поставщике и покупателе, о городе, где производились продажи, а также о ценах, количествах проданных товаров и общих суммах. Кроме того, для отслеживания процесса во времени должен быть введен в рассмотрение такой атрибут, как дата. Если собрать всю эту информацию в таблицу, то она окажется сложной для визуального анализа и осмысления. Более того, она может оказаться избыточной: если, например, один и тот же товар продавался в один и тот же день в различных городах, то придется несколько раз повторить одно и то же соответствие «город — товар» с указанием различных суммы и количества. Все это способно окончательно запутать и сбить с толку любого, кто попытается извлечь из такой таблицы полезную информацию с целью анализа текущего состояния продаж и поиска путей оптимизации процесса торговли. Указанные проблемы возникают по одной простой причине: в плоской таблице хранятся многомерные данные.