
- •Задачи интеллектуального анализа: кластеризация
- •Распределенные вычисления на примере cloud-based по на примере prezi.Com
- •Условия использования сервиса Prezi.Com
- •Технология Redis
- •Программное обеспечение интеллектуального анализа: Система statistica Data Miner
- •Программное обеспечение интеллектуального анализа: Oracle Data Mining
- •Понятие «Data mining», Data mining и базы данных.
- •Архитектура odm
- •Функциональные возможности odm.
- •Технология BigTable (Google)
- •MapReduce: модель и реализации.
- •2. Реализация в распределенной среде.
- •3. Расширенные средства.
- •«Методы Data Mining: ассоциативные правила»
- •1. Определение. Основные понятия
- •2. Типы ассоциативных правил
- •3. Алгоритм apriori
- •4. Применение
- •«Методология Data Mining: crisp-dm»
- •Понимание бизнеса (Business Understanding)
- •Понимание данных (Data Understanding)
- •Подготовка данных (Data Preparation)
- •Моделирование (Modeling)
- •Оценка (Evaluation)
- •Развертывание (Deployment)
- •Большие данные
- •История
- •Методики анализа больших данных
- •Почему данные стали большими
- •Аналитический инструментарий
- •Как справиться с большими данными?
- •Кому выгодны большие данные
- •Проблема больших данных в различных отраслях
- •Информационной экономике нужны миллионы ит-сотрудников
- •10, Спрос на администраторов Big data
- •Стадии интеллектуального анализа: задача консолидации
- •Основные этапы консолидации данных
- •Источники данных
- •Обобщенная схема процесса консолидации
- •Вероятностный вывод
- •Методы интеллектуального анализа : эволюционное программирование и генетические алгоритмы
- •Применение генетических алгоритмов
- •Примеры программного обеспечения
- •Методы интеллектуального анализа: деревья решений
- •Документно-ориентированная система управления базами данных CouchDb
- •Ftp Сервер
- •Методы интеллектуального анализа: иерархические модели кластерного анализа
- •Документно-ориентированная система управления базами данных MongoDb
- •2.Понятие о документно-ориентированной системе управления базами данных MongoDb
- •3. Возможности
- •4.История разработки
- •5. Использование MongoDb
- •6.Оценка производительности
- •7.Безопасность
- •8. Соответствие между sql и MongoDb
- •Простые запросы на выборку
- •Запросы на выборку с регулярными выражениями
- •Запросы на выборку с группировками
- •Запросы на выборку с объединением таблиц
- •Информация о запросе
- •Создание, изменение и удаление документов
- •Бизнес-анализ
- •Часть 1. Понятие «бизнес-анализ»
- •Часть 2. Разделы науки бизнес-анализа
- •Часть 3. Техники бизнес-анализа
- •Часть 4.Система бизнес-анализа и поддержки принятия решений
- •Часть 5. Методы бизнес-анализа
- •6. Роли бизнес-аналитиков
- •7. Цели бизнес-аналитиков
- •8.Выдержки из должностной инструкции бизнес-аналитика
- •9.Будущее бизнес-аналитики
- •Иску́сственные нейро́нные се́ти
- •Систе́ма подде́ржки приня́тия реше́ний
- •1. Сппр- хранилище данных
- •2. Аналитические системы
- •Субд Cassandra
- •Хранилища данных и средства их построения Data Warehousing
- •Программное обеспечение интеллектуального анализа: statistica
- •Бурение и расслоение
- •Классификатор
- •Разведчик многомерных моделей
- •Нейросетевой разведчик
- •Рабочее пространство statistica Data Miner состоит из четырех основных частей:
- •Автоматизация любых процедур с помощью statistica Visual Basic;
2. Аналитические системы
Аналитические системы СППР позволяют решать три основных задачи: ведение отчётности, анализ информации в реальном времени (OLAP) и интеллектуальный анализ данных.
Отчётность.
Сервис отчётности СППР помогает организации справиться с созданием всевозможных информационных отчетов, справок, документов, сводных ведомостей и пр., особенно когда число выпускаемых отчетов велико и формы отчётов часто меняются. Средства СППР, автоматизируя выпуск отчётов, позволяют перевести их хранение в электронный вид и распространять по корпоративной сети между служащими компании.
OLAP
OLAP (On-Line Analitycal Processing) - сервис представляет собой инструмент для анализа больших объемов данных в режиме реального времени. Взаимодействуя с OLAP-системой, пользователь сможет осуществлять гибкий просмотр информации, получать произвольные срезы данных, и выполнять аналитические операции детализации, свертки, сквозного распределения, сравнения во времени. Вся работа с OLAP-системой происходит в терминах предметной области.
OLAP-системы являются частью более общего понятия Business Intelligence, которое включает в себя помимо традиционного OLAP-сервиса средства организации совместного использования документов, возникающих в процессе работы пользователей хранилища. Технология Business Intelligence обеспечивает электронный обмен отчетными документами, разграничение прав пользователей, доступ к аналитической информации из Интернет и Интранет.
Интеллектуальный анализ данных или «добыча данных» (Data Mining)
При помощи средств добычи данных можно проводить глубокие исследования данных. Эти исследования включают в себя: поиск зависимостей между данными (напр., “Верно ли, что рост продаж продукта А обусловлен ростом продаж продукта В ?” ); выявление устойчивых бизнес-групп (напр. “Какие группы клиентов, близких по поведенческим и другим характеристикам, можно выделить? Какие характеристики клиентов при этом оказывают наибольшее влияние на классификацию?“); прогнозирование поведения бизнес-показателей (напр. “Какой объем перевозок ожидается в следущем месяце?“ ); оценка влияния решений на бизнес компании (напр. “Как изменится спрос на товар А среди группы потребителей Б, если снизить цену на товар С ?“ ); поиск аномалий (напр. “С какими сегментами клиентской базы связаны наиболее высокие риски?“).
Характеристики СППР
Интерактивность СППР
Означает, что система откликается на разного рода действия, какими человек намеревается повлиять на вычислительный процесс, в частности в диалоговом режиме. Человек и система обмениваются информацией в темпе, который сравнимый с темпом обработки информации человеком. Тем не менее, практика показывает, что очень много руководителей желают и умеют вести прямой диалог с компьютером. Многие из них понимают преимущество взаимодействия с системой через посредника или в режиме косвенного доступа, когда возможная пакетная обработка информации. Вместе с тем свойство интерактивности необходимо для исследования новых проблем и ситуаций, во время адаптивного проектирования прикладных СППР
Интегрированность СППР
Обеспечивает совместимость составных систем относительно управления данными и средствами общения с пользователями в процессе поддержки принятия решений
Мощность СППР
Означает способность системы отвечать на самые важные вопросы
Доступность СППР
Это способность обеспечивать выдачу ответов на запросы пользователя в нужной форме и в необходимое время
Гибкость СППР
Характеризует возможность системы адаптироваться к изменениям потребностей и ситуаций
Надежность СППР
Означает способность системы выполнять нужные функции на протяжении заданного периода времени
Робастность (robustness) СППР
Это степень способности системы восстанавливаться в случае возникновения ошибочных ситуаций как внешнего, так и внутреннего происхождения. Например, в робастной системе допускаются ошибки в входной информации или неисправности аппаратных средств. Хотя между надежностью и робастностью может существовать определенную связь, эти две характеристики системы разные: система, которая никогда не будет возобновляться в случае наступления ошибочных ситуаций, может быть надежной, не будучи робастной, а система с высоким уровнем робастности, которая может восстанавливаться и продолжать работу в многих ошибочных ситуациях, может быть вместе с тем отнесенная к ненадежных, поскольку она не способна заранее, выполнить необходимые служебные процедуры при повреждениях
Управляемость СППР
Означает, что пользователь может контролировать действия системы, вмешиваясь в ход решения задачи.
Дополнительно к этой особенности информационной технологии поддержки принятия решений можно указать еще ряд ее отличительных характеристик.
Отличительные характеристики:
использование больших объемов данных;
ориентация на решение плохо структурированных (формализованных) задач;
сочетание традиционных методов доступа и обработки компьютерных данных с возможностями математических моделей и методами решения задач на их основе;
добавление в систему новых данных происходит относительно редко крупными блоками (например, раз в квартал загружаются данные по итогам квартальных продаж из OLTP-приложения);
данные, добавленные в систему, обычно никогда не удаляются;
перед загрузкой данные проходят различные процедуры "очистки", связанные с тем, что в одну систему могут поступать данные из многих источников, имеющих различные форматы представления для одних и тех же понятий, данные могут быть некорректны, ошибочны;
направленность на непрофессионального пользователя компьютера;
небольшое число пользователей (аналитики);
высокая адаптивность, обеспечивающая возможность приспосабливаться к особенностям имеющегося технического и программного обеспечения, а также требованиям пользователя.
По критерию режима анализа данных информационно-аналитические системы подразделяются на две категории:
Статические DSS - СППР
Известны в литературе информационными системами руководителя (Executive Information Systems - EIS). EIS-системы содержат в себе предопределенные множества запросов но, будучи достаточными для повседневного обзора, неспособны ответить на все вопросы к имеющимся данным, которые могут возникнуть при принятии решений. Результатом работы такой системы, как правило, являются многостраничные отчеты, которые нельзя использовать для получения желаемого представления данных и после тщательного изучения которых у аналитика появляется новая серия вопросов
Динамические DSS - СППР
Ориентированы на обработку нерегламентированных (ad hoc) запросов аналитиков к данным. Наиболее глубоко требования к таким системам рассмотрел в 1993 г . E.F.Codd, положившей начало концепции OLAP.
Чтобы разобраться в работе СППР, необходимо понять суть проблем, которые она решает, а также организационные процессы, в которые она включена. Так, например, при определении возможности внедрения СППР следует учитывать:
структурированность решаемых управленческих задач;
уровень иерархии управления фирмой, на котором решение должно быть принято;
принадлежность решаемой задачи к той или иной функциональной сфере бизнеса;
вид используемой информационной технологии.