
- •Глоссарий
- •Тема 1. Информация в контексте современной экономики
- •1. Информационное пространство как среда анализа.
- •2. Понятие информационного пространства.
- •3. Структура информационного пространства.
- •4. Элементы структуры информационного пространства. Понятие показателя.
- •Объем продаж (автомобиль, значение объема продаж)
- •И (модель автомобиля, время)
- •И (модель автомобиля (менеджер, регион, год, покупатель))
- •S (модель автомобиля, фирма изготовитель, год выпуска)
- •5. Пространственная интерпретация понятия показатель.
- •6. Единое информационное пространство предприятия.
- •Тема 2. Анализ информации на предприятии
- •1. Виды и задачи анализа на предприятии.
- •2. Содержание экономических показателей.
- •3. Классификация методов анализа.
- •4. Источники данных для проведения анализа.
- •Тема 3. Информационно – аналитическая система как инструмент проведения экономического анализа
- •1. Общее понятие информационно – аналитической системы.
- •2. Функции и сферы применения иас.
- •3. Классификация аналитических систем.
- •Полный классификатор аналитических систем
- •Инструменты добычи данных.
- •Средства построения Хранилищ и Витрин данных.
- •Управленческие информационные системы и приложения.
- •4. Концепции построения иас.
- •5. Общая структура информационной аналитической системы.
- •Тема 4. Хранилища данных
- •1. Пространственная интерпретация данных.
- •Реляционная модель представления данных
- •Многомерная модель представления данных
- •1) Формирование "Среза".
- •2) Операция "Вращение".
- •3) Отношения и Иерархические Отношения.
- •5) Операция Детализации.
- •2. Понятие хранилища данных.
- •Основные требования к данным в Хранилище Данных
- •Централизованное хранилище данных
- •Распределенное хранилище данных
- •Автономные витрины данных
- •Единое интегрированное хранилище и много витрин данных
- •3. Структура хранилищ данных.
- •4. Вопросы реализации Хранилищ Данных.
- •Неоднородность программной среды.
- •Распределенность.
- •Метаданные.
- •Роль метаданных в системах Хранилищ Данных.
- •Уровни метаданных в Хранилище Данных
- •Вопросы защиты данных
- •Задачи Хранилища данных
- •1. Консолидация данных.
- •2. Интеграция данных.
- •Консолидация данных
- •Интеграция данных
- •Агрегация данных
- •Расчеты производных показателей
- •Предоставление данных для поддержки принятия решений (dss)
- •Тема 5. Оперативный анализ данных
- •1. Место olap в информационной структуре предприятия.
- •2. Оперативная аналитическая обработка данных.
- •3. Требования к средствам оперативной аналитической обработки.
- •Правила оценки программных продуктов класса olap
- •4. Классификация olap-продуктов.
- •Классификация по способу хранения данных
- •5. Принципы работы olap-клиентов.
- •6. Выбор архитектуры olap-приложения.
- •5. Склад.
- •6. Движение денежных средств.
- •7. Бюджет.
- •8. Бухгалтерские счета.
- •9. Финансовая отчетность.
- •1. Интеллектуальный анализ данных.
- •2. Стадии иад.
- •1. Свободный поиск (Discovery).
- •2. Прогностическое моделирование (Predictive Modeling).
- •3. Анализ исключений (Forensic Analysis).
- •4. Методы иад.
- •1. Непосредственное использование обучающих данных.
- •2. Выявление и использование формализованных закономерностей.
- •3. Методы вывода уравнений.
- •4. Типы закономерностей.
- •5. Типовые задачи для методов иад.
- •6. Области применения Data mining.
- •Розничная торговля.
- •Банковское дело.
- •Телекоммуникации.
- •Страхование.
- •Другие приложения в бизнесе.
- •7. Классы систем Data Mining.
- •8. Интеграция olap и иад.
- •Тема 7. Инструментальные средства автоматизации аналитической работы и планирования
- •1. Инструментальные средства поддержки аналитической работы и их классификация.
- •2 Аналитические инструментальные средства пакетов прикладных программ широкого применения.
- •Crystal Enterprise (по материалам www.Interface.Ru).
- •3 Специализированные информационно-аналитические системы:
- •Категории продуктов.
- •Тема 8. Программные инструментальные средства информационно – аналитических систем
- •1. Назначение и сферы применения продуктов компании Intersoft Lab.
- •Система доставки отчетов удаленным пользователям.
- •Система подготовки отчетности в локальной сети.
- •Персональная система отчетности.
- •2. Состав и назначение систем Аналитической Платформы Контур.
- •3. Понятие микрокуба.
- •4. Назначение и принципы работы системы «Контур Стандарт».
- •5. Работа с системой «Контур Стандарт».
- •6. Пример анализа продаж по данным бд “Northwind” с помощью «Контур Стандарт».
2. Стадии иад.
В общем случае процесс интеллектуального анализа данных (ИАД) состоит из трёх стадий (рис. 2):
1) выявление закономерностей (свободный поиск);
2) использование выявленных закономерностей для предсказания неизвестных значений (прогностическое моделирование);
3) анализ исключений, предназначенный для выявления и толкования аномалий в найденных закономерностях.
Рисунок 2. Стадии процесса интеллектуального анализа данных
1. Свободный поиск (Discovery).
Свободный поиск определяется как процесс исследования исходной БД на предмет поиска скрытых закономерностей без предварительного определения гипотез относительно вида этих закономерностей. Другими словами, сама программа берет на себя инициативу в деле поиска интересных аномалий, или шаблонов, в данных, освобождая аналитика от необходимости обдумывания и задания соответствующих запросов. Этот подход особенно ценен при исследовании больших баз данных, имеющих значительное количество скрытых закономерностей, большинство из которых было бы упущено при непосредственном поиске путем прямых запросов пользователя к исходным данным.
В качестве примера свободного поиска по инициативе системы рассмотрим исследование реестра физических лиц. Если инициатива принадлежит пользователю, он может построить запрос типа "Каков средний возраст директоров предприятий отрасли промышленности строительных материалов, расположенных в Иванове и находящихся в собственности субъекта Федерации?" и получить ответ - 48. В системе, обеспечивающей стадию свободного поиска, пользователь может поступить иначе и запросить у системы найти что-нибудь интересное относительно того, что влияет на атрибут Возраст. Система начнет действовать так же, как и аналитик-человек, т. е. искать аномалии в распределении значений атрибутов, в результате чего будет произведен список логических правил типа "ЕСЛИ ..., ТО ...", в том числе, например:
ЕСЛИ Профессия="Программист", ТО Возраст<=30 в 61% случаев;
ЕСЛИ Профессия="Программист", ТО Возраст<=60 в 98% случаев.
Аналогично, при исследовании реестра юридических лиц аналитика может заинтересовать атрибут Форма_собственности. В результате свободного поиска могут быть получены правила:
ЕСЛИ Основной_вид_деятельности="Общеобразовательные детские школы", ТО Форма_собственности="Муниципальная собственность" в 84% случаев;
ЕСЛИ Вид_деятельности="Наука и научное обслуживание", ТО Форма_собственности="Частная собственность" в 73% случаев.
Стадия свободного поиска может выполняться посредством:
индукции правил условной логики (как в приведенных примерах) - с их помощью, в частности, могут быть компактно описаны группы похожих обучающих примеров в задачах классификации и кластеризации;
индукции правил ассоциативной логики - то есть того, что было определено в рамках классификации задач ИАД по типам извлекаемой информации как выявление ассоциаций и последовательностей;
определения трендов и колебаний в динамических процессах, то есть исходного этапа задачи прогнозирования.
Стадия свободного поиска, как правило, должна включать в себя не только генерацию закономерностей, но и проверку их достоверности на множестве данных, не принимавшихся в расчет при их формулировании.