- •Методические указания к лабораторным работам
- •«Информационный менеджмент»
- •Санкт-Петербург
- •230201, 230200 Информационные системы
- •Содержание
- •Цель работы
- •Программно – техническая платформа
- •Теоретическая часть Информационные системы оперативного анализа данных
- •Информационные технологии поиска закономерностей в данных»
- •Повышение производительности менеджера с использованием личной информационной системы
- •Тестирование сотрудников с использованием программных средств
- •Формирование бюджета ит отдела
- •Перечень заданий к лабораторной работе
- •Порядок выполнения лабораторной работы
- •5.1 Информационные системы оперативного анализа данных
- •5.1.1 Определение исходных источников данных в проекте служб Analysis Services
- •5.1.2 Определение и развертывание olap куба
- •5.1.3 Изменение мер, атрибутов и иерархий
- •5.1.3.1 Изменение мер
- •5.1.3.2 Изменение измерения «Заказчик (Customer) »
- •5.1.3.2.1 Переименование атрибутов
- •5.1.3.2.2 Создание иерархии
- •5.1.3.2.3 Добавление именованного вычисления
- •5.1.3.2.4 Использование именованных вычислений в качестве имен элементов
- •5.1.3.2.5 Определение папок отображения
- •5.1.3.2.6 Определение составных ключевых столбцов
- •5.1.3.2.7 Определение связей атрибутов
- •5.1.3.2.8 Развертывание изменений, обработка объектов и просмотр изменений
- •5.1.3.3 Изменение измерения «Продукт (Product)»
- •5.1.3.3.1 Добавление именованного вычисления
- •5.1.3.3.2 Изменение свойства «NameColumn» атрибута
- •5.1.3.3.3 Создание иерархии
- •5.1.3.3.4 Определение имен папок и имени элемента «Все (All) »
- •5.1.3.3.5 Определение связей атрибутов
- •5.1.3.3.6 Просмотр изменений в измерении «Продукт (Product)»
- •5.1.3.4 Изменение измерения «Date»
- •5.1.3.4.1 Добавление именованного вычисления
- •5.1.3.4.2 Использование именованных вычислений в качестве имен элементов
- •5.1.3.4.3 Создание иерархии
- •5.1.3.4.4 Определение связей атрибутов
- •5.1.3.4.5 Создание уникальных имен для элементов измерения
- •5.1.3.4.6 Определение составного свойства «KeyColumns» и задание столбца имени
- •5.1.3.4.7 Развертывание и просмотр изменений
- •5.1.3.4.8 Изменение порядка сортировки путем изменения порядка элементов составных ключей
- •5.1.3.5 Просмотр развернутого куба
- •5.1.4. Определение ключевых индикаторов производительности
- •5.1.4.1 Определение ключевого индикатора производительности «Доход от продаж через торгового посредника»
- •5.1.4.2 Просмотр куба с использованием ключевого индикатора производительности «Доход от продаж через торгового посредника» (Reseller Revenue)
- •5.1.4.3 Определение ключевого индикатора производительности «Коэффициент общей валовой прибыли продукта» (Product Gross Profit Margin)
- •5.1.4.4 Просмотр куба с использованием ключевого индикатора производительности «Итоговый коэффициент валовой прибыли»
- •5.2 Информационные технологии поиска закономерностей в данных
- •5.2.1. Подготовка базы данных служб Analysis Services
- •5.2.2 Построение структуры прямой почтовой рассылки
- •5.2.3 Добавление и обработка моделей
- •5.2.4 Изучение моделей целевой рассылки
- •5.3 Повышение производительности менеджера с использованием личной информационной системы
- •5.4 Тестирование сотрудников с использованием программных средств
- •5.5 Формирование бюджета ит отдела
- •Содержание отчета по лабораторной работе
- •Список литературы
- •Приложения
- •Образец карточки запроса на поиск сотрудника
- •Образец аттестационной характеристики сотрудника
- •Образец титульного листа отчета по лабораторной работе
- •Информационный менеджмент отчет по лабораторным работам
Информационные технологии поиска закономерностей в данных»
В том случае, когда необходимо проводить многокритериальный анализ, выявить закономерности в данных и решать другие подобные задачи, целесообразно использовать технологии Data-Mining.
Эти технологии включают в себя поиск корреляционных зависимостей, тенденций, взаимосвязей и закономерностей посредством различных математических и статистических алгоритмов: кластеризации, создания подвыборок, регрессионного и корреляционного анализа.
Основное отличие Data-Mining от OLAP технологий заключается в том, что технологии Data-Mining выявляют закономерностей в данных, а технологии OLAP проверяют достоверность предлагаемых гипотез. Качество результатов технологий поиска закономерностей зависит от полноты и достоверности данных. Достоверность полученных результатов проверяется путем использования не одного, а нескольких алгоритмов обработки одних и тех же данных и сравнения близости результатов.
Традиционно выделяют пять стандартных типов закономерностей, выявляемых методами Data Mining:
ассоциация - высокая вероятность связи событий друг с другом (например, один товар часто приобретается вместе с другим),
последовательность - высокая вероятность цепочки связанных во времени событий (например, в течение определенного срока после приобретения одного товара будет с высокой степенью вероятности приобретен другой),
классификация - имеются признаки, характеризующие группу, к которой принадлежит то или иное событие или объект (обычно при этом на основании анализа уже классифицированных событий формулируются некие правила),
кластеризация - закономерность, сходная с классификацией и отличающаяся от нее тем, что сами группы при этом не заданы - они выявляются автоматически в процессе обработки данных,
временные закономерности — наличие шаблонов в динамике поведения тех или иных данных (типичный пример — сезонные колебания спроса на те или иные товары либо услуги), используемых для прогнозирования.
Поиск закономерностей в данных в настоящее время базируется на довольно большом количестве разнообразных методов исследования данных, среди них можно выделить:
регрессионный, дисперсионный и корреляционный анализ,
методы анализа в конкретной предметной области, базирующиеся на эмпирических моделях,
нейросетевые алгоритмы, идея которых основана на аналогии с функционированием нервной ткани и заключается в том, что исходные параметры рассматриваются как сигналы, преобразующиеся в соответствии с имеющимися связями между «нейронами», а в качестве ответа, являющегося результатом анализа, рассматривается отклик всей сети на исходные данные,
деревья решений,
кластерные модели,
алгоритмы ограниченного перебора, вычисляющие частоты комбинаций простых логических событий в подгруппах данных.
В последнее время имеет место тенденция снижения стоимости средств, использующих технологию Data-Mining, что делает данную технологию более массовой и дает возможность среднему и малому бизнесу оценить плюсы использования данной технологии и внедрять ее использование в повседневную практику.
Одним из недостатков Data – Mining, как известно, является жесткая зависимость результата анализа от репрезентативности первоначальной информации.