Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
АИСБУ и КИТ / КИТ / KISshp_2.docx
Скачиваний:
21
Добавлен:
08.07.2023
Размер:
1.32 Mб
Скачать

12 Определяющих принципов olap сформулировал е. Ф. Кодд:

1. Концептуальное многомерное представление;

2. Прозрачность;

3. Доступность;

4. Постоянная производительность при разработке отчетов.

5. Клиент-серверная архитектура.

6. Общая многомерность.

7. Динамическое управление разреженными матрицами.

8. Многопользовательская поддержка.

9. Неограниченные перекрестные операции.

10. Интуитивная манипуляция данными.

11. Гибкие возможности получения отчетов.

12. Неограниченная размерность и число уровней агрегации.

В основе OLAP лежит понятие гиперкуба, или многомерного куба данных, в ячейках которого хранятся анализируемые данные.

Преимущества OLAP: предметная ориентированность, многопользовательский режим работы, прямой доступ к данным, удобные средства доступа, удобная навигация по данным, визуализация информации, онлайн функционирование, неизменность данных, хорошая оперативность, высокая точность отчетов.

Недостатки OLAP - системы: слабая предрасположенность к произвольному дизайну форм, т.к. OLAP-отчеты – это, как правило, сводные таблицы; выгрузка данных из баз в хранилище, схемы наполнения его данными - все это требует высокого уровня знаний специалиста.

32.Интеллектуальный анализ данных (Data Mining) и знаний (Knowledge Мining). Упр-ние и анализ больших объемов данных (Big data). Системы бизнес-аналитики (Business Intelligence, bi).

Под «анализом данных» понимают действия, направленные на извлечение из них инф-ии об исследуемом объекте и на получение новых данных по имеющимся.

Интеллектуальный анализ данных (ИАД) – общий термин для обозначения анализа данных с активным использованием математич методов и алгоритмов (методы оптимизации, генетич алгоритмы, распознавание образов, статистические методы, Data Mining и т.д.), использующих визуальное представление данных.

Data Mining (DM) – это технология обнаружения в «сырых» данных ранее неизвестных, практически полезных и доступных интерпретаций знаний, необходимых для принятия решений в различных сферах человеческой деятельности.

Задачи, решаемые методами DM:

1. Классификация – отнесение объектов к одному из заранее известных классов;

2. Прогнозирование;

3. Кластеризация – группировка объектов на основе данных, описывающих сущность этих объектов. Объекты внутри кластера должны обладать общими чертами и отличаться от объектов, вошедших в другие кластеры. Чем больше похожи объекты внутри кластера и чем больше отличий между кластерами, тем точнее кластеризация.

4. Ассоциация – выявление закономерностей между связанными событиями.

5. Последовательные шаблоны – установление закономерностей между связанными во времени событиями.

6. Анализ отклонений – выявление наиболее нехарактерных шаблонов.

Накопление огромных объемов информации в БД, которые стало невыгодно хранить и трудно использовать традиционными способами, привело к появлению технологий управления данными и знаниями (Knowledge Mining – KDD).

Knowledge Discovery in Databases (KDD) определяет последовательность действий, необходимую для получения знаний, а не набор методов обработки или алгоритмов анализа, и включает следующие этапы:

- Подготовка исходного набора данных (создание набора данн из различн источников, для чего должен обеспечив-ся доступ к источникам данных, в т.ч к хранилищам данн);

- Предобработка данных (удаление пропусков, искажений, аномальных значений и т.д., дополнение данных некоторой информацией. Данные должны быть качественны и корректны с точки зрения используемого метода DM);

- Трансформация, нормализация данных (приведение инф-ии к пригодному для последующего анализа виду);

- Data Mining (применение различных алгоритмов нахождения знаний);

- Постобработка данных (интерпретация результатов и применение полученных знаний в бизнес-приложениях).

Большие объемы накопленных данных постоянно приходиться модифицировать из-за быстрой смены аппаратного и программн обеспечения, при этом неизбежны потери и искажения информации.

Одним из ср-в преодоления этих трудностей явл-ся создание информационных хранилищ данных.

Наличие хранилищ данных явл-ся необходимым условием для проведения процесса интеллектуального анализа знаний.

Наряду с такими технологиями, как Data Mining и Knowledge Mining, используется технология Big Data. Эта технология позволяет обрабатывать большие объемы данных и на основании этого принимать управленческие решения.

Системы бизнес-интеллекта (Business Intelligence, BI) – класс информационных систем, которые позволяют преобразовывать разрозненные и необработанные данные операционной деятельности предприятия в структурированную информацию и знания, используемые для принятия управленческих решений.

По оценкам агентства IDC, рынок Business Intelligence состоит из пяти секторов:

1.OLAP-продукты;

2.Инструменты добычи данных;

3.Средства построения Хранилищ и Витрин данных (Data Warehousing);

4.Управленческие информационные системы и приложения;

5.Инструменты конечного пользователя для выполнения запросов и построения отчетов.

Как правило, функции BI включают поддержку принятия решений, запросы и отчетность, аналитическую обработку online, статистический анализ, прогнозирование и количественный анализ.

Соседние файлы в папке КИТ