Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Общий конспект по Технологии анализа и обработ...docx
Скачиваний:
1
Добавлен:
01.03.2025
Размер:
2.66 Mб
Скачать
  1. Программное обеспечение интеллектуального анализа: Oracle Data Mining

  1. Понятие «Data mining», Data mining и базы данных.

Data Mining (добыча данных, интеллектуальный анализ данных, глубинный анализ данных) — собирательное название, используемое для обозначения совокупности методов обнаружения в данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности.

Основу методов Data Mining составляют всевозможные методы классификации, моделирования и прогнозирования.

Методы Data mining имеет смысл применять только для достаточно больших баз данных. В каждой конкретной области исследований существует свой критерий «великости» базы данных.

  1. Oracle Data Mining .

Oracle Data Mining (ODM) — это опция СУБД Oracle Enterprise Edition.

Корпорация Oracle предлагает своим пользователям набор продуктов класса и сервисов класса Data Mining. Этот набор помогает компаниям понять и предвидеть поведение клиентов (покупателей, заказчиков) и создавать полные интегрированные решения по управлению отношениями с клиентами (CRM).

Mining работает непосредственно в самой базе данных, исключая проблемы, связанные с перемещением, дублированием и защитой данных, а также масштабируемостью инструментария. Более того ODM изначально был разработан так, чтобы хорошо стыковаться с SQL. Другие data mining продукты требуют использование сложных,  медленных операций при поиске закономерностей в схемах типа “звезде”. Обычно использованием инструментов data mining требует перевода данных из транзакционной формы в плоскую, денормализованную. ODM разработан так, чтобы свободно выполнять поиск закономерностей в схемах типа “звезда” напрямую. Такой подход делает работу проще, дает в руки мощные инструменты и повышает производительность.

  1. Архитектура odm

Согласно новой архитектуре Oracle Data Mining функции data mining переносятся в базу данных. В комплекте Oracle Data Mining Suite Release 3.7 данные выбираются из базы данных, где происходит все манипулирование с данными, раскапывание и зачет (mining, and scoring). Пользователи взаимодействуют с этим ПО через графический интерфейс Windows.

Новые продукты data mining от корпорации Oracle будут использовать более тесную интеграцию с базой данных для минимального перемещения данных и максимального доступа пользователей. Используя более тесную интеграцию с базой данных, новая архитектура data mining облегчит агрегирование данных из различных источников. Данные, как традиционного офлайнового бизнеса, так и е-бизнеса могут быть более легко консолидированы, управляемы, "раскопаны" для большего понимания и получения полного представления об этом новом клиенте.

  1. Функциональные возможности odm.

ODM поддерживает все этапы технологии извлечения знаний, включая постановку задачи, подготовку данных, автоматическое построение моделей, анализ и тестирование результатов, использование моделей в реальных приложениях.

Существенно, что модели строятся автоматически на основе анализа имеющихся данных об объектах, наблюдениях и ситуациях с помощью специальных алгоритмов. Основу опции ODM составляют процедуры, реализующие различные алгоритмы построения моделей классификации, регрессии, кластеризации.

На этапе подготовки данных обеспечивается доступ к любым реляционным базам, текстовым файлам, файлам формата SAS. Дополнительные средства преобразования и очистки данных позволяют изменять вид представления, проводить нормализацию значений, выявлять неопределенные или отсутствующие значения. На основе подготовленных данных специальные процедуры автоматически строят модели для дальнейшего прогнозирования, классификации новых ситуаций, выявления аналогий.

Oracle Data Mining строит прогнозирующие и дескрипторные модели.

Прогнозирующие модели:

  • классификация;

  • регрессия;

  • поиск существенных атрибутов.

Дескрипторные модели:

  • кластеризация;

  • поиск ассоциаций;

  • выделение признаков.