Скачиваний:
232
Добавлен:
02.05.2014
Размер:
478.21 Кб
Скачать

Средства интеллектуального анализа данных oracle. Darwin data mining suite

Инструментальная среда Darwin предназначена для анализа данных ме­тодами, относящимися к технологии «data mining» (извлечение знаний). Основная задача технологии извлечения знаний состоит в выявлении в больших наборах данных скрытых закономерностей, зависимостей и взаимосвя­зей, полезных при принятии решений на различных уровнях управления Такие закономерности представляются в виде моделей различного типа, позволяющих проводить классификацию ситуаций или объектов, прогнозиро­вать их поведение, выявлять группы сходных объектов и т.п. Модели стро­ятся автоматически на основе анализа имеющихся данных об объектах, на­блюдениях и ситуациях с помощью специальных алгоритмов.

Darwin поддерживает все этапы технологии извлечения знаний, включая постановку задачи, подготовку данных, автоматическое построение моделей, анализ и тестирование результатов, использование моделей в реальных приложениях. На этапе подготовки данных обеспечивается доступ к любым ре­ляционным базам данных, текстовым файлам, SAS-файлам. Дополнительные средства преобразования и очистки данных позволяют изменять вид пред­ставления, проводить нормализацию значений, выявлять неопределенные или отсутствующие значения.

На основе подготовленных данных специальные процедуры автоматически строят различные модели для дальнейшего прогнозирования, классифи­кации новых ситуаций, выявления аналогий. Darwin поддерживает построе­ние пяти различных типов моделей — нейронные сети, классификационные и регрессионные деревья решений, ближайшие k-окрестности, байесовское обучение и кластеризация.

Важная особенность системы Darwin, выделяющая ее среди других средств извлечения знаний, ее технические характеристики: работа в архи­тектуре «клиент-сервер»; широкое использование техники параллельных вычислений; высокая степень масштабируемости при увеличении вычислительных ресурсов. Все это позволяет выполнять процедуры автоматического анализа данных огромных объемов, достигая очень высоких временных по­казателей.

Darwin успешно применяется в индустрии телекоммуникаций, в торгов­ле, банковской сфере при работе с частными лицами, страховании и здраво­охранении. Именно в этих отраслях, для которых характерна очень большая клиентская база, использование методик «извлечения знаний» дает макси­мальный экономический эффект.

Sql server как система поддержки принятия решений

Корпорация Microsoft предлагает мощный инструмент для поддержки систем принятия решений — Microsoft Decision Support Services, являющийся полноценной реализацией системы OLAP. Microsoft DSS поставляется как отдельный компонент в составе SQL Server 7.0 и реализован в виде отдель­ной службы операционной системы, оптимизирующей исполнение запросов, не изменяющих данные. OLAP играет ключевую роль при построении хра­нилищ данных. Использование Microsoft Decision Support Services при соз­дании баз данных позволяет реализовать базовые функции для широкого пектра приложений. Возможности DSS могут быть использованы не только ля построения больших распределенный баз данных и оперативного анали­за их содержимого, но и для подготовки месячных отчетов. Для повышения эффективности применения MS SQL Server в системах принятия решений используют хранилища данных.

Серьезным фактором, сдерживающим повсеместное использование хранилищ данных, является высокая стоимость построения и обслуживания та­ких систем. Корпорация Microsoft совместно с другими компаниями, специализирующимися в области создания и поддержки хранилищ данных, раз­работала платформу Microsoft Data Warehouse Framework, позволяющую снизить стоимость владения хранилищами данных и повысить эффективность их администрирования и эксплуатации.

English Query — инструментарий для создания приложений, использующих естественный английский язык для построения запросов при обраще­нии к базам данных. Специальные механизмы выполняют преобразование за­проса, построенного с помощью обычного разговорного языка, в структуриро­ванный запрос Transact-SQL. Это позволяет пользователям, не имеющим опы­та работы с SQL-запросами, успешно работать с базами данных.

Используя инструмент English Query Domain Editor, администратор выполняет настройку отображений слов, используемых в запросе, а имена таблиц, полей и других структур. Например, если список работников предприятия содержится в таблице Workman, имеющей несколько полей (WI, W2, W3, W4), то для успешного выполнения запроса типа «Кто из работников работает на предприятии более трех лет?» необходимо указать, какие из полей содержат фамилию и имя работника, а какое поле — стаж его работы. Когда все необходимые данные заполнены, пользователи могут на­чать обращаться с запросами к базе данных. Независимые разработчики мо­гут использовать предоставляемые English Query возможности при написа­нии программ или при создании Web-страниц, обращающихся к базам дан­ных SQL Server 7.0.

Соседние файлы в папке Романов В.П. Интеллектуальные информационные системы в экономике