- •Isbn 5-94692-194-0
- •Глава 11. Генетические адаптивные алгоритмы……………………392
- •Глава 12. Агентные системы ………………………409
- •Глава 13. Нейронные сети ………………………426
- •Предисловие
- •Глава 1. Основные классы экономических интеллектуальных информационных систем (иис)
- •1.1. Эволюция информационных систем
- •Информационные системы менеджмента (исм)
- •Системы поддержки принятия решений
- •Хранилище данных (хд)
- •Витрины данных (рынки данных)
- •Оперативная аналитическая обработка данных (olap)
- •Структура репозитария хранилища данных
- •Построение ис на основе субд oracle 8i
- •Средства интеллектуального анализа данных oracle. Darwin data mining suite
- •Sql server как система поддержки принятия решений
- •1.2. Интеллектуальные информационные системы (иис)
Средства интеллектуального анализа данных oracle. Darwin data mining suite
Инструментальная среда Darwin предназначена для анализа данных методами, относящимися к технологии «data mining» (извлечение знаний). Основная задача технологии извлечения знаний состоит в выявлении в больших наборах данных скрытых закономерностей, зависимостей и взаимосвязей, полезных при принятии решений на различных уровнях управления Такие закономерности представляются в виде моделей различного типа, позволяющих проводить классификацию ситуаций или объектов, прогнозировать их поведение, выявлять группы сходных объектов и т.п. Модели строятся автоматически на основе анализа имеющихся данных об объектах, наблюдениях и ситуациях с помощью специальных алгоритмов.
Darwin поддерживает все этапы технологии извлечения знаний, включая постановку задачи, подготовку данных, автоматическое построение моделей, анализ и тестирование результатов, использование моделей в реальных приложениях. На этапе подготовки данных обеспечивается доступ к любым реляционным базам данных, текстовым файлам, SAS-файлам. Дополнительные средства преобразования и очистки данных позволяют изменять вид представления, проводить нормализацию значений, выявлять неопределенные или отсутствующие значения.
На основе подготовленных данных специальные процедуры автоматически строят различные модели для дальнейшего прогнозирования, классификации новых ситуаций, выявления аналогий. Darwin поддерживает построение пяти различных типов моделей — нейронные сети, классификационные и регрессионные деревья решений, ближайшие k-окрестности, байесовское обучение и кластеризация.
Важная особенность системы Darwin, выделяющая ее среди других средств извлечения знаний, ее технические характеристики: работа в архитектуре «клиент-сервер»; широкое использование техники параллельных вычислений; высокая степень масштабируемости при увеличении вычислительных ресурсов. Все это позволяет выполнять процедуры автоматического анализа данных огромных объемов, достигая очень высоких временных показателей.
Darwin успешно применяется в индустрии телекоммуникаций, в торговле, банковской сфере при работе с частными лицами, страховании и здравоохранении. Именно в этих отраслях, для которых характерна очень большая клиентская база, использование методик «извлечения знаний» дает максимальный экономический эффект.
Sql server как система поддержки принятия решений
Корпорация Microsoft предлагает мощный инструмент для поддержки систем принятия решений — Microsoft Decision Support Services, являющийся полноценной реализацией системы OLAP. Microsoft DSS поставляется как отдельный компонент в составе SQL Server 7.0 и реализован в виде отдельной службы операционной системы, оптимизирующей исполнение запросов, не изменяющих данные. OLAP играет ключевую роль при построении хранилищ данных. Использование Microsoft Decision Support Services при создании баз данных позволяет реализовать базовые функции для широкого пектра приложений. Возможности DSS могут быть использованы не только ля построения больших распределенный баз данных и оперативного анализа их содержимого, но и для подготовки месячных отчетов. Для повышения эффективности применения MS SQL Server в системах принятия решений используют хранилища данных.
Серьезным фактором, сдерживающим повсеместное использование хранилищ данных, является высокая стоимость построения и обслуживания таких систем. Корпорация Microsoft совместно с другими компаниями, специализирующимися в области создания и поддержки хранилищ данных, разработала платформу Microsoft Data Warehouse Framework, позволяющую снизить стоимость владения хранилищами данных и повысить эффективность их администрирования и эксплуатации.
English Query — инструментарий для создания приложений, использующих естественный английский язык для построения запросов при обращении к базам данных. Специальные механизмы выполняют преобразование запроса, построенного с помощью обычного разговорного языка, в структурированный запрос Transact-SQL. Это позволяет пользователям, не имеющим опыта работы с SQL-запросами, успешно работать с базами данных.
Используя инструмент English Query Domain Editor, администратор выполняет настройку отображений слов, используемых в запросе, а имена таблиц, полей и других структур. Например, если список работников предприятия содержится в таблице Workman, имеющей несколько полей (WI, W2, W3, W4), то для успешного выполнения запроса типа «Кто из работников работает на предприятии более трех лет?» необходимо указать, какие из полей содержат фамилию и имя работника, а какое поле — стаж его работы. Когда все необходимые данные заполнены, пользователи могут начать обращаться с запросами к базе данных. Независимые разработчики могут использовать предоставляемые English Query возможности при написании программ или при создании Web-страниц, обращающихся к базам данных SQL Server 7.0.