- •Федеральное агентство по образованию
- •1.2. Базы данных - основа сппр
- •1.3. Неэффективность использования oltp-систем для анализа данных
- •Лекция 2. Архитектура современной информационно- аналитической системы
- •2.1. Концепция хранилища данных
- •2.2. Организация хд
- •2.3. Очистка данных
- •2.4. Концепция хранилища данных и анализ
- •3.1. Многомерная модель данных
- •3.4.2. Rolap
- •Многомерное проектирование
- •Выбор архитектуры olap-приложения
- •Заключение
- •Общая структура мер и измерений
- •Лекция 5. Интеллектуальный анализ данных
- •1. Добыча данных – Data Mining
- •2. Задачи Data Mining
- •2.1. Классификация задач Data Mining
- •2.2. Задача классификации и регрессии
- •2.3. Задача поиска ассоциативных правил
- •2.4. Задача кластеризации
- •1.1. Предсказательные (predictive) модели
- •1.2. Описательные (descriptive) модели
- •2. Методы Data Mining
- •2.1. Базовые методы
- •2.2. Нечеткая логика
- •2.3. Генетические алгоритмы
- •2.4. Нейронные сети
- •3. Процесс обнаружения знаний
- •3.1. Основные этапы анализа
- •3.2. Подготовка исходных данных
2.3. Генетические алгоритмы
Генетические алгоритмы (ГА)относятся кчислууниверсальныхметодов
оптимизации, позволяющих решать задачи различных типов (комбинаторные, общие
задачи с ограничениями и без ограничений) и различной степени сложности. При этом ГАхарактеризуются возможностью как однокритериального, так и многокритериальногопоиска в большом пространстве, ландшафт которого является негладким.
В последние годы резко возросло число работ, прежде всего зарубежных ученых,
посвященных развитию теории ГА и вопросам их практического использования.Результаты данных исследований показывают, в частности, что ГА могут получить болееширокое распространение при интеграции с другими методами и технологиями. Появились работы, в которых доказываетсяэффективность интеграции ГА и методовтеории нечеткости, а также нейронных вычислений и систем.
Эффективность такой интеграции нашла практическое подтверждение в разработке
соответствующих инструментальных средств (ИС). Так, фирма Attar Software включила ГА-компонент,ориентированныйна решениезадач оптимизации, всвои ИС,предназначенные для разработки экспертной системы. Фирма California Scientific Softwareсвязала ИС для нейронных сетей с ГА-компонентами, обеспечивающими автоматическуюгенерацию и настройку нейронной сети. Фирма NIBS Inc. включила в свои ИС длянейронных сетей, ориентированные на прогнозирование рынка ценных бумаг, ГА-компоненты, которые, по мнению финансовых экспертов, позволяют уточнять про-гнозирование.
Несмотря на известные общие подходы к такой интеграции ГА и нечеткой логики,по-прежнемуактуальназадачаопределениянаиболеезначимыхпараметровоперационного базиса ГА с целью их адаптации в процессе работы ГА за счетиспользования нечеткого продукционного алгоритма (НПА).
Перечисленные ниже причины коммерческого успеха инструментальных средств вобласти искусственного интеллекта могут рассматриваться как общие требования к разработке систем анализа данных,используемых ГА:
интегрированность – разработка ИС, легко интегрирующихся с другими
информационными технологиями и средствами;
открытость и переносимость – разработка ИС в соответствии со стандартами,
обеспечивающими возможность исполнения в разнородном программно-аппаратномокружении и переносимость на другие платформы без перепрограммирования;
использование языков традиционного программирования. Переход к ИС, реализованным на языках традиционного программирования(С, C++ и т. д.), упрощает
обеспечение интегрированности, снижает требования приложений к быстродействию
ЭВМ и объемам оперативной памяти;
архитектура «клиент-сервер» – разработка ИС, поддерживающих распределенные вычисления в архитектуре «клиент-сервер», что позволяет снизить стоимость
оборудования, используемого в приложениях, децентрализовать приложения и повыситьих производительность.
Перечисленные требования обусловлены необходимостью создания интегри-
рованных приложений, т. е. приложений, объединяющих в рамках единогокомплексатрадиционные программные системы с системами искусственного интеллекта и ГА вчастности.
Интеграция ГА и нейронных сетей позволяет решать проблемы поиска опти-
мальных значений весов входов нейронов, а интеграция ГА и нечеткой логики позволяетоптимизировать систему продукционных правил, которые могут быть использованы дляуправления операторами ГА (двунаправленная интеграция).
Одним из наиболее востребованных приложений ГА в области Data Mining
является поиск наиболее оптимальной модели (поиск алгоритма, соответствующегоспецифике конкретной области).
