
- •Теоретические материалы
- •Глава 1. Информационные процессы и системы в экономике
- •§ 1. Информационные процессы в экономике
- •Структура деловой информации
- •§ 2. Понятие и свойства экономической информации
- •§ 3. Определение и классификация экономических
- •§ 4. Роль и место автоматизированных информационных
- •Глава 2. Технологии и методы обработки экономической информации
- •§ 1. Информационные технологии и их классификация
- •§ 2. Технологии обработки информации в эис
- •Нейрокомпьютерные технологии и технологии поддержки принятия решений
- •§ 3. Технологии баз данных
- •§ 4. Интегрированные информационные технологии
- •§ 5. Технологии систем поддержки
- •Глава 3. Проектирование автоматизированных информационных систем
- •§ 1. Структура автоматизированных информационных систем
- •§ 2. Организационные и методические принципы создания ис
- •§ 3. Жизненный цикл эис
- •§ 4. Адаптируемые интегрированные системы для построения кис предприятий
- •§ 5. Роль и место специалиста экономического профиля
- •Глава 4. Телекоммуникационные технологии в эис
- •§ 1. Компоненты и типы телекоммуникаций
- •§ 2. Приложения телекоммуникаций в деловой сфере
- •§ 3. Гипертекстовые технологии
- •Глава 5. Интеллектуальные технологии в экономических информационных системах
- •§ 1. Технологии систем, основанных на знаниях
- •§ 2. Технологии интеллектуального анализа данных
- •§ 3. Документальные ис системы и автоматизированные поисковые системы
- •Глава 6. Автоматизация финансово- хозяйственной деятельности предприятий
- •§ 1. Автоматизированные информационные системы
- •§ 2. Автоматизированные информационные системы
- •§ 3. Автоматизированные информационные системы
§ 2. Технологии интеллектуального анализа данных
Технологии интеллектуального анализа данных (ИАД, другие термины — Data Mining, Knowledge discovery in databases) предназначены для выявления знаний — закономерностей и логических взаимосвязей в больших объемах данных различного формата и происхождения. Методы ИАД стали активно развиваться в 1990-х гг. К этому времени на крупных предприятиях «скопились» большие объемы сведений (фактов, документальных данных), хранимых в разном виде, различных форматах и базах данных. Чтобы эти сведения не лежали «мертвым грузом», а приносили пользу, были предложены концепция внедрения информационных хранилищ данных ИАД.
Методы ИАД имеют основной целью выявление закономерностей на основе анализа данных для последующего обоснования и принятия решений. Выделяют следующие основные типы таких закономерностей:
ассоциация — связь между событиями. Например, исследование в супермаркете может показать, что 65% купивших кукурузные чипсы берут также и коку-колу, а при наличии скидки за такой комплект колу приобретают в 85% случаев. Располагая сведениями о подобной ассоциации, менеджерам легко оценить, насколько действенна предоставляемая скидка;
последовательность — цепочка связанных во времени событий. Например, после покупки дома в 45% случаев в течение месяца приобретается новая кухонная плита, а в пределах двух недель 60% новоселов приобретают холодильник;
классификация — выявление среди параметров, описывающих объекты, тех признаков и их взаимосвязей, которые позволяют отнести новый объект к той или иной группе. Пусть, например, имеются данные о покупателях, которые обслуживались фирмой. Известно, что все множество этих покупателей условно можно разделить на классы: «бедный», «богатый», «богатый, но прижимистый». Оценивая параметры покупателей, система ИАД может вывести закономерности между их значениями и принадлежностью покупателя к одному из классов. Тогда, получая характеристики потенциальных покупателей, можно заранее отнести их к тому или иному классу и предложить определенные рекомендации по работе с ними;
кластеризация — выявление устойчивых групп в множестве объектов, описываемых набором данных. В отличие от классификации сами группы — кластеры здесь неизвестны, их требуется определить. Возможно, что при анализе некоторого множества данных о покупателях сформируются группы и признаки покупателей, предпочитающих определенный вид товара и способ обслуживания;
прогнозирование — выявление на основе исторической информации закономерностей, отражающих динамику поведения объектов и позволяющих прогнозировать их будущее.
Методы ИАД являются дополнением традиционных методов статистической обработки данных (факторного, корреляционного, регрессионного и других видов анализа). Основной их особенностью является выявление логических связей между данными и представление результатов не в виде абстрактных математических формул, а в форме, позволяющей наглядно отобразить, интерпретировать и объяснить полученные знания. Именно эта наглядность найденных знаний объясняет практическую важность методов ИАД в реальных задачах принятия решений. Среди технологий выявления и отображения логических закономерностей в данных выделим следующие:
технологии деревьев решений — построение по анализу описаний объектов дерева, каждая вершина которого есть правило для сравнения некоторого параметра Х с заданным значением А. Эти правила связаны между собой ребрами дерева так, что в зависимости от ответа на вопрос о параметре Х задается вопрос о значении параметра Y или Z. Конечные вершины дерева соответствуют некоторым решениям, например, указывают на принадлежность объекта к тому или иному классу (например, клиент — платежеспособный или нет; ситуация — конфликтная, потенциально конфликтная или неконфликтная). Для лучшего понимания приведем иллюстративный пример. Пусть известен некоторый достаточно большой перечень автомобилей, в котором выделяются три класса: класс 1 — автомобили, требующие косметического ремонта; класс 2 — автомобили, не требующие ремонта; класс 3 — автомобили, требующие капитального ремонта. Каждый из автомобилей описывается набором параметров и их значениями. Система ИАД, анализируя эти параметры, может выбрать те из них, по значениям которых можно оценить принадлежность автомобиля к одному из классов. Тогда, если имеется описание автомобиля, класс которого неизвестен, построенное компьютерной системой дерево решения позволит с большой долей уверенности сделать вывод о необходимости ремонта (принадлежности к тому или иному классу);
• технологии обнаружения и построения правил «Если... То» — на основании анализа имеющихся в базах данных событий вида «параметр Х больше (меньше, равно) константы А» строится система продукционных правил, позволяющих устанавливать ассоциации в данных, решать задачи классификации, прогнозирования и т. п.
Технологии распознавания образов и понимания текстов.
Распознавание образов в ЭИС применяется, в частности, для «узнавания» рукописных и машинописных символов и автоматизации ввода их в ЭВМ. Технологии понимания текстов реализуются в информационно-поисковых системах. В настоящее время в ИПС используется, как правило, весьма ограниченный искусственный язык запросов для поиска документов. Предполагается, что интеллектуальные ИПС смогут понимать семантику и прагматику запросов пользователя, выполненных на естественном языке.
На рис. 5.2 приведена укрупненная схема применения технологий интеллектуальных систем в ЭИС. Отметим, что приведенные здесь сведения являются весьма неполными и отражают только самые общие тенденции использования достижений искусственного интеллекта в данной области. Читателю, обратившемуся к дополнительной литературе, будет полезным обратить внимание на такие направления развития интеллектуальных систем, как искусственные нейронные сети; эволюционное моделирование и генетические алгоритмы; «мягкие» вычисления и нечеткая логика и др., каждое
из которых может быть использовано для обработки данных в ЭИС и поддержки принятия решений в экономических задачах.
Системы, основанные на знаниях
Поддержка принятия решений; обучение; помощь в решении профессиональных задач
Интеллектуальный
анализ данных
Распознавание
образов, текстов
Считывание и распознавание машинописных и рукописных документов; автоматизация обработки документов; совершенствование запросно-ответных систем
Рис. 5.2. Интеллектуальные технологии в ЭИС