Скачиваний:
190
Добавлен:
02.05.2014
Размер:
796.16 Кб
Скачать

Программные средства интеллектуального анализа данных

Одна из технологий ИАД состоит в выявлении ассоциаций между мно­жествами предметов. Например, может быть выявлена также зависимость, что покупка чипсов сопровождается покупкой воды (напитка). Для того что­бы определить наличие ассоциации, программа вычисляет процент записей, в которых совместно встречаются как А, так и В. Затем программа вычисля­ет степень уверенности, которая представляет собою процент всех транзак­ций, в которых встречается В.

Другая технология предусматривает выявление последовательности / темпоральной зависимости.

Этот вид зависимости используется для того, чтобы выявить ассоциации, связанные с временными (темпоральными) отношениями, например:

  • через три месяца после приобретения ноутбука приобретаются батареи;

  • клиенты, которые на 25% снижают уровень использования сотового те­лефона в течение трех предыдущих месяцев, имеют коэффициент правдоподоподобия, равный 60% того, что они откажутся от услуг мобильной связи в последующем;

  • продажа огнетушителей увеличивается на 400 % в течение месяца, по­ следующего за землетрясением.

Разработка и поставка на рынок программных средств интеллектуального анализа данных является на сегодняшний день хорошо отлаженным бизне­сом. Рассмотрим некоторые программные продукты и фирмы, которые их предлагают.

Angoss Software International Limited

Angoss Software International Limited предлагает Knowledge Seeker — средство построения дерева, которое использует автоматическое обнаруже­ние взаимосвязей для таких приложений, как маркетинг на основе баз дан­ных, финансовый анализ. Интерфейс в виде меню выводит поля для отобра­жения атрибутов, которые сильно связаны с изучаемыми атрибутами и по­рождает модель, показывающую предикторы для целевого атрибута. Про­вайдером средств Data Mining являются: Angoss Software International Limited, Data Distilleries B.V.NeoVista Solutions, Inc.Syllogic B.V. http://www.angoss.com

Data Distilleries B.V.

Data Distilleries B.V. — компания, обеспечивающаяся знания и средства для выполнения ИАД в оперативном режиме в общественном секторе эконо­мики. Data Distilleries B.V. образована в 1996 г. как ответвление CWI — веду­щий международного центра математики и информатики. Менеджеры могут улучшить свой процесс бизнеса, используя средства оперативного ИАД, кото­рый открывает скрытые закономерности в больших базах данных. Область применения: анализ рисков, анализ трендов, оценка возможных пределов кре­дитования, логистика и контроль качества продуктов, http://www.ddi.nl

Magnify, Inc.

Magnify поддерживает потребность в ИАД клиентов, для которых необходимы средства с высокими характеристиками. Magnify сосредотачивается на финансовых услугах и связанных с ними операциях маркетинга. Входя­щее в состав продукта программное обеспечение обеспечивает анализ очень больших баз данных. Алгоритм Pattern включают параллельные и распреде­лительные варианты классификации, регрессии, деревья оптимизации. http://www.magnify.com

NeoVista Solutions, Inc.

Программное обеспечение NeoVista Solutions Decisions Series имеет непосредственный интерфейс с базами данных для алгоритмов ИАД. Результа­ты ИАД отображаются при помощи удобного интерфейса, http://neovista.com

Syllogic B.V.

Поддерживает все стадии процесса ИАД, включая отбор данных, очистку данных, обогащения данных, кодирование, открытие и визуализацию. Применяются такие методы, как деревья решений, правила ассоциаций К- ближайших соседей, кластеризацию и визуализацию для решения задач биз­неса в финансах, транспортировке, управлении, http://www.syllogic.nl

Pilot Software DIG

Pilot Software DIG разрабатывают средства ИАД для работы с много­мерными базами данных и технологиями OLAP и гиперкуба. Эти средства работают с такими продуктами ИАД, как CARD и CHAID, а также нейрон­ные сети. В основном пытаются автоматизировать часто повторяющиеся операции аналитических задач. Отделения фирмы в Токио совместно с Tokyo Shoko Research применяют ИАД информационного менеджмента, используют ИАД и многомерные базы данных используются для того, что­бы лучше понимать покупательское поведение клиента. Средства визуали­зации для аналитической обработки результатов деятельности обслужива­ния клиентов.

Такие инструменты Data Mining, как CARD, могут помочь в анализе рынка ценных бумаг, а также в проведении социо-экономических исследова­ний для экономического моделирования и анализа рисков.

АС2

АС2 — это набор библиотеки C/C++, дающих возможность разработ­чику и специалисту по информационным технологиям встраивать сред­ства ИАД в их собственное программное обеспечение (ПО). АС2 также может использоваться как графическая оболочка, работающая под Windows 3.1/95/NT и Unix/Motif. AC2 охватывает все шаги процесса ИАД, от моделирования данных (с полной объектно-ориентированной моделью) до перекрестной проверки и Good-Strapping. Разработчик: Cyril Way, cyril@isoft.fr

ALICE d'l Soft.

Мощное и легко используемое средство ИАД. Использует дерево реше­ний для изучения данных. Текстовые отчеты, генерация SQL- запросов, ана­лиз «что, если». Разработчик: cyril@isoft.fr

AuyoClassC.

Общедоступная версия программы AuyoClass III, с некоторыми улучшениями AuyoClassX, реализованная на языке С. AuyoClass реализует обучаемую байесовую систему классификации без учителя, которая находит мак­симальную апостериорную вероятность классификации.

Входы составляют вектора атрибутов базы данных либо с действительными, либо с дискретными значениями класса модели. Класс модели мо­жет быть выбран по умолчанию. AuyoClass находит множество классов, которые наиболее вероятны по отношению к данным и модели. Выходом является класс описаний и частичная функция принадлежности объектов к классам.

C5.0/See5

Разработчик: quinlan@rulequest.com

CLEMENTINE

Один из главнейших средств ИАД, дважды выигравший премию SMART правительства Великобритании за инновации. Приложения Clementine включают сегментирование/программирование для маркетинговых компа­ний, предложение прибылей.

DATA SURVEYOR

Это инструментарий для пользователей-экспертов. Он состоит из на­бора мощных алгоритмов и обеспечивает поддержку для всех шагов про­цесса открытия знаний. Data Surveyor позволяет пользователю интерак­тивно открывать знания, инспектировать результаты во время открытия и руководить процессом открытия. Область применения Data Surveyor включает маркетинг на основе баз данных и анализа рисков. Разработчик: info@ddi.ne

DATA DETECTIVE

Разработчик: Peter Van der Putten, info@smr.ne

DATA ENGINE

Программный продукт для анализа данных использует понятие техноло­гии ИАД, нейронные сети и обычную статистику. Он успешно применяется в области предсказания, маркетинга на основе баз данных, анализа процес­сов и диагноза. Обладает высокой гибкостью, обладая возможностью им­порта MS-Excel файлов. Разработчик: rw@mitgmbh.de

Data Sage

Представляет набор C++ модулей, которые поддерживают данные внутри существующей реляционной базы данных. Data Sage использует высокоскоростные программы на C++, чтобы считывать и обрабатывать очень большие базы данных. Data Sage включает набор преобразования данных, средства моделирования и анализа средств, включая нейронные сети и факторный анализ. Компания сформирована в 1992 году и включает большое количест­во выпускников MIT.

Разработчик: brendy@cs.brandeis.edu

DATA SCOPE

Преобразует дискретные данные в вид легко обозримых диаграмм. Разработчик: Data X(tm) Scott Ivan, scott@zaptron.com

DB PROPHET

Средство ИАД на основе нейронных сетей. Trajectbe.

Используя сложную технологию нейронных сетей, Trajectbe предлагает широкий набор программных продуктов и услуг, которые обеспечивают предсказание сложного поведения клиентов и тенденции рынка.

Разработчик: stevew@trajectbe.com

Decision house

Разработчик: ANP

Explora

Свободно доступное средство для Mac.

FTP — программное обеспечение, доступное при помощи пр.

Comp.ai-tag/part4.

Graf-Fx-Graphical Data Mining Shareware. Разботчик: fx@bigpoud.com

Guiding Inductive Learning with Analytative Model.

Этот пакет представляет качественную модель для получения индук­тивных предложений и правил «если ..., то», используя CN2 таким обра­зом, что в процессе отбора сохраняются только те правила, которые допус­кают объяснение посредством качественных моделей. Работы по Lazy Evaluation.

Соседние файлы в папке Романов В.П. Интеллектуальные информационные системы в экономике