
- •20. Средства анализа текстовой информации.
- •21. Распределенный анализ данных. Основные понятия.
- •22. Распределенный анализ данных. Стандарты многоагентных систем.
- •23. Распределенный анализ данных. Системы мобильных агентов.
- •25. Проблемы распределенного анализа данных.
- •26. Система анализа распределенных данных. Общий подход к реализации системы.
- •27. Система анализа распределенных данных. Агент для сбора информации о базе данных.
- •28. Система анализа распределенных данных. Агент для сбора статистической информации о данных.
- •29. Система анализа распределенных данных. Агент для решения одной задачи интеллектуального анализа данных.
- •30. Система анализа распределенных данных. Агент для решения интегрированной задачи интеллектуального анализа данных.
28. Система анализа распределенных данных. Агент для сбора статистической информации о данных.
Простейшим видом анализа является сбор статистической информации о данных, хранящихся в базе данных. Для такого анализа может быть использован агент для сбора статистической информации.
Для создания и настройки такого вида агента необходимо выполнить следующую последовательность действий:
1. Выбрать в главном меню окна приложения пункт New Agent.
2. Выбрать тип агента Statistic в дереве типов.
3. В диалоговом окне настройки выбрать контейнеры, по которым проходит агент. В этом окне можно пойти по пути, который описывался в предыдущем разделе, или использовать информацию, которую собрал DataBase Agent.
Открывшееся окно позволяет загрузить настройки с учетом собранной информации. В левой части окна располагается список загруженных агентов. Если необходимо загрузить информацию с агента, который сохранен в файл, то для этого предусмотрена кнопка LoadAgent (Загрузить агента), иначе можно загрузить агента через центр управления агентами.
После выбора желаемого агента в левой части диалога надо нажать кнопку Show (Показать). Выбранные поля в дереве (поле выбирается установкой флажка около него) будут автоматически добавлены для анализа на заданом контейнере при нажатии кнопки Apply (Применить).
5. При приходе на новый контейнер агент будет использовать предопределенные настройки.
В данном диалоге можно указать:
• имя базы данных, поля которой агент будет анализировать;
• драйвер для доступа к базе данных;
• имя таблицы;
• исключаемые из обработки поля таблицы.
29. Система анализа распределенных данных. Агент для решения одной задачи интеллектуального анализа данных.
Для более интеллектуального анализа данных в системе реализованы специальные агенты, решающие разные виды задач. Для их решения они могут использовать соответствующие алгоритмы интеллектуального анализа данных из библиотеки Xelopes.
Для создания и настройки такого вида агента необходимо выполнить следующую последовательность действий (на примере Clustering Agent):
1. Выбрать в главном меню окна приложения пункт New Agent .
2. Выбрать тип агента Clustering Mining Agent в дереве типов.
3. В окне настроек выбрать контейнеры, по которым проходит агент.
4. При приходе на новый контейнер агент будет использовать следующие настройки. В появившемся диалоге можно указать:
• имя базы данных, поля которой агент будет анализировать;
• драйвер для доступа к базе данных;
• имя таблицы;
• исключаемые из обработки поля таблицы;
• каталог для файла с результатами работы агента в формате PMML;
• результирующую таблицу.
5. После нажатия кнопки Next появляется окно настройки непосредственно
самого алгоритма.
На вкладке Settings (Настройки) устанавливаются следующие параметры модели алгоритма:
° максимальное число кластеров;
° параметры вычисления расстояния между векторами: D тип вычисления расстояния;
° функция сравнения;
° нормирование расстояний.
6. На вкладке Algorithm необходимо указать название алгоритма. Далее нужно установить параметры для выбранного алгоритма:
число кластеров;
максимальное число итераций алгоритма;