- •Календарный план
- •Оглавление
- •2.1 Техническое задание 22
- •2.5 Информационная модель 51
- •4. Безопасность жизнедеятельности 67
- •Введение
- •Общая часть
- •1.1 Описание предметной области
- •1.2 Постановки задачи
- •Обзор систем автоматизированного формирования баз знаний
- •Аналитический курьер
- •1.3.2 Система PolyAnalyst
- •2. Специальная часть
- •2.1 Техническое задание
- •2.2 Программные средства и технологии разработки дипломного проекта
- •2.2.5 Субд Cache’
- •2.3 Функциональная модель задачи
- •2.4 Объектная модель задачи
- •2.5 Информационная модель
- •2.6 Описание программной системы
- •3. Организационно - экономическая часть
- •Обоснование решения
- •4. Безопасность жизнедеятельности
- •4.1 Краткая характеристика помещения и оборудования
- •4.1.1 Характеристика помещения
- •4.1.2 Характеристика оборудования
- •4.2 Общая характеристика опасных и вредных производ-ственных факторов
- •4.3 Нормирование санитарно-гигиенических условий труда
- •4.3.1 Микроклимат рабочих помещений
- •4.3.2 Определение комфортности среды
- •4.4 Освещение производственных (рабочих) помещений
- •4.5 Электромагнитные излучения
- •4.6 Оценка напряженности трудового процесса программиста
- •4.7 Электробезопасность
- •4.8 Пожарная безопасность
- •Заключение
- •Список литературы
1.3.2 Система PolyAnalyst
PolyAnalyst – программный продукт, реализующий методы анализа числовых данных и алгоритмы Text Mining - анализа текстовой информации.
PolyAnalyst получил широкое распространение в мире. Более 500 инсталляций в 20 странах мира, среди пользователей системы внушительный список составляют крупнейшие мировые корпорации: Boeing, 3M, Chase Manhattan Bank, Dupont, Siemens и другие. PolyAnalyst - универсальная система Data Mining, она с успехом применяется в различных областях: в решении бизнес-задач (direct marketing, cross-selling, customer retention), в социологических исследованиях, в прикладных научных и инженерных задачах, в банковском деле, в страховании и медицине.
Архитектура системы
PolyAnalyst является клиент/серверным приложением. Пользователь работает с клиентской программой PolyAnalyst Workplace. Математические модули выделены в серверную часть - PolyAnalyst Knowledge Server. Такая архитектура предоставляет естественную возможность для масштабирования системы: от однопользовательского варианта до корпоративного решения с несколькими серверами. PolyAnalyst написан на языке С++ с использованием спецификации Microsoft's COM (ActiveX). Эта спецификация устанавливает стандарт коммуникации между программными компонентами. Математические модули (Exploration Engines) и многие другие компоненты PolyAnalyst выделены в отдельные динамические библиотеки и доступны из других приложений. Это дает возможность интегрировать математику PolyAnalyst в существующие ИС, например, в CRM или ERP системы.
Рис. 1.4 – Архитектура системы
PolyAnalyst Workplace - лаборатория аналитика
Workplace - это клиентская часть программы, ее пользовательский интерфейс. Workplace представляет собой полнофункциональную среду для анализа данных. Развитые возможности манипулирования с данными, богатая графика для представления данных и визуализации результатов, мастера создания объектов, сквозная логическая связь между объектами, язык символьных правил, интуитивное управление через drop-down и pop-up меню, подробная контекстная справка - вот только несколько основных черт пользовательского интерфейса программы.
Аналитический инструментарий PolyAnalyst
Версия PolyAnalyst 4.6 включает 18 математических модулей, основанных на различных алгоритмах Data и Text Mining. Большинство из этих алгоритмов являются Know-How компании Мегапьютер и не имеют аналогов в других системах. Алгоритмы анализа данных можно объединить в группы по их функциональному назначению: моделирование, прогнозирование, кластеризация, классификация, текстовый анализ, в частности:
Модуль Find Laws (FL) - построитель моделей
Memory based reasoning (MR) - метод "ближайших соседей"
Алгоритмы кластеризации
Алгоритмы ассоциации
Модули текстового анализа.
Text Analysis (ТА) - текстовый анализ
Text Categorizer (TC) - каталогизатор текстов
Link Terms (LT) - связь понятий
Этот модуль позволяет выявлять связи между понятиями, встречающимися в текстовых полях изучаемой базы данных, и представлять их в виде графа. Этот граф также может быть использован для выделения записей, реализующих выбранную связь.
Symbolic Rule Language (SRL) - язык символьных правил
SRL - это универсальный алгоритмический язык PolyAnalyst, который используется для символьного представления автоматически найденных системой в процессе Data Mining правил, а также для создания пользователем своих собственных правил. На языке SRL можно выразить широкий спектр математических конструкций, используя алгебраические операции, большой набор встроенных функций, операции с датами и временем, логические и условные конструкции. Для удобства написания выражений на SRL в программе предусмотрен маcтер создания правил.
Доступ к данным
PolyAnalyst может получать исходные данные из различных источников. Это: текстовые файлы с разделителем запятая (.csv), файлы Microsoft Excel 97/2000, любая ODBC- совместимая СУБД, SAS data files, Oracle Express, IBM Visual Warehouse.