Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Duc Thien.doc
Скачиваний:
15
Добавлен:
17.09.2019
Размер:
1.69 Mб
Скачать

1.2 Постановки задачи

Целью дипломного проекта является проектирование и реализация программной системы для автоматизированного формирования баз знаний в формате CLIPS, на основе анализа баз данных СУБД Cache.

Программная система должна реализовывать следующие функции:

- получение и отображение информации о структуре базы данных;

- выбор определенных таблиц (классов) в качестве источников для формирования знаний;

- формирование образцов (шаблонов) фактов CLIPS на основе описания таблиц (классов) Cache;

- формирование правил CLIPS на основе описания таблиц (классов) Cache и отношений между ними.

Для достижения поставленной цели необходимо решить следующие задачи:

  • Осуществить анализ систем автоматизированного формирования баз знаний.

  • Изучить CLIPS и Cache.

  • Выполнить проектирование программной системы.

  • Программно реализовать систему для автоматизированного извлечения знаний с помощью среды Borland Delphi 7.0.

  • Рассмотреть вопросы расчета себестоимости программного продукта.

  • Рассмотреть вопросы безопасности жизнедеятельности.

    1. Обзор систем автоматизированного формирования баз знаний

      1. Аналитический курьер

Аналитический курьер - система извлечения знаний из документов (интернет, сообщения новостных лент, служебная переписка, платежные документы и т.д.), разработка компании «Ай-Теко».

Основные функции:

  • параллельная обработка разнородной неструктурированной информации из различных источников: управленческих и юридических документов, сообщений СМИ, сообщений информационных агентств, аналитических материалов различного профиля, ресурсов сети Интернет, и др.;

  • поиск ресурсов в Интернет через поисковые сайты, или по списку исследуемых сайтов;

  • многоязычный семантический поиск с использованием современного тезауруса русского и других  языков, обработка запросов  на естественном языке для текста на европейских языках;

  • доставка тематически структурированного в виде дерева списка релевантных документов (онтологии);

  • автоматическое общее и тематическое реферирование коллекций или  отдельных документов;

  • тематическое рубрицирование документов и публикаций;

  • определение тональной окраски документов и отдельных объектов, выделение упоминаний и цитирования;

  • определение индекса информационной значимости объекта мониторинга;

  • автоматическое выделение тематических групп внутри полученной по запросу подборки  документов (кластерный анализ публикаций);

  • выявление ключевых тем документа, коллекции документов, построение их взаимосвязей в виде семантической сети;

  • построение дайджеста (обзора) по каждому объекту или теме документа;

  • частотный анализ рубрик и публикаций, многомерная аналитическая обработка данных, исследование динамики развития проблем, представленных в документах,

  • Визуализация частотных распределений на географической карте.

Архитектура программного комплекса

Система «Аналитический курьер» реализована на Windows-платформе .NET. имеет трехзвенную архитектуру с «тонким» клиентом и предоставляет пользователям Web-интерфейс.

Хранилище аналитических данных реализовано для СУБД MS SQL Server и ORACLE.

Примеры экранных форм системы

Рис. 1.2 - Образец тематической кластерной карты сообщений

Рис. 1.3 - Образец семантической карты взаимосвязей тем сообщений

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]