Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Управление большими системами. УБС-2017

.pdf
Скачиваний:
3
Добавлен:
12.11.2023
Размер:
17.48 Mб
Скачать

Информационные технологии в управлении техническими системами и технологическими процессами

Рассматривая полученные α-матрицы для каждого атрибута, можно построить матрицу различимости, размером nxn и содержащую на пересечении столбца и строки набор атрибутов, по которым данные классы можно считать различимыми.

На этапе проектирования объектного представления было выделено несколько классов. Основными являются классы Table и DefTab. Table хранит исходную таблицу выборки в виде вектора объектов Element, а также содержит в себе промежуточные матрицы расчетов и оперирует основными вычислительными методами.

Класс TabDef описывает матрицу различимости в виде вектора элементов класса Defelem. Фактически его экземпляр будет представлять собой трехмерный массив, область определения для третьей координаты которого будет не фиксирована в целях экономии памяти. Это обеспечивается за счет использования структуры вектора в представлении элемента матрицы.

Остальные классы выполняют вспомогательные функции для быстрого и упрощенного обращения к различным атрибутам основных массивов. Такими являются классы Element и Defelem, описывающие элементы матриц выборки и различимости. Кроме того, был выделен общий класс двумерных массивов для построения промежуточных структур, которые описывают неточность отношений классификации и толерантность отношений [3, 5].

В ходе проектирования была построена схема, отражающая представление программы в виде логических блоков. Данный этап отображен на рисунке.

Рис. Схема представления программы в виде логических блоков

413

451

Управление большими системами. Выпуск XX

Входные данные представляют собой два файла расширения .csv. Выбор такого формата обусловлен простотой представления, что упрощает дальнейший парсинг и обработку. Первый из файлов содержит таблицу выборки объектов с заранее известной классификацией, второй – набор тестовых объектов, фактическая принадлежность к определенному классу которых не известна, но будет определена с заданной точностью в результате работы программных [4].

Блок обработки входных данных получает переданные на вход значения и переводит их в объектное представление, заполняя экземпляр класса Table. На этом этапе информация из файлов загружается в оперативную память для ускоренного доступа. В этом же блоке динамически определяются размеры массивов для хранения матриц толерантности и оценки неточности построения классификации.

Блок вычислений производит все необходимые для расчетов математические операции. Здесь определяются матрицы ошибок, неопределенности и толерантности, а также выводятся правила классификации.

Блок статистики циклически обращается к блоку вычислений для определения зависимости коэффициента оценки классификации от заданного параметра α. За один шаг цикла при вызове блока вычислений строится новая матрица неопределенности, по которой сразу вычисляются правила классификации. Далее для тестового множества выводится матрица оценки, на главной диагонали которой указано количество верно классифицированных элементов. По ней с использованием следующей формулы определяется итоговый коэффициент, который заносится в таблицу статистики:

 

 

n

 

k =

sii

(1)

i=1

 

.

n n

 

 

sij

i=1 j=1

После этого цикл повторяется для получения коэффициента при новом параметре α.

414

452

Информационные технологии в управлении техническими системами и технологическими процессами

Итогом работы программы является набор статистических данных в формате табл. 2.

Таблица 2. Статистика

Параметр α

Коэффициент оценки классификации

 

 

0,1

0,374

 

 

0,2

0,374

 

 

0,3

0,374

 

 

0,4

0,374

 

 

Исследование выполнено при финансовой поддержке РФФИ и Липецкой области в рамках научного проекта 17-47- 480305-р_а.

Литература

1.САРАЕВ П.В. Интервализация в задачах классификации и анализе качества литых слябов // Современные проблемы горно-металлургического комплекса. Наука и производст-

во. – М., 2015. – С. 275.

2.САРАЕВ П.В., ПОЛОЗОВА Ю.Е. Перспективы интервального нейросетевого моделирования и прогнозирования //

Вестник ЛГТУ. – 2016. – № 4 (27). – С. 6–13.

3.A rough set approach for the discovery of classification rules in interval-valued information systems / Y. LEUNG, M.M. FISCHER, W.-Z. WU, J.-S. MI // Internation Journal of Approximate Reasoning. – 2008. – Vol. 47. – Iss. 2. – P. 233–246.

4.PAWLAK Z. Rough Sets // International Journal of Parallel Programming, 1982. – № 11(5). – P. 341–356.

5.BELLO R., VERDEGAY J.L. Rough sets in the Soft Computing environment // Information Sciences. – 2012. – No. 212. – P. 1–14.

415

453

Управление большими системами. Выпуск XX

ARTICLE TITLE, OBJECT ORIENTED APPROACH FOR REALIZATION OF ALGORITHMS OF THE ROUGH SET THEORY ON INTERVAL DATA

Alexander Syrokvasov, Lipetsk State Technical Univercity, Lipetsk, student (alex.sirokvasoff2011@yandex.ru).

Abstract: this article deals with main problems of program realization of algorithms of the rough set theory. The paper discusses ways of calculation acceleration and using object oriented approach. Also here are modeling of logic blocks and parts of computing complex for determination experimental values of classes for input data. Here is the description of the representation of the main data structures and the statistics table.

Keywords: rough sets, interval values, classification problems, ob- ject-oriented programming

416

454

Информационные технологии в управлении техническими системами и технологическими процессами

УДК 021.8 + 025.1 ББК 78.34

РАЗРАБОТКА БАЗЫ ДАННЫХ ДЛЯ РЕАЛИЗАЦИИ КОНЦЕПЦИИ

СТРАТЕГИЧЕСКОГО УПРАВЛЕНИЯ ПРОЦЕССАМИ НА МЕТАЛЛУРГИЧЕСКОМ ПРЕДПРИЯТИИ

Тюрин А.С.1

(Липецкий государственный технический университет, Липецк)

В данной статье рассматриваются проектирование базы данных для организации стратегического управления процессами на металлургическим предприятии.

Ключевые слова: Oracle, Sybase PowerDesigner, концептуальная модель данных, ANSI/SPARC.

Современный подход к разработке баз данных предполагает использование архитектуры ANSI/SPARC. Архитектура систем базы данных ANSI/SPARC повсеместно распространена и имеет трехуровневую структуру. Она определяет три уровня абстракции, т.е. уровни описания данных: внешний, концептуальный и внутренний [6]. На концептуальном уровне обобщается совокупность всех требований к данным, полученных из пользовательских внешних представлений и формируется общее представление базы данных.

Цель работы – создать базу данных, которая позволит хранить в себе все необходимые данные для организации стратегического управления процессами, протекающими на металлургическом предприятии.

К основным фазам производства металла относят подготовку руды, восстановление и вторичную обработку. На всех трёх стадиях большую роль играет контроль за химическим составом

1 Алексей Сергеевич Тюрин, студент (leha2148@gmail.com).

417

455

Управление большими системами. Выпуск XX

производимой продукции. Один из подходов к такому контролю – «поэлементное» управление процессами. Такое управление предполагает оперирование отдельными химическими элементами, что позволяет весьма точно контролировать состав металла и как следствие получать изделия требуемых характеристик. Поэлементное управление позволяет сократить выпуск несоответствующей продукции на каждом этапе производства, что даёт ощутимый экономический эффект.

Такое управление реализуется посредством составления математических моделей для установок на производстве. Эти модели позволяют выяснить, какими показателями будет обладать продукт на выходе при известных входных параметрах. Таким образом, передавая данные по цепочке от модели к модели, мы имеем полное представление о каждом этапе производства. Основной интерес при тестировании моделей представляет возможность отследить влияние на параметры выходного продукта оперирования отдельными химическими элементами. В соответствии с описанной областью применения и была разработана база данных.

Основная задача при разработке БД состоит в создании механизма хранения и отслеживания математических моделей, которые моделируют установку. Для работы модели необходим файл, в котором хранятся исходные данные. На выходе из модели также получается файл, но уже с выходными данными, которые впоследствии могут быть использованы как входные уже для модели другой установки. Также следует отметить, что в контексте данной задачи модель представляется в виде «чёрного ящика», а файлы входных и выходных данных, параметры установок и связей между ними рассматриваются более подробно. Данный этап проектирования принято называть системным анализом и словесным описанием информационных объектов предметной области. Именно от него зависят многие последующие решения о хранении в базе данных той или иной информации на этапе инфологического проектирования.

Инфологическое (концептуальное) проектирование предполагает создание информационной модели предметной области с ещё большим уровнем абстракции, которая не зависит от вы-

418

456

Информационные технологии в управлении техническими системами и технологическими процессами

бранной СУБД. СУБД, впрочем, может быть выбрана гораздо

позже. Концептуальное

проектирование принято выполнять

в ключе, в котором и

заказчику информационной системы,

и самому разработчику удобно общаться, не прибегая к узким и специфическим понятиям своей профессиональной деятельности. Именно концептуальный этап определяет, что будет храниться в создаваемой базе данных.

Модель «сущность-связь» (Entity-Relationship, ER-модель)

является общепринятым средством проектирования и графического представления концептуальной модели данных [4].

Данный подход основывается на выделении в предметной области следующих объектов: сущность, атрибут сущности, ключевой атрибут, связь.

При анализе предметной области были выявлены следующие типы сущностей: агрегат, группа свойств, единица измерения, модель, путь, ресурс, ресурс агрегата, свойство, данные модели, данные. Следующий этап – наполнение сущностей атрибутами, характеризующими каждую из них. Зачастую встаёт проблема выбора – определить какое-то свойство реального физического объекта как сущность или атрибут. После определения основных сущностей следуетустановлениесвязеймежду ними.

Сущность «агрегат» отражает в базе данных реальный объект – производственную установку. Это может быть станок или целое сооружение – доменная печь. Атрибуты агрегата: короткое имя агрегата, полное имя агрегата и id агрегата. Ключевой атрибут – id агрегата. Ключевой атрибут предназначен для однозначного идентифицирования экземпляра сущности в базе данных. В данном случае ключевой атрибут является искусственным.

Сущности «ресурс» и «ресурс агрегата» тесно связаны между собой. «Ресурс» отражает именно сам физический объект, материал для обработки на агрегате. Атрибуты – полное и короткие имена ресурса и его id. Однако ресурс может быть выходным продуктом по отношению к агрегату, поэтому была введена сущность «ресурс агрегата». Атрибуты «ресурса агрегата» – тип процесса и id типа ресурса. Тип процесса показывает, входом или выходом агрегата является ресурс. Таким об-

419

457

Управление большими системами. Выпуск XX

разом, «агрегат» имеет два типа «ресурса агрегата». В свою очередь, каждый ресурс связан с «ресурсом агрегата» и может одновременно являться входным и выходным по отношению к агрегату.

Для хранения свойств ресурса была введена сущность «свойство». Её атрибуты – короткое и полное названия, id свойства. Под свойством понимается какая-то характеристика ресурса. Так как таких характеристик может выделено очень много, для категорирования свойств введена сущность «группа свойств» (например, категория «химический состав»). Атрибут «группы свойств» – id группы свойств и название группы свойств. Для хранения единиц измерения свойства выделена сущность «единица измерения».

Модель обладает яркой выраженной зависимостью от агрегата, поэтому в концептуальной схеме данных она обозначена как слабая сущность. Сущность «модель» имеет довольно много атрибутов – разработчик, описание, дата, id модели, SHA-1 и сам бинарный файл.

Сущность «путь» отражает связь между двумя агрегатами. Атрибуты сущности – id старта и id конца, под которыми подразумевается какие-либо агрегаты.

Связи могут быть весьма разнообразными: один – к одному, один – ко многим, многие – ко многим. Кроме того, связь может соединять сущность саму с собой или между двумя типами сущностей может быть две различные связи. Однако в реальности между физическими объектами или явлениями существует огромное количество связей, и всё можно связать со всем. Главная задача проектировщика на данном этапе – выявить именно значимые связи, информацию о которых стоит хранить.

Так как схема маршрутов между агрегатами предприятия обширна и достаточно сложна, в схеме данных было предусмотрено отображение связей между сущностями «агрегат» и «путь» типами связей «старт» и «финиш», что позволяет представить направление движения ресурсов (вход или выход). Основываясь на полученных маршрутах, пользователь системы может отследить и последовательность моделей, которые он должен протестировать на своих данных, чтобы получить ин-

420

458

Информационные технологии в управлении техническими системами и технологическими процессами

формацию о работе заданного участка производства. Однако модель агрегата – это слишком сложная структура. На практике же обычно составляют множество моделей, описывающих отдельные узлы или механизмы установки. Разрабатываемая система предполагает, что у одного агрегата может быть большое количество моделей, однако последовательность их работы всё же определяется непосредственно пользователем.

Отдельный интерес представляет описание в модели данных ресурсов агрегатов. В данной работе ресурс агрегата понимается в широком смысле – это может быть как химическое вещество, газ, сырьё в виде руды, так и изделия из металла (прокат, профиль и т.д.). При построении модели для установки программист может выяснить название ресурса и единицы измерения его свойств благодаря их отображению в базе данных. Для удобства отображения и систематизации свойств ресурса в концептуальную схему данных внесена сущность «группа свойств», которая объединяет характеристики в группы. К примеру, это могут быть группы «габариты» или «химический состав».

Для работы моделей, созданных программистами, необходимы файлы входных и выходных данных, которые также хранятся в базе данных. Для реализации хранения таких файлов были введены сущности «данные модели» и «данные». Файл данных представляет собой перечисление названий параметров установки и их численные значения. База данных позволяет узнать, какие выходные данные были получены на основе тех или иных входных файлов на конкретной модели.

Средства среды проектирования PowerDesigner позволяют быстро сгенерировать на основе созданной концептуальной модели логическую и физическую схему данных. Последняя генерируется под конкретную СУБД [1]. Следует также отметить возможность увидеть готовый SQL-скрипт для создания того или иного элемента базы данных ещё до генерации общего скрипта.

В ходе работы была выбрана СУБД Oracle, обладающая таким важным качеством, как неограниченный размер базы данных и лёгкость масштабирования. Естественно, разрабаты-

421

459

Управление большими системами. Выпуск XX

ваемая система продолжает совершенствоваться, усложняется схема данных. С ростом сложности схемы данных и объёмом хранимой информации зачастую возникает необходимость обновления аппаратных средств. Oracle же позволяет вводить в уже имеющийся кластер новое оборудование, сохраняя при этом в работе старое. Также Oracle предоставляет инструменты для имитирования реальной нагрузки на тестируемой системы, что позволяет выявить уязвимости ещё на стадии разработки. В Oracle Database поддерживаются различные типы индексов: B-tree cluster indexes, Hash cluster indexes, Reverse key indexes, Bitmap indexes, Bitmap join indexes. Каждый из ти-

пов индексов может обеспечить существенный прирост производительности в той или иной ситуации [5].

Исследование выполнено при финансовой поддержке РФФИ и Липецкой области в рамках научного проекта 17-47-480305-р_а.

Литература

1.ИЛЮШЕЧКИН В. Основы использования и проектирования баз данных. – Litres, 2017. – 250 с.

2.ЛЬЮИС ДЖ. Ядро Oracle. Внутреннее устройство для администраторов и разработчиков баз данных. – М.: ДМК Пресс, 2015. – 372 c.

3.ПОГОДАЕВ А.К., МУРАВЕЙКО А.Ю., ДЯТЧИНА Д.В.

Альтернативные соединения таблиц баз данных // Системы управления и информационных технологии. – 2005. –

№ 5(22). – С. 99–102.

4.КАРПОВА И.П. Базы данных: учеб. пособие. – СПб.: Питер, 2013. – 240 с.

5.КАЙТ Т. Oracle для профессионалов. Технологии и решения для достижения высокой производительности и эффектив-

ности. – М.: Вильямс, 2016. – 960 с.

6. Database System Concepts / Abraham Silberschatz, Henry F. Korth, S. Sudarshan. – McGraw-Hill, 2011. – 1349 c.

422

460