6. Примеры решения задач по оцениванию качества моделей и полимодельных комплексов

ринга наводнений, фиксирующих границы зон уже состоявшихся разливов воды, и задач геоинформационного моделирования [57], позволяющих оценить возможные границы зон разлива воды при тех или других потенциально возможных уровнях ее подъема.

В этих условиях важное значение приобретает проблема ситуацион-

ного оценивания качества моделей оперативного прогнозирования наводнений, их параметрической и структурной адаптации к постоянно изменяющейся обстановке и, наконец, проблема выбора для конкретного интервала времени той математической модели, которая в наибольшей степени адекватно описывает и прогнозирует гидрологическую обстановку.

Сразу же следует сказать, что оценивание и выбор моделей прогнозирования наводнений проводился в рассматриваемом в данном разделе в рамках разработанной информационной системы (ИС) оперативного прогнозирования наводнений (ИС «ПРОСТОР»), обобщенная схема которой представлена на рис. 6.22 (более подробная информация на сайте http:// litsam.ru), а основы построения изложены в статьях [44, 45, 55, 56].

Рис. 6.22. Обобщенная схема информационной системы оперативного прогнозирования наводнений.

Из анализа данной схемы следует, что в состав распределенной информационной системы входят гидрологические датчики, установленные на соответствующих гидропостах и поставляющие реальные данные о текущем уровне воды в точке расположения данного поста. Также в составе рассматриваемой cистемы можно выделить следующие оригинальные архитектурные и программные решения:

сервисная шина, представленная программным продуктом OpenESB;

интерпретатор сценария на языке BPEL, встроенный в сервисную шину OpenESB;

программное обеспечение для отображения данных по стандартам веб-картографии GeoServer;

система управления базой пространственных данных PostgreSQLс дополнением PostGIS;

251

Квалиметрия моделей и полимодельных комплексов

сервер администрирования на базе Python;

сервис сбора данных с гидрологических датчиков;

сервис прогнозирования значений параметров гидродинамических процессов;

сервис, управляющий работой расчетной гидродинамической модели;

сервис обработки и интерпретации результатов расчетов;

пользовательский веб-интерфейс в виде прогрессивного веб-приложе- ния, адаптированного для работы на стационарных и мобильных пользовательских терминалах и обеспечивающего выполнение принципиального требованияонеобходимостиминимизацииспециальныхзнанийпотребителя для работы с информационными системами

Все данные, с которыми работает система, хранятся в битемпоральной базе данных. В ее основе лежит темпоральная модель данных (ТМД), позволяющая хранить сведения о жизненном цикле данных. ТМД применяется для хранения как исходных данных (гидрометеорологических), так и результатов моделирования. Битемпоральность означает хранение как времени актуальности определенных данных, так и транзакционного времени (момент записи данных в хранилище).

Использование битемпоральной базы данных обеспечивает как оперативную работу системы мониторинга наводнений, так и работу в режиме моделирования «по прошлому» и сценарного моделирования. Таким образом выполняется анализ обоснованности принятых решений в прошлом с учетом имеющейся информации на заданный момент времени.

Доступ пользователя к темпоральным данным реализован в виде временно́й шкалы в веб-интерфейсе. Используя этот механизм, пользователь может просматривать различные данные (исходные, исторические и прогнозируемые) без специальных знаний (например, формального языка запросов), просто перемещая ползунок шкалы.

Созданный прототип системы оперативного прогнозирования наводнений выполняет в автоматическом режиме полный цикл моделирования: от сбора исходных данных с гидрологических датчиков до обновления результатов прогнозирования в пользовательском интерфейсе. Координацию работы всех подсистем и сервисов осуществляет интерпретатор BPEL процессов посредством сервисной шины. Доступ к информации с гидрологических датчиков предоставляется в формате JSON, расчетные сервисы взаимодействуют по стандартам веб-сервисов, используя формат сообщений SOAP. В результате работы системы в базе пространственных данных формируются записи, которые преобразуются геосервером в формат WMS

ипоставляются в пользовательский интерфейс. Сам интерфейс предоставляет конечному пользователю необходимый минимум инструментов для работы с результатами прогнозирования: строка поиска пространственных данных, перечень отображаемых в данный момент данных, временная шкала для работы с темпоральными данными. Таким образом, вся сложность, связанная с использованием разнородных территориально распределенных информационных систем, скрыта от пользователя за счет полной автоматизации вычислительного процесса. Это позволяет использовать систему не только специалистам с высоким уровнем знаний в области ГИС и ин-

252

6. Примеры решения задач по оцениванию качества моделей и полимодельных комплексов

формационных технологий, но и специалистам в предметной области (гидрологии), а также другим пользователям, заинтересованным в результатах прогноза наводнений (службы по чрезвычайным ситуациям, органы исполнительной власти, коммерческие организации и граждане).

Одними из ключевых компонентов системы являются модели подготовки исходных данных для загрузки непосредственно в гидродинамические модели, осуществляющие расчет зон и глубин затоплений. Такими исходными данными являются прогнозируемые уровни и расходы воды в заранее определенных сечениях русла реки.

В рассматриваемом прототипе системы оперативного прогнозирова-

ния наводнений использовались два альтернативных класса моделей. К первому классу моделей относятся модели, описывающие искусственные нейронные сети (ИНС). Во второй класс моделей входят аналитико-ими- тационные гидрологические модели, реализованные в составе программ-

ного комплекса «ECOMAG» [47].

Современные ИНС представляют собой систему взаимосвязанных и взаимодействующихмеждусобойпростыхискусственныхнейронов(процессоров). Такие нейроны зачастую просты и маломощны, особенно по сравнению с используемыми в персональных компьютерах. Каждый из нейронов такой сети выполняет лишь ряд простых операций – получение сигнала, его простейшее преобразование и передачу в последующие слои ИНС. Вместе с тем, при объединении нейронов в достаточно большую сеть с управляемым взаимодействием подобные простые процессоры способны в параллельном режиме решать очень сложные задачи [48, 50–54]. Если рассматривать ИНС с точки зрения машинного обучения, то они являются еще одним перспективным классом моделей, используемым для распознавания образов, при дискриминантном анализе, кластерном анализе и т. п. В этом случае задача обучения ИНС представляет собой многопараметрическую задачу нелинейной оптимизации. Проведенный анализ показал, что перечисленные особенности ИНС позволяют использовать указанные сети для задачи прогнозирования уровня воды при весеннем ледоходе. Покажем, как это можно осуществить, базируясь на предложенных ранее методологических и методических основах квалиметрии моделей и полимодельных комплексов.

В рассматриваемом примере наблюдение за уровнем воды проводилось на реке Северная Двина в 2018 г. [49]. Для прогнозирования уровня воды были выбраны три поста на притоках реки Северная Двина: посты Тотьма и Каликино на реке Сухона и пост Гаврино на слиянии рек Юг и Луза. Выбор данных постов был обусловлен областью формирования ледовых заторов. Одной из основных «проблемных» областей на Северной Двине является область между городами Великий Устюг и Котлас. На данном участке очень часто случаются заторы, что приводит к затоплению города Великий Устюг, расположенного на слиянии рек Cухона и Юг. Соответственно, прогнозирование уровня на постах этих рек выше по течению позволило бы спрогнозировать и область затопления и оперативно среагировать на опасную ситуацию. Однако, поскольку пост Гаврино был закрыт в 1989 г., данные с него рассчитывались при объединении и аппроксимации результатов измерения

253

Квалиметрия моделей и полимодельных комплексов

гидрологических данных, поступивших с постов Красавино на реке Луза и Подосиновцы на реке Юг.

Рис. 6.23. Схема эксперимента по апробации системы оперативного прогнозирования наводнений.

Поскольку данные посты находились лишь немного выше по течению и крупных притоков между ними и бывшим постом Гаврино не было, считается, что данная подмена не приводит к большим погрешностям в итоговых результатах оперативного прогнозирования уровня подъема воды в ходе наводнения. Пост Тотьма использовался же для прогнозирования схода талых вод с устья Сухоны, которые могут стать причиной второй волны затопления.Вцелом,былоприняторешениедлякраткосрочногооперативногопрогнозирования наводнения в рассматриваемом районе использовать только данные о расходе и об уровне воды с гидрологических постов, а также данные о температуре с метеорологических постов.

При разработке и выборе конкретных моделей и методов прогнозирования наводнений на рассматриваемом участке реки необходимо учитывать, что, несмотря на имеющийся внушительный объем исторических статистических данных, полученных ранее с перечисленных гидропостов, большая частьизнихимеет«обрывочный»,«мозаичный»характер.Вызваноэтотем, чтовходепредыдущихнаводненийпотемилиинымпричинампостыфункционировали не на постоянной основе как в течение года, так и в период половодья, не для каждого года имелись данные одновременно и по уровню воды, и по расходу. Кроме того, данные с некоторых постов за конкретные годы вообще отсутствовали. В связи с этим, для обучения разрабатываемых прогностических ИНС был вручную составлен обучающий набор данных за несколько лет, а также были подобраны следующие векторы, которые соответствуют перечисленным гидропостам:

254

6. Примеры решения задач по оцениванию качества моделей и полимодельных комплексов

Ii = {Li, L3i, LRT3i, Fi, F3i, FRT3i, T, T3, TRT3, T7, TRT7},

где i – индекс соответствующего гидропоста, i = 1 – гидропост Каликино, i = 2 – гидропост Гаврино, i = 3 – гидропост Тотьма;

Li – уровень воды на гидропосту i на текущий день, см;

L3i – среднее значение уровня воды на гидропосту i за последние 3 дня, см; LRT3i – скорость изменения уровня воды на гидропосту i за последние 3 дня, вычисляемая по формуле:

(6.43)

где L3i – уровень воды на гидропосту i три дня назад, см;

Fi – текущий расход воды на гидропосту i на текущий день, м3/с;

Fм33/iс; среднее значение расхода воды на гидропосту i за последние три дня,

FRT3i – скорость изменения расхода воды на гидропосту i за последние три дня, вычисляемая по формуле:

(6.44)

где F3i – расход воды на гидропосту i три дня назад, м3/с;

T – температура на метеопосту Великий Устюг на текущий день, C°;

T3 – средняя температура на метеопосту Великий Устюг за последние три дня, C°;

TRT3 – скорость изменения температуры на метеопосту Великий Устюг за последние три дня, вычисляемая по формуле:

(6.45)

где T3 – температура на метеопосту Великий Устюг три дня назад, C°;

T7 – средняя температура на метеопосту Великий Устюг за последние семь дней, C°;

TRT7 – скорость изменения температуры на метеопосту Великий Устюг за последние семь дней, вычисляемая по формуле (6.46);

(6.46)

где T7 – температура на метеопосту Великий Устюг семь дней назад, C°.

В итоге выходной вектор ИНС может быть представлен в виде:

Oi = {Lndi, Fndi},

где Lndi – прогнозируемый на следующий день уровень воды на гидропосту i, (см); Fndi – прогнозируемый на следующий день расход воды на гидропосту i, м3/с.

Поскольку к настоящему моменту времени отсутствуют прецеденты создания сетей для данной задачи (существующие конфигурации ИНС, используемые для прогнозирования уровня воды, обучались на примерах на-

255

Квалиметрия моделей и полимодельных комплексов

воднения рек, которые либо не замерзают, либо уровень промерзания зимой незначителен [51–54]), был разработан алгоритм автоматического подбора (адаптации) конфигурационных параметров предложенных моделей ИНС. В качестве методической основы предложенного обобщенного алгоритм адаптации параметров ИНС была использована процедура, рассмотренная ранее в подразделе 3.4 (см. формулы (3.37), (3.38), (3.46)–(3.48)).

Рассматриваемый алгоритм, в свою очередь, был построен на базе генетического алгоритма (ГА) [48], где в качестве «особей» выступали простые персептроны Румельхарта. Данный персептрон прост в разработке, настройкеипоследующемиспользовании,аегоуниверсальностьпозволяет использовать этот персептрон для решения широкого спектра задач динамического распознавания ситуаций [49].

Следует отметить, что применение ГА для решения задачи выбора наиболее предпочтительной модели ИНС, используемой при оперативном прогнозировании наводнения, не гарантирует нахождения глобального экстремума функции невязки, оценивающей расхождение между реальными

имоделируемыми данными. Тем не менее данный алгоритм приемлем для поиска «достаточно хорошего» решения за «достаточно короткое время» сложно формализованных задач больших размерностей, к числу которых и относится задача автоматического обучения и адаптации ИНС. Разработанный ГА был ориентирован на выбор среди ряда обучаемых ИНС наиболее точных (в смысле невязки, оценивающей расхождение между реальными

имоделируемыми данными), осуществляя при этом последовательную настройку их параметров для повышения точности работы. В процессе работы ГА подстраивались следующие параметры предложенных ИНС:

количество скрытых слоев;

количество нейронов в скрытом слое;

функция активации нейронов скрытого слоя;

количество эпох обучения.

Для конкретной обстановки в результате работы формируется ИНС Румельхарта с адаптированными параметрами, обеспечивающая требуемую точность и достоверность решения исследуемой задачи оперативного прогнозирования наводнения.

Рассмотримболееподробнопредложенныйалгоритмобучения(адаптации) и отбора ИНС. Указанный алгоритм был реализован следующим образом:

Шаг 1. В первой родительской популяции генерировалось M ИНС (далее «особей»), со случайно заданными параметрами; далее осуществлялся селекционный цикл отбора.

Шаг 2. Генерировались Nd дочерних «особей», параметры которых выбирались случайно из двух параметров случайно подобранных родительских «особей», а также Nr «особи», параметры которых задавались полностью случайно;

Шаг 3. Селекция осуществлялась по методу рулетки:

(6.47)

где pi – вероятность выбора i-й «особи»;

256

6. Примеры решения задач по оцениванию качества моделей и полимодельных комплексов

fi – значение функции приспособленности для i-й «особи»; N – количество «особей» в популяции.

В основу функции приспособленности был положен расчет погрешности спрогнозированного ИНС значения относительно реального значения тестовой выборки:

(6.48)

где εij значение, спрогнозированное i-й сетью для j-го тестового вектора; ωj – реальное выходное значение j-го тестового вектора;

M – количество тестовых векторов.

Результатом данной формулы было значение уровня приспособленности, обратно пропорциональное средней квадратичной ошибки i-й ИНС на тестовой выборке. В результате селекции в текущее поколение из (M + Nd + Nr) «особей» отбиралось M с наибольшим значением p.

Шаг 4. Для всех «особей» рассчитывалась средняя квадратичная ошибка прогноза. Если хотя бы одна «особь» показывала погрешность ниже заданной, цикл прерывался и «особь» с наименьшей ошибкой принималась в качестве «победившей»;

Шаг 5. Опционально, если за I итераций не была получена особь с погрешностью ниже заданной, цикл запускался сначала с новой родительской популяцией,длякоторойзадавалисьновыеслучайныезначенияпараметров.

Для рассматриваемого примера прогнозирования наводнения были приняты следующие численные параметры алгоритма: M = 10, Nd = 8, Nr = 2,

I = 1000.

В результате работы данного алгоритма наиболее предпочтительной моделью ИНС стала ИНС со следующими параметрами:

– количество скрытых слоев – 2;

– количество нейронов в скрытых слоях – 33;

– функция активации нейронов скрытого слоя – PReLU (Parametric Rectified Linear Unit приняла следующий вид:

где α – обучающий массив той же размерности, что и x [10]; 4) функция активации нейронов выходного слоя – PReLU.

Для учета сезонной статичной поправки в уровнях было введено автоматически вычисляемое слагаемое. На каждой итерации прогнозирования осуществлялся прогноз не только на следующий, но и на предыдущий день. Получившийся прогноз уровня на предыдущий день сравнивался с реальным уровнем воды, полученным с соответствующих гидропостов, и разница между этими уровнями принималась в качестве дополнительного (по- правочного) слагаемого: Ln´d = Lnd+ (L1 Lnd1), (6.49) где Lnd – итоговый прогноз уровня воды на следующий день;

257

Квалиметрия моделей и полимодельных комплексов

Lnd – прогноз уровня воды ИНС на следующий день; L1 – реальный уровень воды за предыдущий день; Lnd1 – прогноз уровня воды ИНС на предыдущий день.

Для прогноза более чем на один день обученная ИНС рекурсивно вызывалась внешней частью сервиса, входящего в состав разработанной информационной системы «ПРОСТОР». Предварительное обучения и оптимизация ИНС проводились на основе исторических данных, связанных с прошедшими наводнениями на рассматриваемом участке местности.

ОбучениеиоптимизацияИНСпроходиливтечениедвухднейипотребовали 12 итераций. В таблице 6.29 представлена динамика хода итерационного процесса, а также величины снижения средней ошибки в популяции, в ходе обучения. Из анализа таблицы следует, что разработанная процедура улучшения качества модели прогнозирования уровня подъема воды при наводнении на основе ИНС существенно повысила ее прогностически-упре- ждающие возможности.

В завершение данного подраздела рассмотрим результаты работы выбранных и адаптированных моделей ИНС. На рис. 6.24–6.26 представлены результатыпрогнозированияспомощьюпредложенныхИНСуровняводыв районах расположения трех гидропостов (о которых уже говорилось ранее)

за период 09.03.2018 – 29.04.2018.

Табл. 6.29. Динамика снижения средней ошибки в ходе обучения.

Этап обучения

Средняя ошибка на тестовой выборке, %

Стартовая популяция

15

 

 

1-я итерация обучения

3

 

 

4-я итерация обучения

1

 

 

12-я итерация обучения, итоговая

0,5

 

 

Рис. 6.24. Результаты прогнозирования уровня воды с использованием ИНС для поста Каликино.

258

6. Примеры решения задач по оцениванию качества моделей и полимодельных комплексов

Рис. 6.25. Результаты прогнозирования уровня воды с использованием ИНС для поста Гаврино.

Рис.6.26.РезультатыпрогнозированияуровняводысиспользованиемИНСдляпостаТотьма.

Анализприведенныхграфиковпоказывает,чтонаихудшаяточностьпрогноза была получена для поста Каликино, на котором и образовалась аномальная ситуация. Для постов Гаврино и Тотьма, в которых режим ледохода был близок к среднестатистическому, точность оказалась выше. Далее, результаты прогноза ИНС сравнили с результатами прогнозирования, полученными путем упреждающего имитационного моделирования в рамках программного комплекса «ECOMAG» (рис. 6.27, 6.28).

259

Квалиметрия моделей и полимодельных комплексов

Рис. 6.27. Сравнение результатов прогнозирования для поста Каликино.

Рис. 6.28. Сравнение результатов прогнозирования для поста Гаврино.

По результатам сравнения прогнозов видно, что имитационная модель,

всвязи с имеющейся постоянной необходимостью ручной настройки ее параметровспециалистом,реагироваланаизмененияскладывающейсяпаводковой ситуации существенно медленнее, однако корректнее реагировала на нештатные ситуации и точнее определяла тренды развития таких ситуаций

вдолгосрочной перспективе (к примеру, если сравнить результаты ее работы с прогнозом на основе модели ИНС на три дня вперед для поста Каликино на рис. 6.29).

260