- •4.2. Алгоритмы расчета многокритериальных и многоатрибутных показателей качества окружающей среды
- •4.2.1. Алгоритмы кластеризации лесных массивов
- •4.2.2. Алгоритмы расчета главного интегрального индекса для ранжирования состояния лесных массивов
- •4.3. Алгоритмы оценки качества окружающей среды с использованием доза-эффект зависимостей
- •4.3.1. Алгоритм анализа доза-эффект зависимостей для формирования лингвистического словаря оценок качества окружающей среды
- •4.3.2. Алгоритм k-средних кластеризации лесных массивов
- •4.3.3. Агломеративный алгоритм кластеризации лесных массивов
- •1 Рис.4.14. Пример формирования бинарных кластеров на схеме расположения пяти земельных участков на координатной плоскости экологического качества природной среды.
- •4.3.4. Алгоритмы расширения лингвистического словаря экологического районирования лесных массивов
4.3.2. Алгоритм k-средних кластеризации лесных массивов
Рассмотрим работу алгоритма k-средних, единственным управляющим параметром которого является число классов или кластеров, на которое требуется провести разделение данных. В алгоритме дополнительно используется притяжение кластеров к особым точкам доза-эффект зависимостей.
Работа алгоритма начинается с анализа доза-эффект зависимостей аналогично алгоритму рис.4.11. Как отмечалось ранее, экспериментальные доза-эффект зависимости могут иметь форму отличную от логистической (см. рис.4.7 - рис.4.9). Поэтому и число особых точек также может варьироваться в зависимости от формы графика.
Рис.4.11. Блок схема алгоритма экологического районирования при
условии, что количество кластеров совпадает с количеством термов
лингвистического словаря.
Таблица 4.1. Зоны экологического районирования в районе
металлургического производства и соответствующие этим зонам
лингвистические переменные, или термы
N/п |
Уровни дозы |
Терм |
Описание |
1 |
0 - 0,25 |
Фоновая зона |
фоновая зона или зона обратимых нарушений лесного покрова, в которой возможен эффект стимуляции при малых токсических нагрузках (уровень дозы 0,25 - назовем порогом токсического воздействия) |
2 |
0,25 - 0,32 |
Зона риска |
зона слабых необратимых или допустимых нарушений лесного покрова; при этом отсутствуют явные признаки нарушений |
3 |
0,32 - 0,55 |
Буферная зона |
ослабленные деревья, характеризующиеся слабо ажурной кроной (повреждением до 1 /3 фотосинтезируюшего аппарата), укороченным приростом в высоту, усыханием отдельных ветвей и отдельных корневых лап |
4 |
0,55 - 0,75 |
Зона деградации |
сильно ослабленные деревья с ажурной кроной (с повреждением и усыханием до 2/3 фотосинтезируюшего аппарата), с сильно укороченным приростом или без него, суховершинные, со значительными повреждениями или поражениями ствола, корневых лап, а также с частичным заселением дерева стволовыми вредителями |
5 |
0,75 -1 |
Импактная зона |
зона экологического бедствия - территория, лишенная лесного покрова, или с отдельными лесными участками, для которых характерны усыхающие деревья с сильно изреженной кроной или только отдельными живыми ветвями (с повреждением более 2/3 фотосинтезируюшего аппарата), при этом листва (хвоя) желтеет и осыпается, текущего прироста по высоте нет, по стволу и корням возможны насечки и единичные свежие поселения стволовых вредителей, а также сухие деревья, усохшие в текущем году или в прошлые годы; хвои (листвы) нет, кора и мелкие веточки легко отваливаются |
На следующем шаге работы алгоритма формируются зоны экологического районирования и формулируется лингвистический словарь для описания этих зон (см. табл.4.1). Также определяются центральные точки введенных экологических зон как по дозе, так и по эффекту, которые в дальнейшем должны быть использованы в качестве точек притяжения центроидов в процессе кластеризации.
рассмотрим теперь работу модифицированного алгоритма кластеризации с том притяжения кластеров к особым точкам доза-эффект зависимостей.
Шаг
1. Выбираются К исходных центров кластеров
(центроидов), количество которых совпадает
с количеством зон экологического
районирования, наивных на предыдущем
этапе
,
где
нижний индекс номер кластера верхний
номер итерации. В классическом алгоритме
k-средних
этот
выбор
Низводится произвольно, и обычно в
качестве
исходных центров используются первые.
К записей из выборки из базы данных
земельных участков.
В нашем алгоритме в качестве центроидов используются особые точки доза-эффект зависимостей.
Шаг 2. В классическом алгоритме k-средних на m-м шаге итерационного процесса записи базы данных распределяются по К кластерам по следующему правилу:
x-произвольная
запись базы данных, Sp(m
)-р-и
кластер на m-и
итерации, d
-
расстояние
в конфигурационном пространстве
признаков,
,
ШагЗ.
В классическом алгоритме k-средних
на основе результатов шага 2 определяются
новые центры кластеров
.
При этом используется метод наименьших
квадратов так, чтобы сумма квадратов
расстояний между всеми участками,
принадлежащими кластеру;', и новым
центром кластера была минимальной,
т.е., новые центры кластеров выбираются
таким образом, чтобы минимизировать
следующие функционалы:
Для евклидовых расстояний (метрик) формула для расчета новых центров кластеров получается из условия равенства нулю производных функционала:
где
для краткости обозначено\
Из
уравнения (4.43) следует:
Таким образом, новые центры кластеров определяются как средние арифметические по всем записям, входящим в данный кластер.
В отличие от классического алгоритма в функционале (4.42) введен дополнительный член, описывающий притяжение кластеров к особым точкам доза-эффект зависимостей:
(4.45)
где
соответстве
нно
координаты особых точек и степень
притяжения кластеров.
Найдем условие минимума функционала для случая евклидовых расстояний:
(4.46)
Из (4.46) следует формула для расчета новых центров кластеров:
(4.47)
В случае нулевого притяжения w = 0 формула (4.47) переходит в обычную формулу для расчета среднего арифметического. Для больших w » 1 формула (4.47) выбирает в качестве центров кластеров особые точки доза-эффект зависимостей.
Шаг 4. Проверяется совпадение центров кластеров на двух последовательных итерациях:
(4.48)
Формула (4.48) является условием сходимости алгоритма, и при его достижении итерационная процедура заканчивается. В противном случае алгоритм повторяется от шага 2.
Качество работы модифицированного алгоритма k-средних, зависит от количества кластеров, от последовательности осмотра объектов, от геометрических особенностей данных и от выбора нового параметра - степени притяжения кластеров к особым точкам доза-эффект зависимостей. Для этого алгоритма не существует общего доказательства сходимости, однако можно утверждать, что для получения приемлемых результатов достаточно, чтобы классифицируемые данные образовывали слабо пересекающиеся группы, отстоящие друг от друга достаточно далеко.
Рис.4.12. Блок-схема алгоритма кластеризации земельных участков с учетом притяжения к особым точкам доза-эффект зависимостей.
