Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Глава 4.docx
Скачиваний:
0
Добавлен:
01.04.2025
Размер:
5.96 Mб
Скачать

4.3.2. Алгоритм k-средних кластеризации лесных массивов

Рассмотрим работу алгоритма k-средних, единственным управляющим па­раметром которого является число классов или кластеров, на которое требуется провести разделение данных. В алгоритме дополнительно используется притя­жение кластеров к особым точкам доза-эффект зависимостей.

Работа алгоритма начинается с анализа доза-эффект зависимостей анало­гично алгоритму рис.4.11. Как отмечалось ранее, экспериментальные доза-эффект зависимости могут иметь форму отличную от логистической (см. рис.4.7 - рис.4.9). Поэтому и число особых точек также может варьироваться в зависимости от формы графика.

Рис.4.11. Блок схема алгоритма экологического районирования при

условии, что количество кластеров совпадает с количеством термов

лингвистического словаря.

Таблица 4.1. Зоны экологического районирования в районе

металлургического производства и соответствующие этим зонам

лингвистические переменные, или термы

N/п

Уровни дозы

Терм

Описание

1

0 - 0,25

Фоновая зона

фоновая зона или зона обратимых наруше­ний лесного покрова, в которой возможен эффект стимуляции при малых токсиче­ских нагрузках (уровень дозы 0,25 - назо­вем порогом токсического воздействия)

2

0,25 - 0,32

Зона риска

зона слабых необратимых или допустимых нарушений лесного покрова; при этом от­сутствуют явные признаки нарушений

3

0,32 - 0,55

Буферная зона

ослабленные деревья, характеризующиеся слабо ажурной кроной (повреждением до 1 /3 фотосинтезируюшего аппарата), уко­роченным приростом в высоту, усыханием отдельных ветвей и отдельных корневых лап

4

0,55 - 0,75

Зона деграда­ции

сильно ослабленные деревья с ажурной кроной (с повреждением и усыханием до 2/3 фотосинтезируюшего аппарата), с сильно укороченным приростом или без него, суховершинные, со значительными повреждениями или поражениями ствола, корневых лап, а также с частичным засе­лением дерева стволовыми вредителями

5

0,75 -1

Импактная зо­на

зона экологического бедствия - террито­рия, лишенная лесного покрова, или с от­дельными лесными участками, для кото­рых характерны усыхающие деревья с сильно изреженной кроной или только от­дельными живыми ветвями (с поврежде­нием более 2/3 фотосинтезируюшего аппа­рата), при этом листва (хвоя) желтеет и осыпается, текущего прироста по высоте нет, по стволу и корням возможны насечки и единичные свежие поселения стволовых вредителей, а также сухие деревья, усох­шие в текущем году или в прошлые годы; хвои (листвы) нет, кора и мелкие веточки легко отваливаются



На следующем шаге работы алгоритма формируются зоны экологического районирования и формулируется лингвистический словарь для описания этих зон (см. табл.4.1). Также определяются центральные точки введенных экологи­ческих зон как по дозе, так и по эффекту, которые в дальнейшем должны быть использованы в качестве точек притяжения центроидов в процессе кластериза­ции.

рассмотрим теперь работу модифицированного алгоритма кластеризации с том притяжения кластеров к особым точкам доза-эффект зависимостей.

Шаг 1. Выбираются К исходных центров кластеров (центроидов), количество которых совпадает с количеством зон экологического районирования, наи­вных на предыдущем этапе , где нижний индекс номер кластера верхний номер итерации. В классическом алгоритме k-средних этот выбор Низводится произвольно, и обычно в качестве исходных центров использу­ются первые. К записей из выборки из базы данных земельных участков.

В нашем алгоритме в качестве центроидов используются особые точки до­за-эффект зависимостей.

Шаг 2. В классическом алгоритме k-средних на m-м шаге итерационного процесса записи базы данных распределяются по К кластерам по следующему правилу:

x-произвольная запись базы данных, Sp(m )-р-и кластер на m-и итера­ции, d - расстояние в конфигурационном пространстве признаков, ,

ШагЗ. В классическом алгоритме k-средних на основе результатов шага 2 определяются новые центры кластеров . При этом использу­ется метод наименьших квадратов так, чтобы сумма квадратов расстояний ме­жду всеми участками, принадлежащими кластеру;', и новым центром кластера была минимальной, т.е., новые центры кластеров выбираются таким образом, чтобы минимизировать следующие функционалы:

Для евклидовых расстояний (метрик) формула для расчета новых центров кластеров получается из условия равенства нулю производных функционала:

где для краткости обозначено\ Из уравнения (4.43) следует:

Таким образом, новые центры кластеров определяются как средние ариф­метические по всем записям, входящим в данный кластер.

В отличие от классического алгоритма в функционале (4.42) введен допол­нительный член, описывающий притяжение кластеров к особым точкам доза-эффект зависимостей:

(4.45)

где соответстве нно координаты особых точек и степень притяже­ния кластеров.

Найдем условие минимума функционала для случая евклидовых расстоя­ний:

(4.46)

Из (4.46) следует формула для расчета новых центров кластеров:

(4.47)

В случае нулевого притяжения w = 0 формула (4.47) переходит в обычную формулу для расчета среднего арифметического. Для больших w » 1 формула (4.47) выбирает в качестве центров кластеров особые точки доза-эффект зависимостей.

Шаг 4. Проверяется совпадение центров кластеров на двух последователь­ных итерациях:

(4.48)

Формула (4.48) является условием сходимости алгоритма, и при его дос­тижении итерационная процедура заканчивается. В противном случае алгоритм повторяется от шага 2.

Качество работы модифицированного алгоритма k-средних, зависит от ко­личества кластеров, от последовательности осмотра объектов, от геометриче­ских особенностей данных и от выбора нового параметра - степени притяжения кластеров к особым точкам доза-эффект зависимостей. Для этого алгоритма не существует общего доказательства сходимости, однако можно утверждать, что для получения приемлемых результатов достаточно, чтобы классифицируемые данные образовывали слабо пересекающиеся группы, отстоящие друг от друга достаточно далеко.

Рис.4.12. Блок-схема алгоритма кластеризации земельных участков с учетом притяжения к особым точкам доза-эффект зависимостей.