Загребаев Методы матпрограммирования 2007
.pdfРис. 2.9. Зависимость значения критерия качества от количества объектов (СКО)
Таблица 2.7 (начало)
Параметр |
|
Количество кластеров |
|
|||
|
|
|
|
|||
2 |
3 |
4 |
5 |
|||
|
|
|||||
|
|
|
|
|
||
Время UPGMC, мин:с, мс |
00:05.366 |
00:05.927 |
00:05.588 |
00:04.325 |
||
|
|
|
|
|
||
Время НС Кохонена, мин:c, мс |
00:00.143 |
00:00.317 |
00:00.400 |
00:00.477 |
||
|
|
|
|
|
||
Полная сумма внутрикластер- |
4574 |
2353 |
1784 |
1134 |
||
ных расстояний UPGMC |
|
|
|
|
||
Полная сумма внутрикластер- |
3167 |
1832 |
1266 |
903 |
||
ных расстояний НС Кохонена |
|
|
|
|
||
Сумма квадратов |
отклонений |
921 |
665 |
579 |
440 |
|
UPGMC |
|
|
|
|
|
|
Сумма квадратов |
отклонений |
759 |
549 |
435 |
335 |
|
НС Кохонена |
|
|
|
|
|
151
Таблица 2.7 (окончание)
Параметр |
|
Количество кластеров |
|
||
|
|
|
|
||
6 |
7 |
8 |
9 |
||
|
|||||
|
|
|
|
|
|
Время UPGMC, мин:с, мс |
00:05.336 |
00:04.847 |
00:04.920 |
00:05.257 |
|
|
|
|
|
|
|
Время НС Кохонена, мин:с, мс |
00:00.537 |
00:01.001 |
00:01.171 |
00:00.987 |
|
|
|
|
|
|
|
Полная сумма внутрикластер- |
949 |
905 |
825 |
681 |
|
ных расстояний UPGMC |
|
|
|
|
|
|
|
|
|
|
|
Полная сумма внутрикластер- |
645 |
534 |
459 |
409 |
|
ных расстояний НС Кохонена |
|
|
|
|
|
|
|
|
|
|
|
Сумма квадратов отклонений |
365 |
333 |
314 |
272 |
|
UPGMC |
|
|
|
|
|
|
|
|
|
|
|
Сумма квадратов отклонений |
281 |
237 |
210 |
192 |
|
НС Кохонена |
|
|
|
|
|
|
|
|
|
|
Из рис. 2.12 виден слабый рост времени для нейросети и отсутствие роста для иерархического алгоритма. Если рассмотреть суть последнего, то станет ясно, что подсчет центров кластеров на каждой итерации также приводит к увеличению времени, однако оно весьма незначительно. Для алгоритма Кохонена этот рост вызван введением с увеличением размерности признакового пространства дополнительных входов нейронов. При числе признаков в несколько десятков, возможно, нейросетевой алгоритм уступит UPGMC, однако на практике задачи такой размерности редки.
Как любой итерационный метод, алгоритм кластеризации при помощи НС Кохонена чувствителен к выбору начального приближения. Графики минимальных, средних и максимальных значений времени и качества кластеризации можно видеть на рис. 2.13, 2.14.
152
Рис. 2.10. Зависимость времени кластеризации от количества кластеров
Рис. 2.11. Зависимость значения критерия качества от количества кластеров (ПСВКР)
153
Рис. 2.12. Зависимость значения критерия качества от количества кластеров (СКО)
Таблица 2.8 (начало)
Параметр |
|
Размерность пространства |
|
|||
|
|
|
|
|
|
|
2 |
|
3 |
4 |
|
5 |
|
|
|
|
||||
|
|
|
|
|
|
|
Время UPGMC, мин:с, мс |
00:04.966 |
|
00:04.325 |
00:05.268 |
|
00:05.106 |
|
|
|
|
|
|
|
Время НС Кохонена, мин:с, мс |
00:00.637 |
|
00:00.477 |
00:01.155 |
|
00:00.777 |
|
|
|
|
|
|
|
Полная сумма внутриклас- |
1033 |
|
1134 |
1647 |
|
4727 |
терных расстояний UPGMC |
|
|
|
|
|
|
Полная сумма внутрикластер- |
585 |
|
903 |
1402 |
|
1692 |
ных расстояний НС Кохонена |
|
|
|
|
|
|
Сумма квадратов отклонений |
255 |
|
440 |
821 |
|
1478 |
UPGMC |
|
|
|
|
|
|
Сумма квадратов отклонений |
155 |
|
335 |
720 |
|
1058 |
НС Кохонена |
|
|
|
|
|
|
154
Таблица 2.8 (окончание)
Параметр |
|
Размерность пространства |
|
||||
|
|
|
|
|
|
||
6 |
|
7 |
8 |
|
9 |
||
|
|
|
|
||||
|
|
|
|
|
|
|
|
Время UPGMC, мин:с, мс |
00:05.086 |
|
00:05.098 |
00:04.916 |
|
00:04.386 |
|
|
|
|
|
|
|
|
|
Время НС Кохонена, мин:с, мс |
00:00.607 |
|
00:00.683 |
00:00.854 |
|
00:01.233 |
|
|
|
|
|
|
|
|
|
Полная сумма внутрикластер- |
5834 |
|
2851 |
2775 |
|
6392 |
|
ных расстояний UPGMC |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Полная сумма внутрикластер- |
1645 |
|
2089 |
2247 |
|
2658 |
|
ных расстояний НС Кохонена |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Сумма квадратов |
отклонений |
1851 |
|
1937 |
2366 |
|
2811 |
UPGMC |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Сумма квадратов |
отклонений |
1224 |
|
1627 |
2041 |
|
2504 |
НС Кохонена |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Рис. 2.13. Зависимость времени кластеризации от размерности пространства
155
Рис. 2.14. Зависимость значения критерия качества от размерности пространства (ПСВКР)
Рис. 2.15. Зависимость значения критерия качества от размерности пространства (СКО)
156
Рис. 2.16. Зависимость диапазона значений времени кластеризации при помощи НС Кохонена от размерности пространства
Для исследования диапазона значений времени и критериев качества кластеризации была проведена серия экспериментов со следующими параметрами: число кластеров m = 5, число объектов в кластеризуемом множестве N = 50, размерность П-пространства – переменная от 2 до 9. Для каждой совокупности из 50 ОТЕ в пространстве соответствующей размерности было проведено 10 экспериментов. В качестве начального приближения берется случайная выборка из множества кластеризуемых объектов.
Как следует из графиков, разброс времени кластеризации в зависимости от начального приближения может достигать сотен процентов. Разброс значений критериев и не превышает 40 % для критерия ПСВКР, а для критерия СКО – 15 %.
157
Можно сделать вывод о превосходстве метода кластеризации с помощью НС Кохонена над алгоритмом невзвешенного попарного центроидного усреднения как по времени работы, так и по качеству. Для 100 объектов в кластеризуемом множестве и 5 выделяемых кластеров НС Кохонена находит на 219 % (по критерию полной суммы внутрикластерных расстояний) более качественное решение в 186 раз быстрее.
Рис. 2.17. Зависимость диапазона значений критерия ПСВКР при кластеризации с помощью НС Кохонена от размерности пространства
В то же время метод кластеризации при помощи НС Кохонена обладает значительным разбросом времени и качества в зависимости от начального приближения, что является существенным недостатком.
158
Рис. 2.18. Зависимость диапазона значений критерия СКО при кластеризации с помощью НС Кохонена от размерности пространства
Необходимо подчеркнуть, что сделанные выводы касаются лишь сравнения приближенных методов кластеризации. Недавние сравнительные исследования нейросетевых подходов с модифицированным аддитивным алгоритмом «рекурсивного ветвления» показали в некоторых классах задач кластеризации превосходство алгоритма оптимальной кластеризации над нейросетью Хопфилда по качеству при сравнимых скоростных характеристиках.
159
Г л а в а 3
НЕЛИНЕЙНОЕ ПРОГРАММИРОВАНИЕ
3.1. Постановка задачи
Общая задача нелинейного программирования формулируется так.
Найти min f (x1 , K, xn ) при ограничениях
gi (x1 , K, xn ) ≤ bi , i =1, m .
Пример. Задача о размещении. Эта задача напоминает транспортную задачу.
fi (xi )
xi
Рис. 3.1. Типичный вид зависимости стоимости производства от объема производства
Пусть имеются n пунктов потребления некоторой продукции, причем b j ( j =1, n) – объем потребления в j-м пункте; имеются
также m пунктов производства. Будем считать, что для каждого i-го пункта производства известна зависимость стоимости производства fi от объема производства xi , т.е. функции fi (xi ) ,
i =1, m – это, как правило, нелинейные функции (рис. 3.1).
160