Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Загребаев Методы матпрограммирования 2007

.pdf
Скачиваний:
124
Добавлен:
16.08.2013
Размер:
10.97 Mб
Скачать

Рис. 2.9. Зависимость значения критерия качества от количества объектов (СКО)

Таблица 2.7 (начало)

Параметр

 

Количество кластеров

 

 

 

 

 

2

3

4

5

 

 

 

 

 

 

 

Время UPGMC, мин:с, мс

00:05.366

00:05.927

00:05.588

00:04.325

 

 

 

 

 

Время НС Кохонена, мин:c, мс

00:00.143

00:00.317

00:00.400

00:00.477

 

 

 

 

 

Полная сумма внутрикластер-

4574

2353

1784

1134

ных расстояний UPGMC

 

 

 

 

Полная сумма внутрикластер-

3167

1832

1266

903

ных расстояний НС Кохонена

 

 

 

 

Сумма квадратов

отклонений

921

665

579

440

UPGMC

 

 

 

 

 

Сумма квадратов

отклонений

759

549

435

335

НС Кохонена

 

 

 

 

 

151

Таблица 2.7 (окончание)

Параметр

 

Количество кластеров

 

 

 

 

 

6

7

8

9

 

 

 

 

 

 

Время UPGMC, мин:с, мс

00:05.336

00:04.847

00:04.920

00:05.257

 

 

 

 

 

Время НС Кохонена, мин:с, мс

00:00.537

00:01.001

00:01.171

00:00.987

 

 

 

 

 

Полная сумма внутрикластер-

949

905

825

681

ных расстояний UPGMC

 

 

 

 

 

 

 

 

 

Полная сумма внутрикластер-

645

534

459

409

ных расстояний НС Кохонена

 

 

 

 

 

 

 

 

 

Сумма квадратов отклонений

365

333

314

272

UPGMC

 

 

 

 

 

 

 

 

 

Сумма квадратов отклонений

281

237

210

192

НС Кохонена

 

 

 

 

 

 

 

 

 

Из рис. 2.12 виден слабый рост времени для нейросети и отсутствие роста для иерархического алгоритма. Если рассмотреть суть последнего, то станет ясно, что подсчет центров кластеров на каждой итерации также приводит к увеличению времени, однако оно весьма незначительно. Для алгоритма Кохонена этот рост вызван введением с увеличением размерности признакового пространства дополнительных входов нейронов. При числе признаков в несколько десятков, возможно, нейросетевой алгоритм уступит UPGMC, однако на практике задачи такой размерности редки.

Как любой итерационный метод, алгоритм кластеризации при помощи НС Кохонена чувствителен к выбору начального приближения. Графики минимальных, средних и максимальных значений времени и качества кластеризации можно видеть на рис. 2.13, 2.14.

152

Рис. 2.10. Зависимость времени кластеризации от количества кластеров

Рис. 2.11. Зависимость значения критерия качества от количества кластеров (ПСВКР)

153

Рис. 2.12. Зависимость значения критерия качества от количества кластеров (СКО)

Таблица 2.8 (начало)

Параметр

 

Размерность пространства

 

 

 

 

 

 

 

2

 

3

4

 

5

 

 

 

 

 

 

 

 

 

 

Время UPGMC, мин:с, мс

00:04.966

 

00:04.325

00:05.268

 

00:05.106

 

 

 

 

 

 

 

Время НС Кохонена, мин:с, мс

00:00.637

 

00:00.477

00:01.155

 

00:00.777

 

 

 

 

 

 

 

Полная сумма внутриклас-

1033

 

1134

1647

 

4727

терных расстояний UPGMC

 

 

 

 

 

 

Полная сумма внутрикластер-

585

 

903

1402

 

1692

ных расстояний НС Кохонена

 

 

 

 

 

 

Сумма квадратов отклонений

255

 

440

821

 

1478

UPGMC

 

 

 

 

 

 

Сумма квадратов отклонений

155

 

335

720

 

1058

НС Кохонена

 

 

 

 

 

 

154

Таблица 2.8 (окончание)

Параметр

 

Размерность пространства

 

 

 

 

 

 

 

6

 

7

8

 

9

 

 

 

 

 

 

 

 

 

 

 

Время UPGMC, мин:с, мс

00:05.086

 

00:05.098

00:04.916

 

00:04.386

 

 

 

 

 

 

 

Время НС Кохонена, мин:с, мс

00:00.607

 

00:00.683

00:00.854

 

00:01.233

 

 

 

 

 

 

 

Полная сумма внутрикластер-

5834

 

2851

2775

 

6392

ных расстояний UPGMC

 

 

 

 

 

 

 

 

 

 

 

 

 

Полная сумма внутрикластер-

1645

 

2089

2247

 

2658

ных расстояний НС Кохонена

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Сумма квадратов

отклонений

1851

 

1937

2366

 

2811

UPGMC

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Сумма квадратов

отклонений

1224

 

1627

2041

 

2504

НС Кохонена

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рис. 2.13. Зависимость времени кластеризации от размерности пространства

155

Рис. 2.14. Зависимость значения критерия качества от размерности пространства (ПСВКР)

Рис. 2.15. Зависимость значения критерия качества от размерности пространства (СКО)

156

Рис. 2.16. Зависимость диапазона значений времени кластеризации при помощи НС Кохонена от размерности пространства

Для исследования диапазона значений времени и критериев качества кластеризации была проведена серия экспериментов со следующими параметрами: число кластеров m = 5, число объектов в кластеризуемом множестве N = 50, размерность П-пространства – переменная от 2 до 9. Для каждой совокупности из 50 ОТЕ в пространстве соответствующей размерности было проведено 10 экспериментов. В качестве начального приближения берется случайная выборка из множества кластеризуемых объектов.

Как следует из графиков, разброс времени кластеризации в зависимости от начального приближения может достигать сотен процентов. Разброс значений критериев и не превышает 40 % для критерия ПСВКР, а для критерия СКО – 15 %.

157

Можно сделать вывод о превосходстве метода кластеризации с помощью НС Кохонена над алгоритмом невзвешенного попарного центроидного усреднения как по времени работы, так и по качеству. Для 100 объектов в кластеризуемом множестве и 5 выделяемых кластеров НС Кохонена находит на 219 % (по критерию полной суммы внутрикластерных расстояний) более качественное решение в 186 раз быстрее.

Рис. 2.17. Зависимость диапазона значений критерия ПСВКР при кластеризации с помощью НС Кохонена от размерности пространства

В то же время метод кластеризации при помощи НС Кохонена обладает значительным разбросом времени и качества в зависимости от начального приближения, что является существенным недостатком.

158

Рис. 2.18. Зависимость диапазона значений критерия СКО при кластеризации с помощью НС Кохонена от размерности пространства

Необходимо подчеркнуть, что сделанные выводы касаются лишь сравнения приближенных методов кластеризации. Недавние сравнительные исследования нейросетевых подходов с модифицированным аддитивным алгоритмом «рекурсивного ветвления» показали в некоторых классах задач кластеризации превосходство алгоритма оптимальной кластеризации над нейросетью Хопфилда по качеству при сравнимых скоростных характеристиках.

159

Г л а в а 3

НЕЛИНЕЙНОЕ ПРОГРАММИРОВАНИЕ

3.1. Постановка задачи

Общая задача нелинейного программирования формулируется так.

Найти min f (x1 , K, xn ) при ограничениях

gi (x1 , K, xn ) bi , i =1, m .

Пример. Задача о размещении. Эта задача напоминает транспортную задачу.

fi (xi )

xi

Рис. 3.1. Типичный вид зависимости стоимости производства от объема производства

Пусть имеются n пунктов потребления некоторой продукции, причем b j ( j =1, n) – объем потребления в j-м пункте; имеются

также m пунктов производства. Будем считать, что для каждого i-го пункта производства известна зависимость стоимости производства fi от объема производства xi , т.е. функции fi (xi ) ,

i =1, m – это, как правило, нелинейные функции (рис. 3.1).

160