Добавил:

fench Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Национальный исследовательский ядерный университет (МИФИ)

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Загребаев Методы матпрограммирования 2007

.pdf

Скачиваний:

124

Добавлен:

16.08.2013

Размер:

10.97 Mб

Скачать

☆

<<< < Предыдущая 4 5 6 7 8 9 10 11 12 13 14 1516 / 3416 17 18 19 20 21 22 23 24 25 26 27 28 > Следующая >>>

Рис. 2.9. Зависимость значения критерия качества от количества объектов (СКО)

Таблица 2.7 (начало)

Параметр			Количество кластеров

		2	3	4	5
		2	3	4	5

Время UPGMC, мин:с, мс		00:05.366	00:05.927	00:05.588	00:04.325

Время НС Кохонена, мин:c, мс		00:00.143	00:00.317	00:00.400	00:00.477

Полная сумма внутрикластер-		4574	2353	1784	1134
ных расстояний UPGMC
Полная сумма внутрикластер-		3167	1832	1266	903
ных расстояний НС Кохонена
Сумма квадратов	отклонений	921	665	579	440
UPGMC
Сумма квадратов	отклонений	759	549	435	335
НС Кохонена

151

Таблица 2.7 (окончание)

Параметр		Количество кластеров

	6	7	8	9
	6	7	8	9

Время UPGMC, мин:с, мс	00:05.336	00:04.847	00:04.920	00:05.257

Время НС Кохонена, мин:с, мс	00:00.537	00:01.001	00:01.171	00:00.987

Полная сумма внутрикластер-	949	905	825	681
ных расстояний UPGMC

Полная сумма внутрикластер-	645	534	459	409
ных расстояний НС Кохонена

Сумма квадратов отклонений	365	333	314	272
UPGMC

Сумма квадратов отклонений	281	237	210	192
НС Кохонена

Из рис. 2.12 виден слабый рост времени для нейросети и отсутствие роста для иерархического алгоритма. Если рассмотреть суть последнего, то станет ясно, что подсчет центров кластеров на каждой итерации также приводит к увеличению времени, однако оно весьма незначительно. Для алгоритма Кохонена этот рост вызван введением с увеличением размерности признакового пространства дополнительных входов нейронов. При числе признаков в несколько десятков, возможно, нейросетевой алгоритм уступит UPGMC, однако на практике задачи такой размерности редки.

Как любой итерационный метод, алгоритм кластеризации при помощи НС Кохонена чувствителен к выбору начального приближения. Графики минимальных, средних и максимальных значений времени и качества кластеризации можно видеть на рис. 2.13, 2.14.

152

Рис. 2.10. Зависимость времени кластеризации от количества кластеров

Рис. 2.11. Зависимость значения критерия качества от количества кластеров (ПСВКР)

153

Рис. 2.12. Зависимость значения критерия качества от количества кластеров (СКО)

Таблица 2.8 (начало)

Параметр		Размерность пространства

	2		3	4	5
	2		3	4	5

Время UPGMC, мин:с, мс	00:04.966		00:04.325	00:05.268	00:05.106

Время НС Кохонена, мин:с, мс	00:00.637		00:00.477	00:01.155	00:00.777

Полная сумма внутриклас-	1033		1134	1647	4727
терных расстояний UPGMC
Полная сумма внутрикластер-	585		903	1402	1692
ных расстояний НС Кохонена
Сумма квадратов отклонений	255		440	821	1478
UPGMC
Сумма квадратов отклонений	155		335	720	1058
НС Кохонена

154

Таблица 2.8 (окончание)

Параметр			Размерность пространства

		6		7	8	9
		6		7	8	9

Время UPGMC, мин:с, мс		00:05.086		00:05.098	00:04.916	00:04.386

Время НС Кохонена, мин:с, мс		00:00.607		00:00.683	00:00.854	00:01.233

Полная сумма внутрикластер-		5834		2851	2775	6392
ных расстояний UPGMC

Полная сумма внутрикластер-		1645		2089	2247	2658
ных расстояний НС Кохонена

Сумма квадратов	отклонений	1851		1937	2366	2811
UPGMC

Сумма квадратов	отклонений	1224		1627	2041	2504
НС Кохонена

Рис. 2.13. Зависимость времени кластеризации от размерности пространства

155

Рис. 2.14. Зависимость значения критерия качества от размерности пространства (ПСВКР)

Рис. 2.15. Зависимость значения критерия качества от размерности пространства (СКО)

156

Рис. 2.16. Зависимость диапазона значений времени кластеризации при помощи НС Кохонена от размерности пространства

Для исследования диапазона значений времени и критериев качества кластеризации была проведена серия экспериментов со следующими параметрами: число кластеров m = 5, число объектов в кластеризуемом множестве N = 50, размерность П-пространства – переменная от 2 до 9. Для каждой совокупности из 50 ОТЕ в пространстве соответствующей размерности было проведено 10 экспериментов. В качестве начального приближения берется случайная выборка из множества кластеризуемых объектов.

Как следует из графиков, разброс времени кластеризации в зависимости от начального приближения может достигать сотен процентов. Разброс значений критериев и не превышает 40 % для критерия ПСВКР, а для критерия СКО – 15 %.

157

Можно сделать вывод о превосходстве метода кластеризации с помощью НС Кохонена над алгоритмом невзвешенного попарного центроидного усреднения как по времени работы, так и по качеству. Для 100 объектов в кластеризуемом множестве и 5 выделяемых кластеров НС Кохонена находит на 219 % (по критерию полной суммы внутрикластерных расстояний) более качественное решение в 186 раз быстрее.

Рис. 2.17. Зависимость диапазона значений критерия ПСВКР при кластеризации с помощью НС Кохонена от размерности пространства

В то же время метод кластеризации при помощи НС Кохонена обладает значительным разбросом времени и качества в зависимости от начального приближения, что является существенным недостатком.

158

Рис. 2.18. Зависимость диапазона значений критерия СКО при кластеризации с помощью НС Кохонена от размерности пространства

Необходимо подчеркнуть, что сделанные выводы касаются лишь сравнения приближенных методов кластеризации. Недавние сравнительные исследования нейросетевых подходов с модифицированным аддитивным алгоритмом «рекурсивного ветвления» показали в некоторых классах задач кластеризации превосходство алгоритма оптимальной кластеризации над нейросетью Хопфилда по качеству при сравнимых скоростных характеристиках.

159

Г л а в а 3

НЕЛИНЕЙНОЕ ПРОГРАММИРОВАНИЕ

3.1. Постановка задачи

Общая задача нелинейного программирования формулируется так.

Найти min f (x1 , K, xn ) при ограничениях

gi (x1 , K, xn ) ≤ bi , i =1, m .

Пример. Задача о размещении. Эта задача напоминает транспортную задачу.

fi (xi )

Рис. 3.1. Типичный вид зависимости стоимости производства от объема производства

Пусть имеются n пунктов потребления некоторой продукции, причем b j ( j =1, n) – объем потребления в j-м пункте; имеются

также m пунктов производства. Будем считать, что для каждого i-го пункта производства известна зависимость стоимости производства fi от объема производства xi , т.е. функции fi (xi ) ,

i =1, m – это, как правило, нелинейные функции (рис. 3.1).

160

<<< < Предыдущая 4 5 6 7 8 9 10 11 12 13 14 1516 / 3416 17 18 19 20 21 22 23 24 25 26 27 28 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
16.08.20136.05 Mб188Жданов Явления переноса в газах и плазме 2008.pdf
#
16.08.20132.42 Mб294Жолобов Ввведение в Математическое 2008.pdf
#
16.08.20131.61 Mб74Жукова Обсчая химия 2008.pdf
#
16.08.20131.33 Mб159Забродин УНИХ основы командного интерфейса 2010.pdf
#
16.08.20133.93 Mб150Завадцев Комплексы для инспекции елементного состава грузов 2011.pdf
#
16.08.201310.97 Mб124Загребаев Методы матпрограммирования 2007.pdf
#
16.08.20137.77 Mб92Загребаев Методы обработки статистической информации в задачах контроля 2008.pdf
#
16.08.20132.57 Mб43Задорожный Методы ядерно-физического мониторинга 2008.pdf
#
16.08.2013621.57 Кб19Захарова Праздники и традиции в Германии 2010.pdf
#
16.08.20135.66 Mб161Зебрев Физические основы кремниевой 2008.pdf
#
16.08.201312.57 Mб41Зелдович Физика ударных волн и высокотемпературных гидродинамических явлений 1966.pdf