Добавил:
СПбГУТ * ИКСС * Программная инженерия Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Учебные пособия / ММвСС (01.09.2016) v2

.pdf
Скачиваний:
73
Добавлен:
15.01.2020
Размер:
5.94 Mб
Скачать

Задачи кластерного анализа

131

Кластерный анализ

Кластерный анализ – это способ группировки многомерных объектов, основанный на представлении результатов отдельных наблюдений точками подходящего геометрического пространства с последующим выделением групп как «сгустков» этих точек (кластеров, таксонов).

Кластерный анализ предполагает выделение компактных, удаленных друг от друга групп объектов, отыскивает «естественное» разбиение совокупности на области скопления объектов.

Он используется, когда исходные данные представлены в виде матриц близости или расстояний между объектами либо в виде точек в многомерном пространстве.

Кластерный анализ ориентирован на выделение некоторых геометрически удаленных групп, внутри которых объекты близки.

Выбор расстояния между объектами является узловым моментом исследования, от него во многом зависит окончательный вариант разбиения объектов на классы при данном алгоритме разбиения.

132

Кластерный анализ

Задано множество объектов A a1 , a2 , , an

Объекты имеют некоторые характеристики (например, координаты). Задача кластеризации состоит в выделении подмножеств объектов - кластеров, таким образом, чтобы в рамках кластера свойства объектов были близки, а между объектами разных кластеров они максимально отличались.

Примером может служит разбиение множества точек на плоскости на подмножества, по признаку близости их координат.

Решение задачи заключается в минимизации суммарного отклонения расстояний (метрик) объектов от центров кластеров (центров масс)

133

Алгоритм кластеризации FOREL (произвольный элемент)

Задано множество объектов A a1 , a2 , , an

Объекты имеют некоторые характеристики (например, координаты на плоскости x и y). Задан размер (радиус) кластера R.

В результате решения получается некоторое число кластеров, средний размер которых близок к R

134

Алгоритм кластеризации FOREL

Начало

Задать случайную точку Сi

Для всех точек xi на

вычисляется

Сi

Да

Фиксируем Сi как центр масс i кластера Все xi <= R помечаем как эл-ты i кластера и исключаем из дальнейшего рассмотрения

Да

Есть свободные элементы

Нет

Останов

135

Метод кластеризации k-средних

(k-means)

Задано множество объектов A a1 , a2 , , an

Объекты имеют некоторые характеристики (например, координаты на плоскости x и y). Задано число кластеров k.

В результате решения получает k кластеров

136

Алгоритм кластеризации k-средних

Начало

Задать k случайных точек С1...Сk

Каждый объект xi

Сj , для полученных центры

Сj

Да

Фиксируем Сj как центры масс кластеров

а xi помечаем как эл-ты j кластеров

Останов

137

Пример кластеризации

y

80

60

40

40

60

80

y

80

60

40

40

60

80

y

80

60

40

x

40

60

80

x

 

y

 

 

 

80

60

40

x

40

60

80

x

 

138

Применение кластерного анализа для выбора структуры сети

139

3.2.1 Зависимость пропускной способности (интенсивности обслуженного трафика) от распределения трафика по

территории

Пропускная способность БС

y (м)

Пропускная способность (бит/C)

 

y

 

y

 

S

 

y

j

r

 

ij

x

j

x

x (м)

 

S

b(r) Мбит

 

 

 

80

 

 

 

 

 

60

 

 

 

 

 

40

 

 

 

 

 

20

 

 

 

 

 

0

0

2

4

 

6

 

 

 

 

r

км

 

 

 

b(r) b0

 

 

r

 

 

1

 

 

 

 

 

 

R

Функция распределения пропускной способности БС

 

f (b)

 

 

 

 

f (b)

 

 

 

 

 

 

 

 

 

 

 

 

0.04

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0.06

 

 

1

 

 

 

 

 

 

 

 

 

 

0.02

 

 

 

 

0.04

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

0.02

 

 

 

 

0

0

20

40

60

0

 

 

 

 

 

0

20

40

60

 

 

b

Мбит

 

 

 

 

 

 

 

b

Мбит

 

 

 

 

 

 

 

 

 

Равномерное

Нормальное

распределение

распределение

трафика по

трафика по

территории

территории

 

arg max b x, y ,

a x b,

c y d

x, y

 

 

140