Учебные пособия / ММвСС (01.09.2016) v2
.pdfЗадачи кластерного анализа
131
Кластерный анализ
Кластерный анализ – это способ группировки многомерных объектов, основанный на представлении результатов отдельных наблюдений точками подходящего геометрического пространства с последующим выделением групп как «сгустков» этих точек (кластеров, таксонов).
Кластерный анализ предполагает выделение компактных, удаленных друг от друга групп объектов, отыскивает «естественное» разбиение совокупности на области скопления объектов.
Он используется, когда исходные данные представлены в виде матриц близости или расстояний между объектами либо в виде точек в многомерном пространстве.
Кластерный анализ ориентирован на выделение некоторых геометрически удаленных групп, внутри которых объекты близки.
Выбор расстояния между объектами является узловым моментом исследования, от него во многом зависит окончательный вариант разбиения объектов на классы при данном алгоритме разбиения.
132
Кластерный анализ
Задано множество объектов A a1 , a2 , , an
Объекты имеют некоторые характеристики (например, координаты). Задача кластеризации состоит в выделении подмножеств объектов - кластеров, таким образом, чтобы в рамках кластера свойства объектов были близки, а между объектами разных кластеров они максимально отличались.
Примером может служит разбиение множества точек на плоскости на подмножества, по признаку близости их координат.
Решение задачи заключается в минимизации суммарного отклонения расстояний (метрик) объектов от центров кластеров (центров масс)
133
Алгоритм кластеризации FOREL (произвольный элемент)
Задано множество объектов A a1 , a2 , , an
Объекты имеют некоторые характеристики (например, координаты на плоскости x и y). Задан размер (радиус) кластера R.
В результате решения получается некоторое число кластеров, средний размер которых близок к R |
134 |
Алгоритм кластеризации FOREL
Начало
Задать случайную точку Сi
Для всех точек xi на
вычисляется
Сi
Да
Фиксируем Сi как центр масс i кластера Все xi <= R помечаем как эл-ты i кластера и исключаем из дальнейшего рассмотрения
Да
Есть свободные элементы
Нет
Останов
135
Метод кластеризации k-средних
(k-means)
Задано множество объектов A a1 , a2 , , an
Объекты имеют некоторые характеристики (например, координаты на плоскости x и y). Задано число кластеров k.
В результате решения получает k кластеров |
136 |
Алгоритм кластеризации k-средних
Начало
Задать k случайных точек С1...Сk
Каждый объект xi
Сj , для полученных центры
Сj
Да
Фиксируем Сj как центры масс кластеров
а xi помечаем как эл-ты j кластеров
Останов
137
Пример кластеризации
y
80
60
40
40 |
60 |
80 |
y
80
60
40
40 |
60 |
80 |
y
80
60
40
x |
40 |
60 |
80 |
x |
|
y |
|
|
|
80
60
40
x |
40 |
60 |
80 |
x |
|
138
Применение кластерного анализа для выбора структуры сети
139
3.2.1 Зависимость пропускной способности (интенсивности обслуженного трафика) от распределения трафика по
территории
Пропускная способность БС
y (м) |
Пропускная способность (бит/C) |
|
|
y |
|
y |
|
|
S |
|
|
y |
j |
r |
|
ij |
x |
j |
x |
x (м) |
|
S |
b(r) Мбит/с |
|
|
|
||
80 |
|
|
|
|
|
60 |
|
|
|
|
|
40 |
|
|
|
|
|
20 |
|
|
|
|
|
0 |
0 |
2 |
4 |
|
6 |
|
|
||||
|
|
r |
км |
|
|
|
|
b(r) b0 |
|
|
r |
|
|
1 |
|
||
|
|
|
|
|
R |
Функция распределения пропускной способности БС
|
f (b) |
|
|
|
|
f (b) |
|
|
|
|
|
|
|
|
|
|
|
|
|
0.04 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0.06 |
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
0.02 |
|
|
|
|
0.04 |
|
|
2 |
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
3 |
|
|
|
|
|
|
|
0.02 |
|
|
|
|
0 |
0 |
20 |
40 |
60 |
0 |
|
|
|
|
|
0 |
20 |
40 |
60 |
|||||
|
|
b |
Мбит/с |
|
|
||||
|
|
|
|
|
b |
Мбит/с |
|
||
|
|
|
|
|
|
|
|
Равномерное |
Нормальное |
|
распределение |
||
распределение |
||
трафика по |
||
трафика по |
||
территории |
||
территории |
||
|
arg max b x, y , |
a x b, |
c y d |
x, y |
|
|
140