- •Кластеризация и статистический анализ распределения в пространстве радиоэлектронных средств сенсорной сети
- •Обзор алгоритмов кластеризации Алгоритмы иерархической кластеризации
- •Нечеткие алгоритмы
- •Алгоритмы, основанные на теории графов
- •Алгоритм выделения связных компонент
- •Алгоритм минимального покрывающего дерева
- •Послойная кластеризация
- •Критерий согласия Пирсона
Лабораторная работа №5 на тему:
Кластеризация и статистический анализ распределения в пространстве радиоэлектронных средств сенсорной сети
Л.5.1 Цель работы: Получить практические навыки в решении задач кластеризации сети с помощью нейронной сети Кохонена и проведении статистического анализа.
Л.5.2 Методические указания к самостоятельной работе студентов
При подготовке к лабораторной работе необходимо самостоятельно ознакомится с разделом 8 «Методы нейронных сетей в задачах управления телекоммуникационными системами».
- знать: методы построения сетей со случайной структурой (метод Монте-Карло), методы статистического анализа, структуры сенсорной сети, нейронную сеть Кохонена;
- уметь: программировать в среде Matlab.
Л.5.3 Общие сведения и задание
Сенсорные сети.
Термин "сенсорная сеть" (СС) на нынешний день является уже достаточно устоявшимся понятием, получившим широкое распространение, и обозначающим само функционирующую, устойчивую к отказу отдельных элементов сеть, которая состоит из большого числа небольших, компактных полупроводниковых устройств, связанных друг с другом беспроводной связью. Радиоэлектронные средства (РЭС) сети не обслуживаются и не требуют специальной установки. Каждое РЭС сети содержит встроенные датчики физических параметров окружающей среды, например, движение, уровень влажности воздуха, свет, температура, давление и тому подобное, а также микросхемы для первичной обработки информации, хранения и передачи данных. Количество РЭС в беспроводной сети определяется областью применения.
Беспроводные сенсорные сети сбора и передачи данных могут быть легко адаптированы к решению многих задач практически в любых сферах деятельности. Самая очевидная область применения подобных сетей - это организация различных систем контроля и мониторинга, создание систем быстрого реагирования в чрезвычайных ситуациях. В качестве наиболее очевидных можно отметить следующие задачи: противопожарные системы; организация систем безопасности - определение вторжения, удаленное наблюдение; контроль окружающей среды вблизи мест хранения радиоактивных материалов, химических или биологических веществ; медицина катастроф.
Возможность адаптации сетей подобного рода к решению широкого спектра задач, а также использование последних научных и технологических достижений делает сенсорные сети актуальной и передовой сетевой технологией, которая может привести к формированию весьма обширного рынка беспроводных сенсорных сетей. Однако на пути к этому существует ряд проблем технологического и эксплуатационного характера, которые требуют пристального рассмотрения; одной из этих проблем является кластеризация РЭС сенсорной сети.
Кластеризация.
Кластеризация (или кластерный анализ) — это задача разбиения множества объектов на группы, называемые кластерами. Внутри каждой группы должны оказаться «похожие» объекты, а объекты разных групп должны быть как можно более отличны.
Применение кластерного анализа в общем виде сводится к следующим этапам:
Отбор выборки объектов для кластеризации.
Определение множества переменных, по которым будут оцениваться объекты в выборке. При необходимости – нормализация значений переменных.
Вычисление значений меры сходства между объектами.
Применение метода кластерного анализа для создания групп сходных объектов (кластеров).
Представление результатов анализа.
После получения и анализа результатов возможна корректировка выбранной метрики и метода кластеризации до получения оптимального результата.
Меры расстояний
Итак, как же определять «похожесть» объектов? Для начала нужно составить вектор характеристик для каждого объекта — как правило, это набор числовых значений, например, координаты расположения объектов в пространстве, рост и вес человека т.п. После того, как определен вектор характеристик, можно провести нормализацию, чтобы все компоненты давали одинаковый вклад при расчете «расстояния». В процессе нормализации все значения приводятся к некоторому диапазону, например, [-1, -1] или [0, 1].
Наконец, для каждой пары объектов измеряется «расстояние» между ними — степень похожести. Существует множество метрик, вот лишь основные из них:
1. Евклидово расстояние
Наиболее распространенная функция расстояния. Представляет собой геометрическим расстоянием в многомерном пространстве:
2. Квадрат евклидова расстояния
Применяется для придания большего веса более отдаленным друг от друга объектам. Это расстояние вычисляется следующим образом:
3. Расстояние городских кварталов (манхэттенское расстояние)
Это расстояние является средним разностей по координатам. В большинстве случаев эта мера расстояния приводит к таким же результатам, как и для обычного расстояния Евклида. Однако для этой меры влияние отдельных больших разностей (выбросов) уменьшается (т.к. они не возводятся в квадрат). Формула для расчета манхэттенского расстояния:
4. Степенное расстояние
Применяется
в случае, когда необходимо увеличить
или уменьшить вес, относящийся к
размерности, для которой соответствующие
объекты сильно отличаются. Степенное
расстояние вычисляется по следующей
формуле:
,
где
r и p – параметры, определяемые
пользователем. Параметр p ответственен
за постепенное взвешивание разностей
по отдельным координатам, параметр r
ответственен за прогрессивное взвешивание
больших расстояний между объектами.
Если оба параметра – r и p — равны двум,
то это расстояние совпадает с расстоянием
Евклида.
Выбор метрики полностью лежит на исследователе, поскольку результаты кластеризации могут существенно отличаться при использовании разных мер.
