Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
dissertatsia_2.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
695.84 Кб
Скачать

3.2.1 Многозначные переменные

Пусть p-мерная многозначная случайная величина, принимающая значения . Будем считать, что каждый является модально-значным и что все возможные значения в могут произойти. Значение, следовательно, моно записать в следующем виде, для каждого

(3.38)

где относительная частота .[6] Тогда значения в которые не встречаются в имеют соответствующие значения . Кроме того, для не модальной многозначной случайной величины, это где количество значений в , которые имеют место.

Пусть Тогда перепишем в виде , аналогичным образом становится

Для многозначных модальных данных виде уравнения (3.39), категорические меры расстояния между любыми двумя наблюдениями и является где

(3.39)

Рассмотрим следующие значения,

(3.40)

Приведем к формату уравнения относительно частот

. (3.41)

Тогда из уравнения (3.39), квадрат расстояния между и является

Аналогичным образом получаем

Следовательно, матрица расстояний будет выглядеть следующим образом

(3.42)

Обратите внимание, D является матрицей Робинсона.

Есть две меры, которые применяются к не модальным многозначным переменным. Они имеют следующий формат

(3.43)

3.2.2 Интервальные переменные

Есть целый ряд несходств и расстояний мер по интервально-значным данным, некоторые из которых имеют сходства с многозначными переменными и некоторые из которых являются уникальными для интервальных данных. Опишем реализацию интервальных данных.

(3.44)

Gowda-Diday несходство мер между двумя интервальными значениями и имеет следующую форму [5]

(3.45)

где расстояние

(3.46)

, (3.47)

где

(3.48)

длинна всей дистанции на протяжении от до c

(3.49)

где - длинна пересечения интервалов и

(3.50)

если интервалы пересекаются, и если нет.

, (3.51)

где .

Компоненты из уравнений (3.46) - (3.47) являются аналогами компонентов расстояния Gowda-Diday для многозначных величин, заданных в определении 3.15. Третий компонент является мерой взаимного расположения двух наблюдений.

3.3 Кластерный анализ в распознавании изображений

Постановка задачи. Пусть имеется некоторое изображение . Требуется выбрать из базы знаний изображение , такое что

(3.52)

где - метрика гистограммы изображения - количество изображений в базе знаний.

Решение. Для решения задачи, был составлен следующий алгоритм.

Распознавание изображений происходит следующим образом:

  1. Заполняется база знаний.

  2. Строится гистограмма изображения.

  3. По формуле

(3.53)

вычисляются метрики изображений, где - значения гистограмм распознаваемого изображения, - значения гистограмм изображения из базы знаний. Анализ публикаций показал, что эта формула максимально эффективна для решения данной задачи.

  1. Выбирается изображение с меньшей метрикой

  2. Выводится результат

Рисунок 3.1 Блок схема программы

Программа была реализована на языке программирования C# в среде разработки visual studio 2008. На изображении 3.2 приведен тестовый пример работы программы. Слева расположено исходное изображение (то для которого ищем похожее), справа расположено найденное похожее изображение из базы знаний.

На изображении 3.3 в базу были загружены различные спутниковые снимки местности. Слева эталонное изображение, справа найденное в базе знаний.

Таким образом, данная разработка может использоваться в системе спутникового мониторинга, например для прогнозирования весенних паводков.

Рисунок 3.2 Интерфейс программы.

Рисунок 3.3 Пример работы программы

На рисунке 3.2 представлен практический пример работы программы.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]