Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Донецкий национальный университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Лабораторные работы.docx

Скачиваний:

Добавлен:

01.07.2025

Размер:

342.24 Кб

Скачать

☆

<<< < Предыдущая 12 / 72 3 4 5 6 7 > Следующая >>>

Метод эталонных образов

В основу метода положена идея, которая заключается в том, что некоторая совокупность объектов, объединенных в отдельный класс, может быть представлена одним или несколькими эталонными объектами. Эти эталонные объекты являются наиболее типичными представителями класса. Типичность эталонного объекта означает, что он в среднем максимально похож на все объекты класса. Поскольку сходство двух объектов может трактоваться как величина, противоположная расстоянию между ними в пространстве описаний (образов), то эталон – это объект, для которого минимально среднее расстояние до других объектов.

Пусть в обучающей выборке первому классу соответствует M1 элементов x_1,_i, а второму классу – M2 элементов x_2,_i. Тогда эталонные образы для каждого из классов могут быть определены как оценки математических ожиданий (средние):

Классы, однако, могут обладать разными свойствами. Простейшим свойством является компактность класса в пространстве признаков (рис. 1). Этот параметр может быть оценен через среднеквадратичное отклонение (СКО):

Рис. 1. Пример двух классов разных размеров, для которых критерий евклидового расстояния до эталонных образов не является корректным

Тогда для классификации нового образа x используется следующая решающая функция:

Если значение этой функции отрицательное, то образ относится к первому классу, в противном случае – ко второму. Разделяющая поверхность для двух классов задается уравнением κ(x)=0.

Метод ближайшего соседа и его обобщения

Пусть на множестве объектов X задана функция расстояния

ρ: X×X → [0,∞).

Существует целевая зависимость y∗: X → Y, значения которой известны только на объектах обучающей выборки X^ℓ = (x_i,y_i)^ℓ_i₌₁, y_i = y∗(x_i). Множество классов Y конечно. Требуется построить алгоритм классификации a: X → Y, аппроксимирующий целевую зависимость y∗(x) на всём множестве X.

Обобщённый метрический классификатор

Для произвольного объекта u ∈ X расположим элементы обучающей выборки x¹,...,x^ℓ в порядке возрастания расстояний до u:

где через x⁽ⁱ⁾_u обозначается i-й сосед объекта u. Соответственно, ответ на i-м соседе объекта u есть y⁽ⁱ⁾_u = y∗(x⁽ⁱ⁾_u). Таким образом, любой объект u ∈ X порождает свою перенумерацию выборки.

Метрический алгоритм классификации с обучающей выборкой X^ℓ относит объект u к тому классу y ∈ Y, для которого суммарный вес ближайших обучающих объектов Гy(u,X^ℓ) максимален:

где весовая функция w(i,u) оценивает степень важности i-го соседа для классификации объекта u. Функция Γy(u,X^ℓ) называется оценкой близости объекта u к классу y.

Метрический классификатор определён с точностью до весовой функции w(i,u). Обычно она выбирается неотрицательной, не возрастающей по i. Это соответствует гипотезе компактности, согласно которой чем ближе объекты u и x⁽ⁱ⁾_u, тем выше шансы, что они принадлежат одному классу. Обучающая выборка Xℓ играет роль параметра алгоритма a. Настройка сводится к запоминанию выборки, и, возможно, оптимизации каких-то параметров весовой функции, однако сами объекты не подвергаются обработке и сохраняются «как есть». Алгоритм a(u;X^ℓ) строит локальную аппроксимацию выборки Xℓ, причём вычисления откладываются до момента, пока не станет известен объект u. По этой причине метрические алгоритмы относятся к методам ленивого обучения (lazy learning), в отличие от усердного обучения (eager learning), когда на этапе обучения строится функция, аппроксимирующая выборку. Метрические алгоритмы классификации относятся также к методам рассуждения по прецедентам (case-based reasoning, CBR). Здесь действительно можно говорить о «рассуждении», так как на вопрос «почему объект u был отнесён к классу y?» алгоритм может дать понятное экспертам объяснение: «потому, что имеются схожие с ним прецеденты класса y», и предъявить список этих прецедентов. Выбирая весовую функцию w(i,u), можно получать различные метрические классификаторы, которые подробно рассматриваются ниже.

Метод ближайших соседей

Алгоритм ближайшего соседа (nearest neighbor, NN) относит классифицируемый объект u ∈ X^ℓ к тому классу, которому принадлежит ближайший обучающий объект: w(i,u) = [i = 1]; a(u;X^ℓ) = y⁽¹⁾_u.

Этот алгоритм является, по всей видимости, самым простым классификатором. Обучение NN сводится к запоминанию выборки X^ℓ. Единственное достоинство этого алгоритма — простота реализации. Недостатков гораздо больше:

• Неустойчивость к погрешностям. Если среди обучающих объектов есть выброс — объект, находящийся в окружении объектов чужого класса, то не только он сам будет классифицирован неверно, но и те окружающие его объекты, для которых он окажется ближайшим.

• Отсутствие параметров, которые можно было бы настраивать по выборке. Алгоритм полностью зависит от того, насколько удачно выбрана метрика ρ.

• В результате — низкое качество классификации.

Алгоритм k ближайших соседей (k nearest neighbors, kNN)

Чтобы сгладить влияние выбросов, будем относить объект u к тому классу, элементов которого окажется больше среди k ближайших соседей x⁽ⁱ⁾_u , i = 1,...,k:

При k = 1 этот алгоритм совпадает с предыдущим, следовательно, неустойчив к шуму. При k = ℓ, наоборот, он чрезмерно устойчив и вырождается в константу.

Таким образом, крайние значения k нежелательны. На практике оптимальное значение параметра k определяют по критерию скользящего контроля с исключением объектов по одному (leave-one-out, LOO). Для каждого объекта xi ∈ Xℓ проверяется, правильно ли он классифицируется по своим k ближайшим соседям.

Заметим, что если классифицируемый объект x_i не исключать из обучающей выборки, то ближайшим соседом x_i всегда будет сам x_i, и минимальное (нулевое) значение функционала LOO(k) будет достигаться при k = 1.

Существует и альтернативный вариант метода kNN: в каждом классе выбирается k ближайших к u объектов, и объект u относится к тому классу, для которого среднее расстояние до k ближайших соседей минимально.

Алгоритм k взвешенных ближайших соседей

Недостаток kNN в том, что максимум может достигаться сразу на нескольких классах. В задачах с двумя классами этого можно избежать, если взять нечётное k. Более общая тактика, которая годится и для случая многих классов — ввести строго убывающую последовательность вещественных весов wi, задающих вклад i-го соседа в классификацию:

Выбор последовательности wi является эвристикой. Если взять линейно убывающие веса , то неоднозначности также могут возникать, хотя и реже (пример: классов два; первый и четвёртый сосед голосуют за класс 1, второй и третий — за класс 2; суммы голосов совпадают). Неоднозначность устраняется окончательно, если взять нелинейно убывающую последовательность, скажем, геометрическую прогрессию: wi = qⁱ, где знаменатель прогрессии q ∈ (0,1) является параметром алгоритма. Его можно подбирать по критерию LOO, аналогично числу соседей k.

Недостатки простейших метрических алгоритмов типа kNN.

• Приходится хранить обучающую выборку целиком. Это приводит к неэффективному расходу памяти и чрезмерному усложнению решающего правила. При наличии погрешностей (как в исходных данных, так и в модели сходства ρ) это может приводить к понижению точности классификации вблизи границы классов. Имеет смысл отбирать минимальное подмножество эталонных объектов, действительно необходимых для классификации.

• Поиск ближайшего соседа предполагает сравнение классифицируемого объекта со всеми объектами выборки за O(ℓ) операций. Для задач с большими выборками или высокой частотой запросов это может оказаться накладно. Проблема решается с помощью эффективных алгоритмов поиска ближайших соседей, требующих в среднем O(lnℓ) операций.

• В простейших случаях метрические алгоритмы имеют крайне бедный набор параметров, что исключает возможность настройки алгоритма по данным.

<<< < Предыдущая 12 / 72 3 4 5 6 7 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
13.04.2015479.75 Кб117Лабораторная-работа-1.pdf
#
01.07.2025296.12 Кб3лабораторные и практич. по биологии 2015..docx
#
08.11.2019308.74 Кб11лабораторные работы для физиков 2012.doc
#
01.07.20254.51 Mб2Лабораторные работы ТЕМК .doc
#
08.05.2015890.88 Кб17Лабораторные работы.doc
#
01.07.2025342.24 Кб0Лабораторные работы.docx
#
13.04.20151.48 Mб99ЛАБОРАТОРНЫЕ РАБОТЫ.pdf
#
13.11.2019353.28 Кб7лабы с.г.doc
#
01.07.202590.62 Кб2Лаб№1 (2015).doc
#
01.07.2025273.92 Кб1Лад.doc
#
16.03.201652.16 Кб32Лакшин В.Я. Александр Николаевич Островский.docx