§3. Критерий оптимальной классификации

При проведении классификации данного множества объектов с использованием различных методов и алгоритмов, как правило, получаются различные результаты. Естественно оптимальным вариантом классификации считать тот вариант, который содержит наименьшее число ошибок. Поэтому за критерий качества классификации принимается минимум вероятности ошибки классификации Р_ош. Этот критерий применим лишь в случаях, когда можно найти оценку величины Р_ош. Но во многих ситуациях это невозможно, и тогда при выборе наилучшей классификации используют функционалы качества разбиения, среди которых выделим три основных вида: функционалы от внутриклассовых расстояний Ф(r_ij^(o)) , функционалы от межклассовых расстояний U(r_ij⁽^⁾), функционалы смешанного типа V(r_ij^(o), r_ij⁽^⁾). Как правило, функционалы Ф(r_ij^(o)) минимизируются, а функционалы U(r_ij⁽^⁾) максимизируются. Конкретные выражения этих функционалов даны в §7.

§4. Основные условия, гарантирующие оптимальную

классификацию

Для получения оптимальной классификации необходимо выполнение следующих условий:

Представление объектов в виде p–мерных векторов (р1) должно достаточно полно отражать основные свойства каждого класса. К примеру, если множество наблюдений содержит всю информацию, получаемую с черно–белого телевизора, то при этом невозможно построить алгоритм выделения "красных" входных сигналов.
Должны быть заданы представительные (репрезентативные) подмножества наблюдений каждого класса. Если наблюдения, по которым изучаются характеристики класса, не представляют множество других элементов класса, то после обучения будут получены очень неполные (и возможно ошибочные) знания об этом классе и нельзя ожидать хорошего распознавания.
При выборе расстояния (метрики) в пространстве наблюдений ( пока неизвестным способом) объекты, относящиеся к одному классу, должны быть близки один к другому. На рис.2.4,а представлен случай, когда расстояние Евклида неприемлемо, так как существуют точки, для которых внутриклассовые расстояние больше межклассовых, например r(X₁,X₂)>r(X₂,X₃), X₁,X₂₁, X₃₂.

Здесь целесообразно использовать расстояние Махаланобиса (2.6), которое ввиду диагональности ковариационной матрицы примет вид

Для всех точек представленного множества внутриклассовое расстояние Малаханобиса не больше межклассового.

Для сближения точек каждого класса можно задать преобразование – сжатие пространства к внутренним точкам (рис.2.4,б). Если бы пространство наблюдений было упругим и гибким, как резина, то это преобразование отражало бы характер деформации различных областей пространства, при котором точки одного класса максимально сближаются [4].Вопрос о выборе наилучшей метрики или наилучшего преобразования, сближающего точки одного класса, остается открытым.

Среди имеющихся решений (вариантов классификации) можно указать наилучшее. В практике оптимальное решение неизвестно, и применяются хорошие решения.
При формировании набора признаков, описывающих классы, предпочтение следует отдавать информативным признакам. Признак называется информативным, если он содержит информацию о различии

x₁

X₂

x₁

x₂

X₃

X₂

 ₂

 ₁

X₁

 ₂

 ₁

а б

Рис. 2.4

классов. На рис. 2.4 информативным признаком является признак x₂, а неинформативным – x₁. Неинформативный признак не содержит информации о различии классов.

<<< < Предыдущая 1 2 3 4 56 / 146 7 8 9 10 11 12 13 14 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
09.06.2015744.96 Кб40Kursovaya_rabota_Noxalogia4.doc
#
29.03.201643.25 Кб16kursovik (2).docx
#
21.08.20194.96 Mб109Kursovoe_proektirovanie.doc
#
14.04.2019955.9 Кб70Kurs_lektsy_po_istorii_SGU.doc
#
09.06.201547.82 Кб74kurs_plyazhny_turizm_Antalii.docx
#
27.09.20192.06 Mб13Kurs_TPR.doc
#
20.12.2018509.56 Кб19kyrsach (1).docx
#
29.03.201635.92 Кб211Lab 1.docx
#
09.06.2015172.54 Кб16lab-1.doc
#
20.11.201961.96 Кб3LADIN_A.S._modul_№2.docx
#
09.11.2019427.01 Кб8LCR.doc