Презентация на тему: Нелинейные

Добавил:

Studfiles2 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Санкт-Петербургский государственный электротехнический университет "ЛЭТИ"

Предмет:

Анализ и интерпретация данных

Файл:

Презентации по курсу Анализ и интерпретация данных / лекция Грачева.ppt

Скачиваний:

Добавлен:

01.05.2014

Размер:

204.29 Кб

Скачать

☆

Нелинейные	решающие функции
Введем понятие обобщенной линейной	решающей функции d(x)

Пусть размерность пространства равна n, тогда можно построить:

d(x) 1 1 (x) 2 2 (x) ... k

k может быть любым: k n, k n, k n , но обычно берут

- это полный набор ортогональных функций (это есть сложно) часто сводят к параметрической задаче(это лучше): i (x) xi2

k (x)

k n

,то есть

d(x)

1x12 . 2 x22 ... n xn2

	1	(x)		x 2
	1				12
2 (x)				x2
.
.			=	.		, n=k
.			=			, n=k
.				.
.				.

k (x)				xn2

n 1	- это нелинейная функция

- обобщенная линейная функция.

d(x) T x* n 1

Возьмем d(x) x T Ax	T x		- это обобщенная квадратичная форма;
Возьмем d(x) x T Ax	T x	n 1	- это обобщенная квадратичная форма;
		n 1	A – Некоторая симметрическая матрица.
d(x) можно разложить по компонентам:			n	n	n
d(x) можно разложить по компонентам:			d(x) aij xi x j		i xi	n 1
			d(x) aij xi x j		i xi	n 1
			i 1	j 1	i 1
Можно взяь xi* xi x j как новую переменную .
В пространстве с координатами x*		решающая функция будет линейной функцией.
	i

На рис. показаны классы, которые в исходном пространстве не делятся линейными решающими функциями, но можно сделать линейное разделение обобщенными линейными функциями, в пространстве с координатами , определяемыми коэффициентами квадратичной формы.

Вывод:

• Таким образом, если в исходном n- мерном пространстве построить линейные решающие функции нельзя, то при переходе в пространство размерности k>n вероятность построения линейных решающих функций увеличивается.

Статистические методы классификации

Исходные позиции: наши данные могут быть описаны с помощью вероятностных методов

Существует 2 подхода:	.

1.априорно знаем статистические распределения данных

2.априорно не знаем статистические распределения, а известны таблицы данных и выборки из этих статистических распределений.

Постановка задачи классификации как статистической задачи при известных вероятностных распределениях.

Пусть имеется генеральная совокупность П1 , П2 , соответствующая 1-ому и 2-ому классу.

x (x ,..., x		n	)T	Вероятностные распределения заданы априорно.
1
Пусть	П1 П2 0 (может быть и такое)				X1 , X 2	так
Наша задача – разбиение исходного пространства X на области
X X1 X 2				мы требуем, чтобы X1 X 2 0	x X
				x2

X 2

X 1 x1

Цель: разбить X на области так, чтобы:	x X1	x П1
	x X 2	x П2
Нам надо задать следующее:
Условные по классам функции распределения		f1 (x) f (x / П1 ),	f2 (x) f (x / П2 )

q1, q2 -априорная вероятность появления объекта из соответствующего класса q1 q2	1
Критерии качества, связанные с ошибками и стоимостями ошибок

Генеральная совокупность

решения	П1	П2
решения
	0	C(1/2)
	П1	0
	П2	0
	С(2/1)

Стоимости принятия решений:

x П1	отнесем к П2 , тогда стоимость С(2/1)
x П2	отнесем к П1 ; C(1/2)

C(1/1)=C(2/2)=0 - правильное решение;

На рис показаны условные плотности распределения по классам и граница решения . f (x / П1 ) f (x / П2 )

Вероятность принятия неправильного решения определяются таким образом

P(2 /1)
	f (x	/ П1 )dx
	X 2
P(1/ 2)
	f (x	/ П2 )dx
	X1

Таким образом заданы: П1	генеральные совокупности;
	генеральные совокупности;
П2
Условные плотности и априорные вероятности
x П1	x П2
q	q2
1	f2 (x) f (x / П2 )
f1 (x) f (x / П1 )	f2 (x) f (x / П2 )

Стоимости ошибок:

С(1/2) и С(2/1)

Задача состоит в разбиении пространства X на классы множества X1 и X2, соответствующие заданным классам. Рассмотрим эту задачу как оптимизационную с точки зрения минимизации среднего риска принятия неправильного решения.

Введем функционал качества как оценку	среднего риска: Q C(2 /1) q1 P(2 /1) C(1/ 2) q2 P(1/ 2)
это общие средние потери при принятии	решения.	min Q
Требуется найти такое разбиение пространства , которое дает
Эту величину нужно определить для решения нашей задачи.		X1 , X 2

Q C(2 /1)q1	f1 (x)dx C(1/ 2)q2		f2 (x)dx
.	X2	f1 (x)	X1
Обозначим (*)= C(1/ 2)q2 f2 (x) C(2 /1)q1

Данное выражение необходимо минимизировать при помощи выбора области X 1

Область X1 определяют таким образом, чтобы выражение (*) было 0

X1 : C(1/ 2)q2 f 2 (x) C(2 /1)q1 f1 (x) 0

f1 (x) (x)

f 2 (xдалее) мы получаем следующее выражение для минимального риска:

X 1 :

f1 (x)

C(1/ 2)q2

x П1

, то есть получаем, что x относится к Генеральной

f 2 (x)

C(2 /1)q1

П1

совокупности

Область

X 2 имеет следующий вид: X 2 :

f1 (x)

C(1/ 2)q2

x П2

f 2 (x)

C(2 /1)q1

Это правило для полного байесовского риска

f1 (x)

(x)

эта функция называется отношением правдоподобия.

f2 (x)

Введем порог:

C(1/ 2)q2

тогда решающее правило принимает вид:

(x) K

x П1

C(2 /1)q1

x П2

(x) K

Часто априорные вероятности неизвестны и их нужно как-то оценить. Стоимость ошибки – величина субъективная

Когда ошибки не заданы, мы можем построить более простое решающее правило на основе теоремы Байеса

f (x, Пi ) - совместная функция распределения

По теореме Байеса, можно разложить совместную плотность распределения:


f (x, Пi ) f (x / Пi )qi f (Пi / x) f (x)
Из данного разложения мы можем получить:	f (Пi / x)	qi f (x / Пi )

это апостериорная вероятность того, что x	относится к Пi		f (x)
			qi - априорная вероятность

Чтобы использовать данное правило необходимо вычислить безусловную плотность вероятности f (x) она имеет вид f (x) f (x / П1 )q1 f (x / П2 )q2 ( это результат интегрирования)

Отсюда следует, что правило принятия решения сводится к нахождению:

max qi f (x / Пi )

То есть номер класса равен: i arg min qi f (x / Пi ) x Пi

i 1,2

Для

X1X 2

(случай двух классов), правило решения принимает вид:

:q1 f (x / П1 ) q2 f (x / П2 )

f (x / П1 )	q2	x П1
f (x / П2 )	q1

Таким образом, мы получили отношение правдоподобия:

(x) q2 x П1 q1

разница с предыдущим случаем в том, что из этого решения исчезла стоимость ошибок. Здесь ошибки находятся в следующем соотношении: С(2/1) = C(1/2) - они равны.

Следовательно, нами получен метод принятия решений, основанный на вычислении

апостериорных вероятностей

f (Пi / x) Mqi f (x / Пi )qi f (x / П i )

i 1

f(x) qi f (x / Пi )

i 1

Соседние файлы в папке Презентации по курсу Анализ и интерпретация данных

#
01.05.201488.06 Кб93лекция Белова.ppt
#
01.05.2014204.29 Кб89лекция Грачева.ppt
#
01.05.2014490.5 Кб89Лекция Грачева2.ppt
#
01.05.2014101.89 Кб87Лекция Злобина.ppt
#
01.05.2014171.52 Кб71Лекция Митягина.ppt
#
01.05.2014347.65 Кб74Лекция Митягина2.ppt
#
01.05.2014275.46 Кб75Лекция Моя.ppt

Нелинейные

Возьмем d(x) x T Ax

Вывод:

Статистические методы классификации

Постановка задачи классификации как статистической задачи при известных вероятностных распределениях.

Цель: разбить X на области так, чтобы:

Стоимости принятия решений:

Стоимости ошибок:

f (x, Пi ) - совместная функция распределения