Добавил:

ivanov666 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Башкирский Государственный Аграрный Университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

книги из ГПНТБ / Кориков А.М. Математические методы планирования эксперимента учеб. пособие

.pdf

Скачиваний:

Добавлен:

23.10.2023

Размер:

7.9 Mб

Скачать

☆

<<< < Предыдущая 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 2425 / 2925 26 27 28 29 > Следующая >>>

-2 4 0 -

чу разбиения множества подобных вдтд5вддуумов на достаточ

но однородные группы. Впрочем, в литературе не всегда с о храняется четкое разграничение в терминологии; часто те задачи, которые мы отнесли к даскригяинантному анализу, на зывают также задачами классификации.

Чтобы дать некоторое представление о даюкриминаятном . анализе, рассмотрим лишь одну модель дискршдинации, в к о

торой используются байесовские представления. Допустим на

личие всего	двух генеральных	совокупностей JC и					JC	с
плотностями	вероятностей	( х	)	и	р ^ ( э с ) .	Далее,		пусть
известны априорные вероятности			Ч	и	q. того,	что	наблюде-

пае ведется над индивидуумом, на пршадлежащим соответст

венно	совокупностям ЗГ, и				JT^ .Наша задача заключается				в том,
чтобы	разделить		область	возможных результатов				эксперимен
та на	две	подобласти		и	0г ,	соответствующие		двум	сово
купностям		ЗГ и	.
Из теоремы			Байеса следует,			что условная	вероятность
ч	что					•			(при
того,		наблюдение проведено над совокупностью РГ
условии,		что результаты		заданы вектором х ) ,			равна

Вероятность неправильной дискриминации будет минималь на тогда, когда мы выберем ту генеральную совокупность, ко торой соответствует наибольшая условная вероятность. Гипотеза о принадлежности выборки х к совокупности Зц будет принята, если •*

241

Следовательно, прявкло гфинятия ряяннин задается соотно— гошинми

а *

* 4 t M * f c

( 9 . 4 )

Допустим теперь, что ив нмвви дело о двумя многомер ными нормальными функциями расдределвния: имевшими одну и ту аю иаымцтыур нам кшцриациоаную иятрипу L и отличаю щимися, следовательно, только своими шюештичбсяпйГЗДи— даниями, и р ^ . Тогда после преобразований правило ( 9 . 4 )

принятия ринвнии прявмвт вид

В частном случае, когда k • I , С а к * 0 . решение о

принадлежности внборки к совокупности 7Г, будет задаваться верах,евствии

Левая часть неравенства - это ддакриминантная функция. Она представляет собой лилейную функции результатов наблю дения

Это есть (Ъ.-1)-мервая гиперплоскость, разбивающая V. -мер-

ное пространство	на две части С^и 0 .^ .
Рассмотрим теперь поведение случайной величины
и - Г С ( V	1 ( j i ^ j t J T L " ( f t - ^ ,

значением которой определяется принятие одной из гипотез

3U, или	Здесь нужно найти две функции распределения:
одну, когда	х	принадлежит	к I t , , другую - к	Обозна
чим через и,, и		и г случайные	величины, соответствующие этим

функциям распределения. Простые вычисления показывают, что

где

Эта величина называется "расстоянием" между двумя совокуп ностями Х п и 3 ^ . Поясним геометрический смысл этой вели чины на рис.9.4.

- • 7 0 I	О	С	l o t
	Рис.9.4
№ видим, что центры двух	обсуждаемых функций распределе

ния расположены симметрично относительно начала отсчета и находятся от неге на расстоянии ^-аС . Вероятности двух

- 2 4 2 > -

возможных ошибочных решений задастся двумя заштрихованны-

ш площадями под крыльями распределений	(в одной случае
это площадь под кривой в интервале от -	ею до с , в дру
гом - от с до + оо , где с » i i v K . ) i

Из вышеизложенного следует, что в многомерных задачах результаты диокримантного анализа сложным образом зависят от обоих параметров функции распределения - вектора мате

матических ожиданий я ковариационной матрицы.

К О М М Е Н Т А Р И И

Метод главных компонент имеет уже семидесятилетнею., ис

торию: он был предложен еще в 1901 г. Пирсоном и позднее вновь открыт и детально разработан Хотеллингом в 1933 году.

Столь же давнюю историю имеет и факторный анализ . Эти ме

тоды хорошо изучены с	теоретических позиций (см.например,
книги Т.Андерсона [ з ] ,	Д.Лоули в А.Максвелла [ 1 9 ] , С.Р.Рао
[ 2 9 ] . СУилкса [ э ф ,	но имеют совсем малое применение.

Объясняется это прежде всего тем, что природа надежно ох- - раняет свен тайны. Чтобы проникнуть в них, надо ставить или активный эксперимент, иди научиться их отгадывать. Фактор ный анализ и метод главных компонент служат лишь средства ми, облегчающими отгадывание". В последнее время появились

работы, призывающие применять эти метода в качестве вспомо гательных приемов в самых развхх>бразных.задачах (см.книгу

В § 9 -4 изложена лишь простейшая модель дискриминация.

— 2 М -

Желчггдгм познакомиться с	двскриминантншл анализом б о
лее; подробно, рекомендуем обратиться к обзору, составлен-.
нет ВЛЗ»Урбахои [ 3 7 ] . Здесь	содержится библиография работ
но довслхтаавЕШТНоцу анализу,	включающая около 500 наиме

нований, зга них на русском языке — 32 .

Г Л А ВА X

ПРОгаОЗИРОВАНЙЕ ВРЕМЕННЫХ РЯДОВ

§ I O - I . В в о д н а в з а м е ч а н и я и п о с т а н о в к а з а д а ч и

ГЛногие задачи науки и техники связана с процессами,

которые можно представить как семейство случайных величин

(случайный процесс) на некотором интервале		времени	Т .
Значение процесса	^ в каждый момент *Ь	является	случай
ной величиной. Такие процессы называются		в р е м е н н ы
м и р я д а м и .	Примерами временных рядов служат:, на

пряжение в цепи в течение некоторого промежутка времени, высота волны в море.

Временные ряды возникают также при наложении случайных

флуктуации на систематическую (регулярную) составляющую.

Разработаны различные методы анализа временных рядов. Многие из этих методов созданы для оценки регулири->* сос

тавляющей, возникающей во временных рядах при "усреднении", в более или менее эмпирическом-смысле, случайных флуктуа ции. Ниже мы познакомимся с задачей прогнозирования вре менных рядов в следующей постановке:

Имеется последовательность наблюдений • -

где Is к, - регулярная (систематическая) составляющая

						- 2 , 4 6 -
изучаемого процесса ;					С ^	- аддитивная		случайная	помеха,
имеющая нормальный закон распределения с								нулевым средним
и дисперсией 6*{сУ; К - номер замера (наблюдения).
Условимся			называть регулярную				составляющую "§ ^			м о
д е л ь ю		процесса.
Чаще всего модель процесса представляют в виде по
линома порядка			я. :					'
	5	k	Н	i\					(юл)
Кроме полиномиальных возможны и другие виды моделей,
например,		экспоненциальные				или тригонометрические.
	Задача прогнозирования состоит в предсказании значе
ния	ц.	, отстоящего на				ж. шагов от последнего наблю-
денного значения					. Эта	задача	включает несколько			эта
пов.
	1 . Выбор интервала дискретности наблюдений								и интер
вале	наблюдения			Т .
	2 . Выбор модели процесса, т . е . определение характера
изменения регулярной					составляющей Tg ,
	3 . Вычисление оценок коэффициентов модели по значени
ям	1^, ,	наблюденным на интервале					Т с	дискретностью		A " t
(эта процедура называется сглаживанием).
	4 . Использование полученной модели для предсказания
значения		ц,.
	5 . Оценка точности предсказания.
	Подробное		рассмотрение			задачи	прогнозирования		начнём с

есновного этапа - этапа сглаживания.

§ 1 0 - 2 . М е т о д			э к с п о н е н ц и а л ь н о г о
			с г л а ж и в а н и я
Пусть	имеется ряд		значений	^	vj,^ , наблю
денных на	интервале	времени Т		с интервалом дискретно
сти д"Ь ,	так что	Т	=* ( - hl - A)	д"Ь.

Искомая модель	задана	в виде полинома		степени	п,;
коэффициенты которого а о ,		о ^ , . . . , а Л		неизвестны.
Для получения	опенок	неизвестных		коэффициентов
естественно брать взвешенные значения наблюдений					i j ^ ,
К = 4 , 2 . , 3 , . . . ,	J f .	, причем веса	t J ^ убывают		соот

ветственно возрасту наблюдений.

Взвёшгаание наблюдений позволяет корректировать доэф-

фшхиенты подели по мере поступления новых данных ; при

этом давние наблюдения как бы "забываются", так как их

вклад в•коррекцию пропорционален их весу.

Для получения искомых оценок используется процедура,

называемая сглаживанием.


О п е р а т о р		п р о с т о г о		э к с п о н е н
ц и а л ь н о г о			с г л а ж и в а н и я
Предположим,	что моделью процесса можне считать пос
тоянную величину	§	= а,	. Так как" наблюдения включают в

себя шум, то выражение для текущего Ч. -го наблюдения име

ет вид:

v a * v

- 2 Л 8 -

Для оценки о. можно использовать метод скользящегосреднего. Согласно этому методу, среднее из наблюде нии рвзно

* ь !	я	= т ы * —	( 1 0 - г )
•	Отсюда видно, что для внчисления скользящего		среднего
необходимо сохранять		большое количество информация ( J f - I

последних данных).

Для сокращения необходимого объема информации можно

вместо Л воспользоваться оценкой этой величины

. Подставив в выражение	( 1 0 . 2 )	вместо действительно из
меренного значения ^ ^	величину	^ , получим


Из этой формула следует, что для					вычисления	С ^ ( ^		)
требуется	сохранение только		величины. Ц ^ .
Величину		( ^ ) , вычисленную			по формуле	( 1 0 . 3 ) ,
называют сглаженным значением текущего наблюдения							^ .
Коэффициент —у		обозначают	через	оС	и называют		постоян-
ной сглаживания. Процедура			вычисления		по формуле (10 . 3) на
зывается	с г л а ж и в а н и е м .			Сглаженное		значение		и ,
выраженное через		oL , имеет	вид:

-ZkS-

щ е	^ ^ ( . ^ J -		отека среднего	значения ^	, вы
щ е
численная на основании нового измеренного значения ;
	C ^ f « j j	-	предадущая ооэнка	^ .
	Если вместо аредндущей сглаженной величины
и о д с т а А		ей выражение через еще более ранние величины, то
получим

C k l V ) - ^ i l	* ( < - ^ [ ^ * t < - ^ ) C 1			b	. i l	( i i ) ] -
ы		i	к.
i - f l 4		7 * " *	-	7	»	(10.5)
Отсюда видно,	что функция		( ^ я в л я е т с я			линейной комби-

напией всех прошлых каблхщеянш значений. Веса, прнписнваемае этим значениям, уменьшаются с "возрастом" данных.

Операция, производимая над любым рядом данных согласно формуле ( 1 0 . 4 ) , называется экспоненциальным сглаживанием. Осуществляя в правой части выражения (10,5) предельный пе

реход, получим оператор экспоненция тгыгого сглаживания в интегральной форме:

<<< < Предыдущая 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 2425 / 2925 26 27 28 29 > Следующая >>>

Соседние файлы в папке книги из ГПНТБ