книги из ГПНТБ / Кориков А.М. Математические методы планирования эксперимента учеб. пособие
.pdf-2 4 0 -
чу разбиения множества подобных вдтд5вддуумов на достаточ
но однородные группы. Впрочем, в литературе не всегда с о храняется четкое разграничение в терминологии; часто те задачи, которые мы отнесли к даскригяинантному анализу, на зывают также задачами классификации.
Чтобы дать некоторое представление о даюкриминаятном . анализе, рассмотрим лишь одну модель дискршдинации, в к о
торой используются байесовские представления. Допустим на
личие всего |
двух генеральных |
совокупностей JC и |
JC |
с |
||||
плотностями |
вероятностей |
( х |
) |
и |
р ^ ( э с ) . |
Далее, |
пусть |
|
известны априорные вероятности |
Ч |
и |
q. того, |
что |
наблюде- |
пае ведется над индивидуумом, на пршадлежащим соответст
венно |
совокупностям ЗГ, и |
JT^ .Наша задача заключается |
в том, |
||||||
чтобы |
разделить |
область |
возможных результатов |
эксперимен |
|||||
та на |
две |
подобласти |
и |
0г , |
соответствующие |
двум |
сово |
||
купностям |
ЗГ и |
. |
|
|
|
|
|
|
|
Из теоремы |
Байеса следует, |
что условная |
вероятность |
||||||
ч |
что |
|
|
|
|
• |
|
|
(при |
того, |
наблюдение проведено над совокупностью РГ |
||||||||
условии, |
что результаты |
заданы вектором х ) , |
равна |
|
Вероятность неправильной дискриминации будет минималь на тогда, когда мы выберем ту генеральную совокупность, ко торой соответствует наибольшая условная вероятность. Гипотеза о принадлежности выборки х к совокупности Зц будет принята, если •*
241
Следовательно, прявкло гфинятия ряяннин задается соотно— гошинми
а * |
* 4 t M * f c |
( 9 . 4 ) |
Допустим теперь, что ив нмвви дело о двумя многомер ными нормальными функциями расдределвния: имевшими одну и ту аю иаымцтыур нам кшцриациоаную иятрипу L и отличаю щимися, следовательно, только своими шюештичбсяпйГЗДи— даниями, и р ^ . Тогда после преобразований правило ( 9 . 4 )
принятия ринвнии прявмвт вид
В частном случае, когда k • I , С а к * 0 . решение о
принадлежности внборки к совокупности 7Г, будет задаваться верах,евствии
Левая часть неравенства - это ддакриминантная функция. Она представляет собой лилейную функции результатов наблю дения
Это есть (Ъ.-1)-мервая гиперплоскость, разбивающая V. -мер-
ное пространство |
на две части С^и 0 .^ . |
Рассмотрим теперь поведение случайной величины |
|
и - Г С ( V |
1 ( j i ^ j t J T L " ( f t - ^ , |
значением которой определяется принятие одной из гипотез
3U, или |
Здесь нужно найти две функции распределения: |
|||
одну, когда |
х |
принадлежит |
к I t , , другую - к |
Обозна |
чим через и,, и |
и г случайные |
величины, соответствующие этим |
функциям распределения. Простые вычисления показывают, что
где
Эта величина называется "расстоянием" между двумя совокуп ностями Х п и 3 ^ . Поясним геометрический смысл этой вели чины на рис.9.4.
- • 7 0 I |
О |
С |
l o t |
|
Рис.9.4 |
|
|
№ видим, что центры двух |
обсуждаемых функций распределе |
ния расположены симметрично относительно начала отсчета и находятся от неге на расстоянии ^-аС . Вероятности двух
- 2 4 2 > -
возможных ошибочных решений задастся двумя заштрихованны-
ш площадями под крыльями распределений |
(в одной случае |
это площадь под кривой в интервале от - |
ею до с , в дру |
гом - от с до + оо , где с » i i v K . ) i |
|
Из вышеизложенного следует, что в многомерных задачах результаты диокримантного анализа сложным образом зависят от обоих параметров функции распределения - вектора мате
матических ожиданий я ковариационной матрицы.
К О М М Е Н Т А Р И И
Метод главных компонент имеет уже семидесятилетнею., ис
торию: он был предложен еще в 1901 г. Пирсоном и позднее вновь открыт и детально разработан Хотеллингом в 1933 году.
Столь же давнюю историю имеет и факторный анализ . Эти ме
тоды хорошо изучены с |
теоретических позиций (см.например, |
книги Т.Андерсона [ з ] , |
Д.Лоули в А.Максвелла [ 1 9 ] , С.Р.Рао |
[ 2 9 ] . СУилкса [ э ф , |
но имеют совсем малое применение. |
Объясняется это прежде всего тем, что природа надежно ох- - раняет свен тайны. Чтобы проникнуть в них, надо ставить или активный эксперимент, иди научиться их отгадывать. Фактор ный анализ и метод главных компонент служат лишь средства ми, облегчающими отгадывание". В последнее время появились
работы, призывающие применять эти метода в качестве вспомо гательных приемов в самых развхх>бразных.задачах (см.книгу
В § 9 -4 изложена лишь простейшая модель дискриминация.
— 2 М -
Желчггдгм познакомиться с |
двскриминантншл анализом б о |
лее; подробно, рекомендуем обратиться к обзору, составлен-. |
|
нет ВЛЗ»Урбахои [ 3 7 ] . Здесь |
содержится библиография работ |
но довслхтаавЕШТНоцу анализу, |
включающая около 500 наиме |
нований, зга них на русском языке — 32 .
Г Л А ВА X
ПРОгаОЗИРОВАНЙЕ ВРЕМЕННЫХ РЯДОВ
§ I O - I . В в о д н а в з а м е ч а н и я и п о с т а н о в к а з а д а ч и
ГЛногие задачи науки и техники связана с процессами,
которые можно представить как семейство случайных величин
(случайный процесс) на некотором интервале |
времени |
Т . |
|
Значение процесса |
^ в каждый момент *Ь |
является |
случай |
ной величиной. Такие процессы называются |
в р е м е н н ы |
||
м и р я д а м и . |
Примерами временных рядов служат:, на |
пряжение в цепи в течение некоторого промежутка времени, высота волны в море.
Временные ряды возникают также при наложении случайных
флуктуации на систематическую (регулярную) составляющую.
Разработаны различные методы анализа временных рядов. Многие из этих методов созданы для оценки регулири->* сос
тавляющей, возникающей во временных рядах при "усреднении", в более или менее эмпирическом-смысле, случайных флуктуа ции. Ниже мы познакомимся с задачей прогнозирования вре менных рядов в следующей постановке:
Имеется последовательность наблюдений • -
где Is к, - регулярная (систематическая) составляющая
|
|
|
|
|
|
- 2 , 4 6 - |
|
|
|
|
изучаемого процесса ; |
С ^ |
- аддитивная |
случайная |
помеха, |
||||||
имеющая нормальный закон распределения с |
нулевым средним |
|||||||||
и дисперсией 6*{сУ; К - номер замера (наблюдения). |
|
|
||||||||
Условимся |
называть регулярную |
составляющую "§ ^ |
м о |
|||||||
д е л ь ю |
процесса. |
|
|
|
|
|
|
|||
Чаще всего модель процесса представляют в виде по |
||||||||||
линома порядка |
я. : |
|
|
|
' |
|
|
|||
|
5 |
k |
Н |
i\ |
|
|
|
|
(юл) |
|
Кроме полиномиальных возможны и другие виды моделей, |
||||||||||
например, |
экспоненциальные |
или тригонометрические. |
|
|
||||||
|
Задача прогнозирования состоит в предсказании значе |
|||||||||
ния |
ц. |
, отстоящего на |
ж. шагов от последнего наблю- |
|||||||
денного значения |
|
. Эта |
задача |
включает несколько |
эта |
|||||
пов. |
|
|
|
|
|
|
|
|
|
|
|
1 . Выбор интервала дискретности наблюдений |
и интер |
||||||||
вале |
наблюдения |
Т . |
|
|
|
|
|
|
||
|
2 . Выбор модели процесса, т . е . определение характера |
|||||||||
изменения регулярной |
составляющей Tg , |
|
|
|
||||||
|
3 . Вычисление оценок коэффициентов модели по значени |
|||||||||
ям |
1^, , |
наблюденным на интервале |
Т с |
дискретностью |
A " t |
|||||
(эта процедура называется сглаживанием). |
|
|
||||||||
|
4 . Использование полученной модели для предсказания |
|||||||||
значения |
ц,. |
|
|
|
|
|
|
|
|
|
|
5 . Оценка точности предсказания. |
|
|
|
||||||
|
Подробное |
рассмотрение |
задачи |
прогнозирования |
начнём с |
есновного этапа - этапа сглаживания.
§ 1 0 - 2 . М е т о д |
э к с п о н е н ц и а л ь н о г о |
||||
|
|
|
с г л а ж и в а н и я |
|
|
Пусть |
имеется ряд |
значений |
^ |
vj,^ , наблю |
|
денных на |
интервале |
времени Т |
с интервалом дискретно |
||
сти д"Ь , |
так что |
Т |
=* ( - hl - A) |
д"Ь. |
|
Искомая модель |
задана |
в виде полинома |
степени |
п,; |
|
коэффициенты которого а о , |
о ^ , . . . , а Л |
|
неизвестны. |
||
Для получения |
опенок |
неизвестных |
|
коэффициентов |
|
естественно брать взвешенные значения наблюдений |
i j ^ , |
||||
К = 4 , 2 . , 3 , . . . , |
J f . |
, причем веса |
t J ^ убывают |
соот |
ветственно возрасту наблюдений.
Взвёшгаание наблюдений позволяет корректировать доэф-
фшхиенты подели по мере поступления новых данных ; при
этом давние наблюдения как бы "забываются", так как их
вклад в•коррекцию пропорционален их весу.
Для получения искомых оценок используется процедура,
называемая сглаживанием.
О п е р а т о р |
п р о с т о г о |
э к с п о н е н |
||
ц и а л ь н о г о |
с г л а ж и в а н и я |
|||
Предположим, |
что моделью процесса можне считать пос |
|||
тоянную величину |
§ |
= а, |
. Так как" наблюдения включают в |
себя шум, то выражение для текущего Ч. -го наблюдения име
ет вид:
v a * v
- 2 Л 8 -
Для оценки о. можно использовать метод скользящегосреднего. Согласно этому методу, среднее из наблюде нии рвзно
* ь ! |
я |
= т ы * — |
( 1 0 - г ) |
• |
Отсюда видно, что для внчисления скользящего |
среднего |
|
необходимо сохранять |
большое количество информация ( J f - I |
последних данных).
Для сокращения необходимого объема информации можно
вместо Л воспользоваться оценкой этой величины
*_
. Подставив в выражение |
( 1 0 . 2 ) |
вместо действительно из |
меренного значения ^ ^ |
величину |
^ , получим |
Из этой формула следует, что для |
вычисления |
С ^ ( ^ |
) |
|||||
требуется |
сохранение только |
величины. Ц ^ . |
|
|
|
|||
Величину |
( ^ ) , вычисленную |
по формуле |
( 1 0 . 3 ) , |
|
||||
называют сглаженным значением текущего наблюдения |
^ . |
|
||||||
Коэффициент —у |
обозначают |
через |
оС |
и называют |
постоян- |
|||
ной сглаживания. Процедура |
вычисления |
по формуле (10 . 3) на |
||||||
зывается |
с г л а ж и в а н и е м . |
Сглаженное |
значение |
и , |
||||
выраженное через |
oL , имеет |
вид: |
|
|
|
|
|
-ZkS-
щ е |
^ ^ ( . ^ J - |
отека среднего |
значения ^ |
, вы |
|
|
|
|
|
|
|
численная на основании нового измеренного значения ; |
|
||||
|
C ^ f « j j |
- |
предадущая ооэнка |
^ . |
|
|
Если вместо аредндущей сглаженной величины |
|
|||
и о д с т а А |
ей выражение через еще более ранние величины, то |
||||
получим |
|
|
|
|
C k l V ) - ^ i l |
* ( < - ^ [ ^ * t < - ^ ) C 1 |
b |
. i l |
( i i ) ] - |
||
ы |
|
i |
к. |
|
|
|
i - f l 4 |
7 * " * |
- |
7 |
» |
(10.5) |
|
Отсюда видно, |
что функция |
( ^ я в л я е т с я |
линейной комби- |
напией всех прошлых каблхщеянш значений. Веса, прнписнваемае этим значениям, уменьшаются с "возрастом" данных.
Операция, производимая над любым рядом данных согласно формуле ( 1 0 . 4 ) , называется экспоненциальным сглаживанием. Осуществляя в правой части выражения (10,5) предельный пе
реход, получим оператор экспоненция тгыгого сглаживания в интегральной форме: