Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Кориков А.М. Математические методы планирования эксперимента учеб. пособие

.pdf
Скачиваний:
26
Добавлен:
23.10.2023
Размер:
7.9 Mб
Скачать

-2 4 0 -

чу разбиения множества подобных вдтд5вддуумов на достаточ­

но однородные группы. Впрочем, в литературе не всегда с о ­ храняется четкое разграничение в терминологии; часто те задачи, которые мы отнесли к даскригяинантному анализу, на­ зывают также задачами классификации.

Чтобы дать некоторое представление о даюкриминаятном . анализе, рассмотрим лишь одну модель дискршдинации, в к о ­

торой используются байесовские представления. Допустим на­

личие всего

двух генеральных

совокупностей JC и

JC

с

плотностями

вероятностей

( х

)

и

р ^ ( э с ) .

Далее,

пусть

известны априорные вероятности

Ч

и

q. того,

что

наблюде-

пае ведется над индивидуумом, на пршадлежащим соответст­

венно

совокупностям ЗГ, и

JT^ .Наша задача заключается

в том,

чтобы

разделить

область

возможных результатов

эксперимен­

та на

две

подобласти

и

0г ,

соответствующие

двум

сово­

купностям

ЗГ и

.

 

 

 

 

 

 

Из теоремы

Байеса следует,

что условная

вероятность

ч

что

 

 

 

 

 

 

(при

того,

наблюдение проведено над совокупностью РГ

условии,

что результаты

заданы вектором х ) ,

равна

 

Вероятность неправильной дискриминации будет минималь­ на тогда, когда мы выберем ту генеральную совокупность, ко­ торой соответствует наибольшая условная вероятность. Гипотеза о принадлежности выборки х к совокупности Зц будет принята, если •*

241

Следовательно, прявкло гфинятия ряяннин задается соотно— гошинми

а *

* 4 t M * f c

( 9 . 4 )

Допустим теперь, что ив нмвви дело о двумя многомер­ ными нормальными функциями расдределвния: имевшими одну и ту аю иаымцтыур нам кшцриациоаную иятрипу L и отличаю­ щимися, следовательно, только своими шюештичбсяпйГЗДи— даниями, и р ^ . Тогда после преобразований правило ( 9 . 4 )

принятия ринвнии прявмвт вид

В частном случае, когда k • I , С а к * 0 . решение о

принадлежности внборки к совокупности 7Г, будет задаваться верах,евствии

Левая часть неравенства - это ддакриминантная функция. Она представляет собой лилейную функции результатов наблю­ дения

Это есть (Ъ.-1)-мервая гиперплоскость, разбивающая V. -мер-

ное пространство

на две части С^и 0 .^ .

Рассмотрим теперь поведение случайной величины

и - Г С ( V

1 ( j i ^ j t J T L " ( f t - ^ ,

значением которой определяется принятие одной из гипотез

3U, или

Здесь нужно найти две функции распределения:

одну, когда

х

принадлежит

к I t , , другую - к

Обозна­

чим через и,, и

и г случайные

величины, соответствующие этим

функциям распределения. Простые вычисления показывают, что

где

Эта величина называется "расстоянием" между двумя совокуп­ ностями Х п и 3 ^ . Поясним геометрический смысл этой вели­ чины на рис.9.4.

- • 7 0 I

О

С

l o t

 

Рис.9.4

 

№ видим, что центры двух

обсуждаемых функций распределе­

ния расположены симметрично относительно начала отсчета и находятся от неге на расстоянии ^-аС . Вероятности двух

- 2 4 2 > -

возможных ошибочных решений задастся двумя заштрихованны-

ш площадями под крыльями распределений

(в одной случае

это площадь под кривой в интервале от -

ею до с , в дру­

гом - от с до + оо , где с » i i v K . ) i

 

Из вышеизложенного следует, что в многомерных задачах результаты диокримантного анализа сложным образом зависят от обоих параметров функции распределения - вектора мате­

матических ожиданий я ковариационной матрицы.

К О М М Е Н Т А Р И И

Метод главных компонент имеет уже семидесятилетнею., ис­

торию: он был предложен еще в 1901 г. Пирсоном и позднее вновь открыт и детально разработан Хотеллингом в 1933 году.

Столь же давнюю историю имеет и факторный анализ . Эти ме­

тоды хорошо изучены с

теоретических позиций (см.например,

книги Т.Андерсона [ з ] ,

Д.Лоули в А.Максвелла [ 1 9 ] , С.Р.Рао

[ 2 9 ] . СУилкса [ э ф ,

но имеют совсем малое применение.

Объясняется это прежде всего тем, что природа надежно ох- - раняет свен тайны. Чтобы проникнуть в них, надо ставить или активный эксперимент, иди научиться их отгадывать. Фактор­ ный анализ и метод главных компонент служат лишь средства­ ми, облегчающими отгадывание". В последнее время появились

работы, призывающие применять эти метода в качестве вспомо­ гательных приемов в самых развхх>бразных.задачах (см.книгу

В § 9 -4 изложена лишь простейшая модель дискриминация.

— 2 М -

Желчггдгм познакомиться с

двскриминантншл анализом б о ­

лее; подробно, рекомендуем обратиться к обзору, составлен-.

нет ВЛЗ»Урбахои [ 3 7 ] . Здесь

содержится библиография работ

но довслхтаавЕШТНоцу анализу,

включающая около 500 наиме­

нований, зга них на русском языке — 32 .

Г Л А ВА X

ПРОгаОЗИРОВАНЙЕ ВРЕМЕННЫХ РЯДОВ

§ I O - I . В в о д н а в з а м е ч а н и я и п о с ­ т а н о в к а з а д а ч и

ГЛногие задачи науки и техники связана с процессами,

которые можно представить как семейство случайных величин

(случайный процесс) на некотором интервале

времени

Т .

Значение процесса

^ в каждый момент

является

случай­

ной величиной. Такие процессы называются

в р е м е н н ы ­

м и р я д а м и .

Примерами временных рядов служат:, на­

пряжение в цепи в течение некоторого промежутка времени, высота волны в море.

Временные ряды возникают также при наложении случайных

флуктуации на систематическую (регулярную) составляющую.

Разработаны различные методы анализа временных рядов. Многие из этих методов созданы для оценки регулири->* сос­

тавляющей, возникающей во временных рядах при "усреднении", в более или менее эмпирическом-смысле, случайных флуктуа­ ции. Ниже мы познакомимся с задачей прогнозирования вре­ менных рядов в следующей постановке:

Имеется последовательность наблюдений • -

где Is к, - регулярная (систематическая) составляющая

 

 

 

 

 

 

- 2 , 4 6 -

 

 

 

изучаемого процесса ;

С ^

- аддитивная

случайная

помеха,

имеющая нормальный закон распределения с

нулевым средним

и дисперсией 6*{сУ; К - номер замера (наблюдения).

 

 

Условимся

называть регулярную

составляющую "§ ^

м о ­

д е л ь ю

процесса.

 

 

 

 

 

 

Чаще всего модель процесса представляют в виде по­

линома порядка

я. :

 

 

 

'

 

 

 

5

k

Н

i\

 

 

 

 

(юл)

Кроме полиномиальных возможны и другие виды моделей,

например,

экспоненциальные

или тригонометрические.

 

 

 

Задача прогнозирования состоит в предсказании значе­

ния

ц.

, отстоящего на

ж. шагов от последнего наблю-

денного значения

 

. Эта

задача

включает несколько

эта­

пов.

 

 

 

 

 

 

 

 

 

 

 

1 . Выбор интервала дискретности наблюдений

и интер­

вале

наблюдения

Т .

 

 

 

 

 

 

 

2 . Выбор модели процесса, т . е . определение характера

изменения регулярной

составляющей Tg ,

 

 

 

 

3 . Вычисление оценок коэффициентов модели по значени­

ям

1^, ,

наблюденным на интервале

Т с

дискретностью

A " t

(эта процедура называется сглаживанием).

 

 

 

4 . Использование полученной модели для предсказания

значения

ц,.

 

 

 

 

 

 

 

 

 

5 . Оценка точности предсказания.

 

 

 

 

Подробное

рассмотрение

задачи

прогнозирования

начнём с

есновного этапа - этапа сглаживания.

§ 1 0 - 2 . М е т о д

э к с п о н е н ц и а л ь н о г о

 

 

 

с г л а ж и в а н и я

 

Пусть

имеется ряд

значений

^

vj,^ , наблю­

денных на

интервале

времени Т

с интервалом дискретно­

сти д"Ь ,

так что

Т

=* ( - hl - A)

д"Ь.

 

Искомая модель

задана

в виде полинома

степени

п,;

коэффициенты которого а о ,

о ^ , . . . , а Л

 

неизвестны.

Для получения

опенок

неизвестных

 

коэффициентов

естественно брать взвешенные значения наблюдений

i j ^ ,

К = 4 , 2 . , 3 , . . . ,

J f .

, причем веса

t J ^ убывают

соот­

ветственно возрасту наблюдений.

Взвёшгаание наблюдений позволяет корректировать доэф-

фшхиенты подели по мере поступления новых данных ; при

этом давние наблюдения как бы "забываются", так как их

вклад в•коррекцию пропорционален их весу.

Для получения искомых оценок используется процедура,

называемая сглаживанием.

О п е р а т о р

п р о с т о г о

э к с п о н е н ­

ц и а л ь н о г о

с г л а ж и в а н и я

Предположим,

что моделью процесса можне считать пос­

тоянную величину

§

= а,

. Так как" наблюдения включают в

себя шум, то выражение для текущего Ч. -го наблюдения име­

ет вид:

v a * v

- 2 Л 8 -

Для оценки о. можно использовать метод скользящегосреднего. Согласно этому методу, среднее из наблюде­ нии рвзно

* ь !

я

= т ы * —

( 1 0 - г )

Отсюда видно, что для внчисления скользящего

среднего

необходимо сохранять

большое количество информация ( J f - I

последних данных).

Для сокращения необходимого объема информации можно

вместо Л воспользоваться оценкой этой величины

*_

. Подставив в выражение

( 1 0 . 2 )

вместо действительно из­

меренного значения ^ ^

величину

^ , получим

Из этой формула следует, что для

вычисления

С ^ ( ^

)

требуется

сохранение только

величины. Ц ^ .

 

 

 

Величину

( ^ ) , вычисленную

по формуле

( 1 0 . 3 ) ,

 

называют сглаженным значением текущего наблюдения

^ .

 

Коэффициент —у

обозначают

через

оС

и называют

постоян-

ной сглаживания. Процедура

вычисления

по формуле (10 . 3) на­

зывается

с г л а ж и в а н и е м .

Сглаженное

значение

и ,

выраженное через

oL , имеет

вид:

 

 

 

 

 

-ZkS-

щ е

^ ^ ( . ^ J -

отека среднего

значения ^

, вы­

 

 

 

 

 

численная на основании нового измеренного значения ;

 

 

C ^ f « j j

-

предадущая ооэнка

^ .

 

 

Если вместо аредндущей сглаженной величины

 

и о д с т а А

ей выражение через еще более ранние величины, то

получим

 

 

 

 

C k l V ) - ^ i l

* ( < - ^ [ ^ * t < - ^ ) C 1

b

. i l

( i i ) ] -

ы

 

i

к.

 

 

i - f l 4

7 * " *

-

7

»

(10.5)

Отсюда видно,

что функция

( ^ я в л я е т с я

линейной комби-

напией всех прошлых каблхщеянш значений. Веса, прнписнваемае этим значениям, уменьшаются с "возрастом" данных.

Операция, производимая над любым рядом данных согласно формуле ( 1 0 . 4 ) , называется экспоненциальным сглаживанием. Осуществляя в правой части выражения (10,5) предельный пе­

реход, получим оператор экспоненция тгыгого сглаживания в интегральной форме:

Соседние файлы в папке книги из ГПНТБ