Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Тарушкина Л.Т. Статистическая оценка параметров управляемых систем с помощью ЦВМ

.pdf
Скачиваний:
2
Добавлен:
23.10.2023
Размер:
7.09 Mб
Скачать

Алгоритм экстраполяции статистических данных достаточно прост. Экстраполяция данных процесса X , (t) на одинтлаг состав­

ляет

в

среднем 7-10~3 с.

 

 

Заметим, что оценка среднего времени дана для одной коор­

динаты

Хг (t) процесса

X (i). Так как координаты Xi

(t),

(0

(l

У) статистически независимы, то для получения сред­

него

времени обработки

всех координат, входящих в массив

R,

необходимо увеличить в 3 раза среднее время обработки коорди­ наты Хг {t}.

8. ОЦЕНИВАНИЕ И ИДЕНТИФИКАЦИЯ МОМЕНТОВ РАСПРЕДЕЛЕНИЯ СЛУЧАЙНЫХ ПРОЦЕССОВ, ИМЕЮЩИХ НЕУБЫВАЮЩУЮ ДИСПЕРСИЮ

Постановка задачи. Как отмечалось в п. 2, процессы с незави­ симыми приращениями и мартингалы имеют неубывающую дис­

персию [см. неравенства

(1.19), (1.32)]. Поэтому под процессами,

имеющими неубывающую

дисперсию,

будем понимать

либо

про­

цессы с независимыми приращениями, либо мартингалы.

 

Пусть

X {t) = ( Х а

(I),

. . .,

Xl

(t))

— измеряемая

координата

системы

управления

за

время

Т,

причем XL (t) (i =

1, /)

пред­

ставляет собой либо случайный процесс с независимыми прира­

щениями, либо мартингал.

 

 

 

 

 

 

 

Известны:

 

 

 

 

 

 

 

 

 

1)

реализация

процесса

X (t),

 

t£T;

 

 

 

2)

аналитическая

структура

 

математического

ожидания

MXL

{t) (i — 1, /),

определяемая

разложением (1.14)

и содержа­

щая

неизвестный параметр qf = (bu,

 

. . ., bki)

размерности kt\

3)

аналитическая

структура

корреляционной

функции

 

 

Кц

t2)

= Ки

(min (tv

t2),

min (tv

t2)),

 

 

содержащая неизвестный параметр qn

размерности

pt;

 

4)

моменты MXi (0), MX\ (0) в

начальный

момент

работы

системы

управления.

 

 

 

 

 

 

 

 

При

некоторых

дополнительных

предположениях

требуется:

1)

разработать

методы статистического оценивания и

иденти­

фикации неизвестных параметров, входящих в моменты распре­ деления процесса xt (t) (i — 1, I);

2)

рассмотреть возможность оценивания взаимной корреля­

ционной функции Ки (tlt t2)

(i 4= У);

3)

построить алгоритмы,

обладающие необходимой точностью

ипредъявляющие к памяти ЦВМ минимальные требования. Нужно отметить, что процесс Хс (t), являющийся мартинга­

лом, имеет постоянное математическое ожидание,.поэтому MXi(t)

=

= MXt (0) является известной величиной.

 

60

Реализация процесса X (t)

за время

Тх образует в ЦВМ массив

статистических

данных R A

= (X (^,),

X (t}J, . . .,

X

(^ ш )),

а за время

Т — массив

данных

R =

(X (^i), . . .,

X

(tm)).

Требования, предъявляемые к памяти ЦВМ, будут минималь­ ными, если алгоритмы оценивания допускают последовательную обработку массивов.

Метод оценивания с применением неравенства Чебышева. Рас­ смотрим одномерный процесс X (t), представляющий собой лю­

бую координату процесса

X (i). Допустим,

что X (t) имеет не­

зависимые приращения и с вероятностью 1

ограничен:

| Х (

0 1 < с < о о , / £ Т .

(П.ЗЗ)

Условие (П.ЗЗ) означает, что известно максимальное значение реализации процесса \Х (t)\ или оценка сверху за время Т.

Аналитическая структура моментов распределения процесса содержит неизвестные параметры размерности k и р соответственно для математического ожидания mx (t) и корреляционной функции Кх (t, t). Обозначим п = max (k, р). Зафиксируем временную последовательность

0 < < o < < i < - - - < f m < T ,

 

(11.34)

соответствующую шагу

дискретности, с

которым

образуется

в ЦВМ массив статистических данных R.

 

 

непересека­

Из последовательности (11.34) выделим

N ^ п

ющихся последовательностей. Пусть это будут

последовательности

 

ti-iw,

 

 

(И.35)

где i (i = 1, N) — номер

последовательности;

/ (/' =

0, 1, г) —

номер члена данной последовательности, причем число г выби­ рается максимальным из всех чисел, которые удовлетворяют не­ равенству

ЛГ (/•+ 1) <

m

+ 1 .

(11.36)

Образуем случайные

величины

 

 

 

 

z0

= X (*„) — mx (/„),

,

J

2, = X (t.) -

X (*._>) -

mx

(tt) +

mx (t^)

(Ц.37)

 

(i - 1, m).

 

 

j

В силу того, что процесс X (t) имеет независимые приращения, случайные величины z„, z£- (t = 1, m) взаимно независимы.

Составим статистики

и!г =

7^гг[г5 +

г 8 * + - :

 

 

 

 

(11.38)

UMr = г ' + J

[ ^ V - l + ZW-1

+ • ' • +

1) N—l

61

- Рассмотрим две группы статистик щг и щг, соответствующие значениям s = 1 и s = 2. Возьмем любое е > 0, тогда в силу неравенства Чебышева

 

Dus

Р\\и1-Ми}г\<:е)^1--^,

(11.39)

где Р — вероятность события, указанного в фигурных скобках; Duu — дисперсия величины и]г,

Du% =

(£)z?_, + • • • + DzU+rN).

(11.40)

В силу неравенства (11.33) имеем следующие оценки:

Mzf < 4 V S .

Отсюда следует, что

г,

4-с2

т2°с4

т. е. с увеличением г значения е2 уменьшаются. Предположим, что число г выбрано столь большим, что max {е^ e3 j- ^ е3 . Тогда соотношение (11.39) заменится следующим

Р{\и\г-Ми\г\<г}^\-г,

т. е. с вероятностью большей или равной 1 — е

\uir — Mulr\<e, \и]г— Ми]г\ < е.

Учитывая, что Muir 0, составим функционал

Vi = 4 - £

[uir-MulrY

=

4 "

S

(".41)

1= 1

 

 

i = l

 

W =

J S K -

^

] .

 

(П.42)

 

:=1

 

 

 

 

Определим момент M u 2 r . В силу равенства (11.40) достаточно определить величину дисперсии DzL. Имеем:

Dz0 =

Mz\=M

[X (t0) — m , {to)]2 =

К* Co, *o),

Dzt = Mzf L

M [ X (*t) - m , (tt) - X (*,_,)

+ mx ( ^ _ i ) ] 2 =

 

= * , ( ' / . У - ^ Л ^ - ь

ti-i)-

62

 

По массиву статистических данных

R вычислим значение ста­

тистик

uir,

ufr и момента Ми~сп

причем в каждой

точке

ti (i —

=

1,

т)

последовательности

(11.34)

вместо

моментов

тх (£),

Кх

(t,

t)

берется

их аналитическая

 

структура. с

неизвестными

параметрами

q,

q.

 

 

 

 

 

 

 

 

 

Найдем минимальное значение функционала (П.41) по всем

координатам

параметра

q Э Q (Q область допустимого

измене­

ния параметра).

Пусть

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m i n

V1 =

V1(qm),

 

 

 

 

 

 

 

 

 

 

q € Q

 

 

 

 

 

 

 

 

Найдем минимальное значение функционала (11.42) по всем

координатам

параметра

q £ Q (Q область

допустимого

изме­

нения

параметра), при

условии,

что

q = q m .

Пусть

 

 

 

 

 

 

 

 

 

_min V 2 =

V2

(qm ).

 

 

 

Если

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

^ i ( q m ) < e ,

 

 

 

(11.43)

 

 

 

 

 

 

 

V 2 ( q m ) < e ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где

e >

0 — заданное число,

характеризующее допустимую точ­

ность в определении параметров, входящих в моменты распреде­

ления тх (t), Кх (t, t),

то наилучшими

оценками в смысле сред­

него квадратического

будут значения

q = q m , q =

qm.

Если не выполняется хотя бы одно из неравенств

(11.43), зна­

чит либо допустимая точность в определении параметров q, q завышена, либо число точек т , входящих в последовательность (11.34), мало. В этом случае следует или уменьшить допустимую точность, или увеличить время наблюдения, т. е. увеличить либо е, либо число т.

Необходимо отметить следующее.

1. Имеет место простое соотношение между числом т, которое характеризует количество взятых для обработки дискретных наблюдений над процессом X (0 за время Т, и числом п, значение

которого равно наибольшей размерности между параметрами q, q.

Действительно, при построении статистик uir (i = 1, N) ис­ пользовалось условие ns^N. Совместно с неравенством • (11.36) имеем

п {г + 1 ) < N (г + 1 ) < m + 1.

Вместе с тем, выбор числа m определяет величину шага дискрет­ ности, с которой следует формировать массив статистических дан­ ных R. Других ограничений снизу на число пг нет.

63

2. Если моменты MX (0), MX- (0) неизвестны, то математиче­ ское ожидание и корреляционная функция процесса X (t) опре­ деляются с точностью до постоянного значения.

Алгоритм оценивания математического ожидания и корреля­ ционной функции процесса X (t) при последовательной обработке

массивов

статистических

данных

Rx (X — 1, Л) сводится к сле­

дующему.

 

 

 

 

1.

Для

каждого массива

аналогично

последовательности

(1Т.34)

рассматривается

последовательность

моментов времени

Т\-\ <± t\\ < t\a < • • • < t%m Тх.

При этом массив для одномерной координаты наблюдаемого про­

цесса

X (t) равен Rx = (X (txi)

X

(tXm)).

 

2.

В-каждом массиве R^ выделим последовательности tt_1+jNi

х .

Данные последовательности в силу своего построения не пере­ секаются ни внутри массива, ни между массивами.

3.

Образуем

случайные величины

zox,

 

ziX

согласно

формуле

(11.37).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4.

Составим

для

каждого

массива

Rx

статистики

иих

по

формуле (11.38).

 

 

 

 

 

 

 

 

 

 

 

 

Введем следующие обозначения: Usiri

ujru

I!)л

стати­

стики

и*г\ полученные при одновременной

обработке в ЦВМ мас-

/ сива

R x (J

R 2 ;

Uhz

статистики и]г,

 

полученные

при

одно­

временной обработке в ЦВМ массива

R i

L)

U R j

и

т. д.

Тогда

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

UsirX = -l[Ula-i)

 

 

 

 

 

 

 

(И.44)

Причем UirA

=

ifir

(X = 1, Л).

 

 

 

 

 

 

 

 

 

Формула (11.44) позволяет с помощью рекуррентных соотно­

шений получить статистики и\г при последовательной

обработке

статистических

данных.

 

 

 

 

 

 

 

 

 

 

5.

Определив статистики и]г,

составим

функционалы

Vь

 

V,,

минимизация которых даст оценки для

моментов

распределения

mx (t),

Кх

(t,

t).

 

 

 

 

 

 

 

 

 

 

 

 

Идентификация параметров распределения с помощью стати­

стической

проверки

гипотез.

Пусть

X

 

(t) — одномерный

 

про­

цесс, представляющий собой любую координату процесса

X

(t).

Делаются

следующие

предположения:

 

 

 

 

 

 

 

 

 

1)X (t) — нормально распределен.

2)X (I) является либо процессом с независимыми прираще­ ниями, либо мартингалом.

3)Даны дискретные множества Г и Г, содержащие конечное число известных параметров размерностей k и р соответственно.

Известно, что q £ Г, q £ Г.

64

Задача обработки статистических данных R состоит в том, чтобы определить, какое именно значение из множества Г прини­

мает параметр q, из множества Г — параметр q.

 

Как следует из п. 2, если процесс X (t)

нормально

распределен

и нормально распределены его разности

X (^) —

X ( 4 - i ) . где

моменты времени tt взяты из последовательности (11.34), то про­ цесс X (t) имеет независимые приращения. Поэтому идентифика­ цию параметров q, q достаточно провести только для процессов, имеющих независимые приращения.

Для идентификации параметров q, q рассмотрим последова- . тельность моментов времени (11.34); по формуле (11.37) образуем последовательность случайных величин z0 , zL (i = 1, т). Составим статистики

Щ = } / -j^h

(i = 0, 1, т).

(11.45)

Значения vt (i = О, 1, т) образуют независимую выборку объема т + 1, полученную из генеральной совокупности, отве­ чающей случайной величине и, которая имеет нормальный закон распределения с параметрами Mv = 0, oi = Mv2 — Mz\, т. е. «€ N (0, ст„).

Поставим гипотезу Я : q = q 0 ) q = q 0 . Данная гипотеза экви­ валентна условию, состоящему в том, что при значениях пара­ метров q„, q„ выборочные значения vt (i = 0, 1, т) взяты из

N (0, а0).

Используем следующий результат [17].

Пусть у — случайная величина, имеющая нормальный закон распределения, у которой математическое ожидание~/Иг/ и дис­

персия Сту =

М

[у—My]2

неизвестны.

Проверяется

гипотеза

относительно

того, что математическое

ожидание My

= 0, ди-

сперия а2 =

а\.

Обозначим

через

 

 

 

 

 

 

1

'"

 

 

значение выборочного среднего. Тогда длягипотезы My = 0 критическая область уровня а

где постоянная с0 определяется из условия

Си

 

 

\&('j)dy

= a.

(11.46)

о

 

 

5

Л . Т. Тарушкина

65

Здесь Xm (у) плотность распределения хи-квадрат с т степенями свободы.

Для аи = Оо область принятия гипотезы

 

1

'"

-

 

 

C i <

S

{Уi — У)2

< с2 ,

 

где постоянные с ъ с 2 определяются из

условия

 

Со

 

с,

 

 

 

\xn,(y)dy=

^

\

yx„(y)dy=l-<x.

(11.47)

с,

 

с.

 

 

 

Применим этот результат к проверке гипотезы Я . Тогда для гипотезы Mv = 0 критическая область уровня а

 

 

 

г

i = 0

(

1=0 \

 

 

 

1=0

• ) .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где постоянная

 

с0

определяется согласно условию (11.46); для

гипотезы о том, что дисперсия

выборки

(11.45) равна ' а\ =

Мг\

область

принятия

гипотезы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

т

/

 

 

 

т

 

\2

 

 

 

 

 

 

*

 

<

^

Е

Ь

-

^

2

>

 

<<••

( 1

М 9 )

 

 

 

 

 

 

 

1 i = 0

\

 

 

 

1=0

 

/

 

 

 

где постоянные сг,

с, определяются согласно условию (11.47).

Следует

отметить,

что

для

определения

постоянных с ъ

с.г

удобно условие (11.47) представить в несколько иной форме:

учитывая,

что

 

 

 

 

 

 

 

 

 

 

 

 

 

 

if/Jn{y)

 

 

 

 

 

 

 

 

 

=

my&i+2{y),

 

 

 

получаем

 

С2

 

 

Со

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

J iGt (У) dy=

J Xm+2 (у) dy=\

 

a.

 

(11.50)

 

 

 

 

с,

 

 

с,

 

 

 

 

 

 

 

 

 

В

[17]

показано,

что данные

критерии

проверки

гипотез

яв­

ляются равномерно наиболее мощными и несмещенными.

 

Заметим, что

если

гипотеза

Я отклоняется, то это означает,

что отклоняется хотя бы одно

из условий

q = q„,

q = q 0 .

 

Алгоритм идентификации параметров с помощью проверки

гипотез при последовательной обработке массивов статистических

данных

сводится

к

следующему.

 

 

 

 

 

 

 

 

1. Задаются значения параметров q =

q 0

) q =

q 0 .

 

2.

Для

каждого

массива Wx статистических данных вычис­

ляются

случайные

величины

zux,

za,

определяемые

формулой

(11.37);

по

формуле

(11.45)

определяются

статистики

viX.

 

66

3. На каждом массиве

вычислим значения

тт

 

 

i = l

 

 

i = l

 

Рассмотрим

рекуррентные

соотношения

 

 

В% = В%_г

+

Ь%

(Х=\,

Л),

где А1 = а1, В1

=

Ь1.

 

 

 

 

Тогда

 

 

 

 

 

 

 

 

т

 

 

т

 

 

 

1=0

 

 

i = 0

 

На каждом массиве R^ в

ЦВМ

вычисляются значения ak, t \ ,

запоминаются значения Ak,

Вк.

 

 

4. Определим

значения постоянных с 0 ,

с ъ с 2 при заданном

. уровне значимости а гипотезы Н. Для этого введем функцию

распределения

 

X

 

(х) = Р (хГп <

Fm

х\ = \ & (у) dy. •

 

 

о

Тогда условие (11.46) дает следующее уравнение для опреде­

ления постоянной

с0:

 

 

Fm (со)

= ос.

Из условия (11.50) получаем систему уравнений для определения

постоянных

с ъ

с 2 :

 

 

 

 

 

 

 

 

 

 

 

 

Fm (с г) — Fn

(с•,)

=

1 —

а,

 

 

 

 

 

 

Fm+2 2 )

Fm+2

2 )

= 1

а.

 

Заметим, что если т <

29, тогда для определения постоянных

с 0 , с ъ

сг

следует

использовать

табулированные

значения функ­

ции

распределения

Fm (х).

Из

математической

статистики из­

вестно,

что

для

т ^ 30

следует использовать

асимптотическое

выражение для плотности распределения хи-квадрат, так как %т асимптотически нормальна N (га, 2га). Приближенное значение для функции распределения Fm (х) дается следующим выражением:

\V~2m)

( т ^ З О ) ,

где

 

о

 

Однако более

точным считается приближение

Рт(х)**0,5

+ Ф(V2x — У2т^\)

( m ^ 3 0 ) .

б*

 

67

"Если в системе управления заранее фиксирован

объем

ста­

тистических данных для проведения обработки, то числа с 0 ,

с х , с2

вычисляются заранее. Если же объем не фиксирован,

то в

алго­

ритм обработки включается дополнительно и алгоритм определе­

ния постоянных с 0 ,

с ъ с 2 .

 

 

5. Вычислив значения чисел Ал,

Вл и

определив постоянные

Co. c i >c 2 i проверим,

выполнено ли

условие

(11.48). Если оно вы­

полняется, то гипотеза Н отвергается. Если условие (2.48) не вы­ полняется, то проверяется условие (11.49). Если оно выполняется, то гипотеза Я считается истинной.

Обычно при выборе а берут одно из стандартных значений та­ ких, как 0,005, 0,01, 0,05.

Оценивание неизвестных параметров с помощью метода макси­ мального правдоподобия. Пусть X (t) — одномерный процесс, представляющий собой любую координату процесса X (/). Де­ лаются следующие предположения:

1)X (/) — нормально распределен;

2)X (t) является либо процессом с независимыми прираще­ ниями, либо мартингалом.

Для оценки неизвестных параметров, входящих в моменты распределения процесса X (f), поступим следующим образом.

Возьмем случайные величины z 0 l , zt (i = 1, т)\ они незави­ симы и нормально распределены. Рассмотрим плотность вероят­ ности события

« о < г о < " о +

du0,

« i < Z i < « i +

duu

um<zm<um-{-dum.

 

Она равна

т

/=о

где

1

Р,(и:)= r L е

а)-= Ми].

;

В качестве значений us возьмем выборочные значения и; = z-r Найдем частные производные

dlnL дЫЬ dqr --dqs

(Г = 1, k\ S—1, р),

где q = (qi, • • •> qk)> q = (Яи

qP)-

68

Согласно методу максимального правдоподобия оценки для неизвестных параметров определяются из условия обращения в ноль частных производных. Составим функционал

р

s = l

dqs

 

Найдем минимальное значение функционала У 2 по всем зна­ чениям неизвестных параметров, взятым из области допустимых

значений;

обозначим

минимальное

значение функционала

V2

через У 2 т .

< е, где е >

0 — заданное число,

характеризую­

Пусть

V2m

щее допустимую точность в определении параметров. Тогда

наи­

лучшими

оценками в смысле

среднего квадрэтического

будут те

значения

параметров,

при

которых

функционал

V 2

принимает

минимальное

значение.

 

 

 

 

 

 

Пусть

V2m

> е, и допустимую точность в определении неизвест­

ных параметров снизить нельзя. Тогда необходимо увеличить число точек массива R, т. е. увеличить число т.

Однако следует отметить, что метод максимального правдо­ подобия может и не привести с увеличением числа /п к более точ­ ному оцениванию. Как отмечается в [ 9 ] , оценки, получаемые по методу максимального правдоподобия, могут быть даже смещены.

Алгоритм не обладает свойством аддитивности относительно обработки статистических данных, входящих в массивы R^, и предъявляет к- памяти ЦВМ жесткие требования. Реализация алгоритма в случае, когда объем памяти ЦВМ не достаточен для хранения всего массива R, осуществляется с помощью составных решений (см. п. 5).

Об оценке моментов распределения процессов, являющихся мартингалами. Как уже отмечалось, если X (t) — мартингал с нор­ мальным законом распределения, то обработка данных процесса X (f) при условии, что разности распределены нормально, про­ водится так же, как и для процессов с независимыми прираще­

ниями. Допустим, что X (t)

— мартингал,

распределение кото­

рого отлично

от

нормального. Из условия

(1.31)

следует

 

 

 

 

М [X (*,) _

X (t^)]

[X (t{)

-

X (tt_J] =

О,

 

для I ф\,

i,

j =

0, 1,

tn; т. е. X (t)

имеет ортогональные

прира­

щения.

 

 

 

 

 

 

 

 

 

 

 

 

Так как аргумент t имеет смысл времени и

0 «s t <

оо, то,

перейдя

к

новой

переменной

со.= In t,

получим

область

измене­

ния оо

<

со <

оо .

 

 

 

 

 

 

 

 

Введем

стохастический

интеграл

Фурье

 

 

 

 

 

 

 

 

со

 

 

 

 

 

 

 

 

 

 

Y(u)=

\

eiaudX(a),

 

 

 

(11.51)

где и — некоторый вспомогательный аргумент.

69

Соседние файлы в папке книги из ГПНТБ