Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Современные проблемы прикладной математики. Часть 2. Практикум

.pdf
Скачиваний:
11
Добавлен:
05.02.2023
Размер:
569.21 Кб
Скачать

где η - вектор ошибки, вычисляемый с помощью нормального датчика случайных чисел для двух случаев:

а) ошибки не коррелированны. Значения СКО задать равными σηi = δi fi , i =1,..., N ; δi = 0.01,0.05,0.01.

Матрица ковариации в этом случае будет диагональной

Vη = diag 2η1 ...,σ2ηN ) .

б) ошибки коррелированны. В этом случае вектор ошибок вычисляется по формуле η =Vη1/2ξ, где Vη - заданная

матрица ковариации; ξ - вектор, проекции которого

состоят из нормальных случайных величин с единичной дисперсией и нулевым средним.

4.

Представить матрицу

ковариации ошибок Vη в форме

V = σ2

C

, где C

 

=

1

 

V .

 

ση2

 

η

η

η

 

η

 

 

η

4. Вычислить решение по формуле (2.10) и вектор ошибки (2.24).

Примечание. При наличии научной задачи магистранта, которую можно свести к системе линейных уравнений, провести исследования этой задачи.

§2.3. Построение регуляризованного решения при неполной информации

В ситуациях, когда отсутствует априорная информация о числовых характеристиках решения и шума, сглаживающий функционал имеет вид

F

[ϕ] =

 

fɶ Kϕ

 

2

 

+α

 

2

(2.25)

 

 

 

ϕ ω

α

 

 

 

 

W

 

 

ϕ

W

 

 

 

 

 

 

 

f

 

 

ϕ

 

В этом случае вектор ϕα , доставляющий минимум функционалу (2.25), является решением системы

(KTWf K +αWϕ )ϕα = KTWf fɶ + αWϕωϕ , (2.26)

состоящей из M уравнений относительно M неизвестных.

Здесь α > 0 параметр регуляризации, ωϕ - пробное решение. Параметр регуляризации является неизвестной величиной.

Метод рандомизации. Допустим, что априори известно о принадлежности искомого решения ϕ гиперпрямоугольнику,

определяемому неравенствами

ϕmin

 

 

 

j ϕmax

 

, j = 1,...,M ,

 

j

ϕ

j

(2.27)

 

 

 

 

 

 

являющимися детерминированными ограничениями. Метод рандомизации позволяет интерпретировать детерминированные ограничения в терминах числовых характеристик некоторых вероятностных распределений (чаще всего нормального

распределения). Первые два момента mϕ , Vϕ нормального

распределения N (mϕ ,Vϕ ) определяется таким образом, чтобы

случайный вектор, подчиняющийся этому распределению с вероятностью β попадал в гиперпрямоугольник (2.27).

Математическое ожидание mϕ такого вектора определяется как

 

 

ϕmin

+ϕmax

1

ϕmin

+ϕmax

2

 

ϕmin

M

+ϕmax

M

 

 

T

 

 

 

 

 

 

 

 

mϕ =

 

 

1

,

 

2

,...,

 

 

 

 

,(2.28)

 

 

2

 

 

2

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

а корреляционная матрица Vϕ является диагональной и вычисляется по формуле

 

 

(ϕmax1 ϕmin1

)2

 

(ϕmax M ϕmin M

)2

 

Vϕ = diag

 

 

,...,

 

 

. (2.29)

4µβ

 

4µβ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Значение β

= 3.

 

 

 

 

 

 

21

22

Если матрица Vη

задана,

то,

подставляя вычислительные

 

 

 

 

 

 

 

описанным

образом

mϕ , Vϕ

в

систему уравнений (2.29),

получаем

матричную

запись

алгоритма

нахождения

«рандомизированного» регуляризированного решения ϕp :

 

 

 

(KTVη1K +Vϕ1 )ϕp

= KTVη1 fɶ +Vϕ1mϕ .

(2.30)

Если информация о шуме измерения задана в виде системы

неравенств

 

 

 

fɶi fi

 

δi , 1≤ i N ,

(2.31)

 

 

то вновь обращаемся к методу рандомизации и вычисляем

корреляционную матрицу Vη

по формуле

 

 

 

 

 

δ 2

,

δ 2

,...,

δ 2

 

(2.32)

Vη = diag

1

2

N

 

 

 

12

 

12

 

12

 

 

и используем ее в алгоритме (2.30).

Очевидно, что (2.30) является частным случаем системы (2.26) при следующих заменах:

1

;

1

;

 

 

 

 

 

 

 

 

 

α =1.

(2.33)

Wf =Vη

Wϕ =Vϕ

ωϕ = mϕ ;

Стабилизирующий функционал

 

 

 

 

 

 

 

 

 

 

 

Введем квадратичную форму

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ϕTWϕϕ =

 

 

 

ϕ

 

 

 

2

,

 

(2.34)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Wϕ

 

 

 

которую назовем стабилизирующим функционалом. Неотрицательно определенная матрица Wϕ находится из

условия: чем «глаже» вектор ϕ , тем меньшее значение принимает функционал (34). Исходя из этого условия, часто матрицу Vϕ формируют как

23

W = DT D

,

(2.35)

ϕ

p p

 

 

где Dp – матрица, являющаяся дискретным аналогом оператора

дифференцирования

p -го

порядка (и тогда говорят о

регуляризации p -го

порядка). Так, при p = 0 матрица Wϕ

является единичной размером M × M .

 

Для p =1 матрица Wϕ

имеет вид:

 

 

 

1

1

 

0

 

 

 

 

 

 

 

Wϕ =

 

1 2

1

1

 

 

(2.36)

 

 

 

1

2

 

 

 

 

 

0

1

1

 

 

 

 

 

 

 

 

 

 

 

 

Если решение ищется на множестве векторов с ограниченной нормой, для которых отсутствует взаимосвязь между «соседними» проекциями, то целесообразно использовать единичную матрицу либо диагональную матрицу вида (2.29), в

этом случае Wϕ =Vϕ1 и это будет соответствовать регуляризации нулевого порядка.

Вернемся к вектору ωϕ , входящему в функционал (2.25) и названному «пробным» решением. При наличии априорной

информации вида (2.27) его можно задать как ωϕ = mϕ , где mϕ определяется выражением (2.28). При отсутствии такой информации традиционным заданием является ωϕ = 0M .

Матрицу Wf рекомендуется задавать с точностью до константы равной обратной матрицы Vη1 , т.е.

W

f

= C

V 1

,

(2.37)

 

 

f η

 

 

24

где константа Cf > 0 . При наличии информации вида (31) матрицу Vη можно определить соотношением (2.32). При

отсутствии информации о числовых характеристик погрешностей ηi матрицу Wf можно задать диагональной.

Ненулевые элементы такой матрицы интерпретируются как

весовые множители, определяющие значимость (или информативность) соответствующих проекций вектора правой

части fɶ .

В предельном случае (соответствующем отсутствию информации об искомом решении и шуме измерения) матрицы Wf и Wϕ задаются единичными, т.е.

Wf = IN×N ; Wϕ = IM ×M ,

(2.38)

Ошибка решения ϕα .

Определим ошибку решения ϕα , определяемым вектором (2.26)

εα = ϕα ϕ + ,

где ϕ + – нормальное псевдорешение системы Kϕ = f при точной правой части f , т.е. ϕ+ = (KTWf K)1 KTWf f . Как и

прежде, вектор εα

представим суммой векторов случайной ξα и

систематической bα

ошибок:

 

εα

= ϕα ϕα+ + ϕα+ ϕ

+ = ξα + bα .

(2.38)

Вектор bα

= Mη [εα ] можно назвать смещением решения ϕα .

Систематическая ошибка bα имеет вид

bα = α (KTWf K + αWϕ )1 Wϕ (ωϕ ϕ + ).(2.39)

Вектор

ξα = εα Mη [εα ] = εα bα

(2.40)

является случайным вектором с нулевым средним и определяется выражением

 

 

ξα = (KTWf K + αWϕ )1

KTWfη .

 

(2.41)

Ковариационная

 

матрица Vξα

 

= M

 

T

этого

вектора

 

 

ξαξα

определяется выражением:

 

 

 

 

 

 

 

 

V = (KTW

K + αW )1 KTW

f

V W

K(KTW

K + αW )1 ,

ξα

 

f

 

 

ϕ

 

 

 

η

f

 

f

 

ϕ

Полагая W

f

=V 1

, получим

 

 

 

 

 

 

 

 

 

 

η

 

 

 

 

 

 

 

 

 

 

 

 

Vξα = (KTWf K + αWϕ )1 KTWf K(KTWf K + αWϕ )1 ,(2.42)

Полная ошибка решения равна

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

α

j

= bα

+ Vξα

 

, j = 1,...,M

.

(2.43)

 

 

 

 

 

j

 

jj

 

 

 

 

 

Задание 2.3.

1. Задать матрицу системы K , вектор решения ϕ , ограничения на вектор ϕ вида (2.27).

2. Вычислить среднее значение

 

и матрицу ковариации

 

mϕ

V ϕ

по формулам (2.28), (2.29).

 

 

 

 

3. Для заданной матрицы K и вектора решения ϕ

вычислить

правую часть f .

4. Внести шум в правую часть, т.е. вычислить вектор

f = f + η,

25

26

где η - вектор ошибки, вычисляемый с помощью нормального датчика случайных чисел для двух случаев:

а) ошибки не коррелированны. Значения СКО задать равными σηi = δi fi , i =1,...,N ; δi = 0.01,0.05,0.01.

Матрица ковариации в этом случае будет диагональной

Vη = diag (σ2η1 ...,σ2ηN ) .

б) ошибки коррелированны. В этом случае вектор ошибок вычисляется по формуле η =Vη1/2ξ, где Vη - заданная

матрица ковариации; ξ - вектор, проекции которого

состоят из нормальных случайных величин с единичной дисперсией и нулевым средним.

5. Задать ограничения на вектор f вида (2.31) и вычислить

матрицу V η по формуле (2.32).

6. Вычислить решение системы (2.26) и погрешность по формуле

(2.43) для следующих вариантов:

а) Wf = I, Wϕ = I, ωϕ = 0, для различных значений

α [108,1]. Значения

α определять по формуле

αk = αk1 10;

 

1

1

 

б) Wf =V η ,

Wϕ =V ϕ

, ωϕ = mϕ , α = 1.

Примечание. При наличии научной задачи магистранта, которую можно свести к системе линейных уравнений, провести исследования этой задачи.

§2.4. Регуляризирующий SVD-алгоритм

Обратимся к системе уравнений (2.26) и вычислим решение этой системы, используя сингулярное разложение.

Предположим, что матрица Wf неотрицательно определена, симметрична и допускает представление

 

 

 

 

W

f

=W

12

W

12 .

 

 

(2.44)

 

 

 

 

 

 

 

 

f

 

f

 

 

 

Запишем сингулярное разложение

 

 

 

 

 

 

 

 

W

f

12 K =UΛV T

 

 

(2.45)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и представим матрицу W

 

в форме

 

 

 

 

 

 

 

 

ϕ

 

 

 

 

 

 

 

 

 

 

 

 

Wϕ =V diag{m(λ1),...,m(λM )} VT

(2.46)

Тогда вектор

ϕα

регуляризированного решения СЛАУ можно

представить как

 

 

 

 

 

 

 

 

 

 

 

 

p

 

 

λj

 

 

 

 

 

1

 

 

αm(λj )

 

 

ϕα =

 

 

 

 

 

uj ,Wf 2 fɶ

+

 

vj ,(2.47)

 

λj2 +αm(λj )

 

 

j=1

 

 

 

 

 

 

 

λj2 +αm(λj )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где

vj , uj

 

j -е столбцы матриц

V , U соответственно:

p

– ранг

(или

практический

ранг)

матрицы K . Из (2.47)

непосредственно следует матричное представление решения ϕα :

ϕ

α

=V

p

R

pα

U

TW

12 fɶ +V

Z

V Tω

,

(2.48)

 

 

 

 

p

f

p

 

pα p ϕ

 

 

где Vp – матрица размера

M × p , составленная из p первых

столбцов

 

матрицы

V ;

 

Up

 

матрица

размера

N × p ,

составленная из

p

первых столбцов матрицы U ;

Rpα

диагональная матрица размера p × p следующей структуры:

27

28

 

 

 

 

λ1

 

0

 

0

 

 

 

 

 

λ2

+αm(λ )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

1

 

 

 

 

 

 

 

 

 

 

0

 

 

λ2

 

0

 

 

R

pα

=

 

 

 

λ22 +αm(λ2 )

 

. (2.49)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

0

 

λp

 

 

 

 

 

 

 

λp2 +αm(λp )

 

 

Матрица Zpα имеет структуру

 

αm(

λ1 )

0

 

 

λ12 +αm(λ1 )

 

 

 

 

0

 

 

αm(λ2 )

Zpα =

 

 

λ22 +αm(λ2 )

 

 

 

 

 

 

 

 

 

0

 

0

 

 

 

 

 

0

 

0 .

(2.50)

m(λp )

λp2 +αm(λp )

Функция m(λ) является неубывающей функцией, например

m(λ) =

1

,

(2.51)

λγ

 

 

 

где γ ≥ 0 . Если γ = 0 , то

Wϕ = I , что

соответствует

регуляризации нулевого порядка. Чем больше значение γ , тем в большей степени проекции вектора ϕα взаимосвязаны между

собой. Это обусловлено тем, что векторы vj , соответствующие малым λ j и имеющие осциллирующие проекции, не войдут в

решение ϕα из-за пренебрежимо малого значения множителя

λj . λj2 +αm(λj )

Точность решения оценим как и ранее вектором

εα = ϕα − ϕ+ , который можно представить как

εα = ξα + bα .

Тогда полная погрешность вычисляется по формуле

 

 

 

 

 

α

 

= bα

j

+

 

 

Vξα

 

, j =1,...,M ,

 

 

(2.52)

 

 

 

 

 

 

 

j

 

 

 

 

 

 

 

 

 

jj

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где вектор bα

 

(см. формулу (39)) в сингулярном представлении

равен

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=V

 

Z

 

 

VT (ω −

 

+ ),

 

 

 

 

 

 

(2.53)

 

 

 

 

 

b

p

pα

ϕ

 

 

 

 

 

 

 

 

 

 

 

α

 

 

 

 

 

 

 

 

p

 

 

ϕ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

а матрица ковариации решения (42) имеет вид

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

V

 

 

=V F VT .

 

 

 

 

 

 

 

 

 

(2.54)

 

 

 

 

 

 

 

 

 

 

 

ξα

 

 

 

p pα

p

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Матрица

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

λp

 

 

 

2

 

 

 

 

 

λ

 

 

 

 

 

 

 

 

 

 

 

λ

2

 

 

 

 

 

 

 

 

 

 

 

 

Fpα = diag

 

 

 

 

1

 

 

 

 

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

,...,

 

 

 

 

 

 

 

,

λ

2

+ αm(λ )

 

 

λ

2

+ αm

)

λ

2

+ αm

 

 

 

 

 

1

 

 

 

 

 

2

 

 

 

p

p

)

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

+

равен

 

+ =VΛ1UTW1/2

 

 

 

 

 

 

 

 

 

 

 

 

 

а вектор

ϕ

ϕ

 

 

f .

 

 

 

 

 

 

 

 

 

Задание 2.4.

1.Задать матрицу системы K , вектор решения ϕ .

2.Для заданной матрицы K и вектора решения ϕ вычислить

правую часть f .

3 Внести шум в правую часть, т.е. вычислить вектор

f = f + η,

где η - вектор ошибки, вычисляемый с помощью нормального датчика случайных чисел для двух случаев:

29

30

а) ошибки не коррелированны. Значения СКО задать равными σηi = δi fi , i = 1,..., N ; δi = 0.01,0.05,0.01.

Матрица ковариации в этом случае будет диагональной

Vη = diag (σ2η1 ...,σ2ηN ) .

б) ошибки коррелированны. В этом случае вектор ошибок вычисляется по формуле η =Vη1/2ξ, где Vη - заданная

матрица ковариации; ξ - вектор, проекции которого

состоят из нормальных случайных величин с единичной дисперсией и нулевым средним.

4. Задать ограничения на вектор f вида (2.31) и вычислить

матрицу V η по формуле (2.32).

5. Представить матрицу ковариации ошибок V η в форме

 

2

1

 

V

η = ση Cη , где Cη =

 

V η .

σ2

 

 

η

 

6. Вычислить решение системы по формуле (2.48) и погрешность

по

формуле

(2.52)

для

следующих

данных:

Wf

1

= I, ωϕ = 0

для

различных

значений

=V η , Wϕ

α [108,1].

Значения α

определять по

формуле

αk = αk1 10. Значения параметра γ выбрать эмпирически.

Примечание. При наличии научной задачи магистранта, которую можно свести к системе линейных уравнений, провести исследования этой задачи.

Практическое занятие №3

Алгоритмы выбора параметра регуляризации

§3.1. Выбор параметра регуляризации на основе критерия оптимальности

Рассмотрим систему уравнений

 

Kϕ = f .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(3.1)

Здесь K - матрица системы размерности N × M ,

f

- вектор

 

 

 

f

 

 

 

правой части размерности

 

N , равный

=

f

+ η, где

f

-

точная правая часть, η - погрешность

правой части, которая

описывается

моментами

 

 

1-го

и

 

 

 

2-го

 

порядка

M[η] = 0, M[ηηT ] =Vη .

 

Матрица

 

Vη

допускает

представление V = σ2 C

η

, где

 

 

σ2 - скалярная величина, C

η

 

η

η

 

 

 

 

 

η

 

 

 

 

 

 

 

 

 

 

- матрица размерности N × N .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Регуляризованное

решение системы

 

(3.1) ϕα

является

решением следующей системы уравнений

 

 

 

 

 

 

 

 

 

 

 

(KTV

1K +ασ

2W )ϕ

α

= KTV 1 fɶ

,

 

 

(3.2)

η

η

 

ϕ

 

 

 

η

 

 

 

 

 

где α > 0 - параметр регуляризации.

 

 

 

 

 

 

 

 

 

 

 

Так как σ2

является константой, то в дальнейшем будем

 

η

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

рассматривать систему вида

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(KTV

1K +αW

 

)ϕ

α

= KTV

1 fɶ

.

 

 

 

 

(3.3)

η

 

ϕ

 

 

 

η

 

 

 

 

 

В качестве матрицы Wϕ

 

используется либо единичная

матрица (регуляризация нулевого порядка), либо матрица вида

 

31

32

 

 

1

1

 

0

 

 

 

 

W =

 

1

2

1

 

 

ϕ

 

 

1

2

1

 

 

 

 

 

 

 

0

 

1

1

 

 

 

 

 

 

 

 

(регуляризация первого порядка).

Рассмотрим вектор невязки eα = f Kϕα = E (α ) fɶ ,

где E(α)

- оператор невязки, который для

решения,

определяемого из системы (3), равен

 

 

 

E(α ) = I K (KTVη1K +αWϕ )1

KTVη1 или

 

E (α ) =Vη (Vη +α 1KWϕ1KT )1 .

 

(3.4)

 

Тогда

для

матрицы ковариации

вектора

невязки

V

(α ) = M[e eT ]

мы можем записать:

 

 

e

 

α α

 

 

 

 

Ve (α ) = E (α )Vfɶ ET (α) .

 

(3.5)

где Vfɶ - матрица ковариации вектора правой части

Vf = M[ f f T ].

Вкачестве αopt возьмем такое значение αW , при котором принимается основная статистическая гипотеза:

H

0

:

V

(α ) =V ET (α ).

 

 

 

 

(3.6)

 

 

e

η

 

 

 

 

 

Таким образом, значение

αW

можно рассматривать как

оценку оптимального параметра регуляризации αopt .

 

Для проверки гипотезы (3.6) введем статистику

 

 

 

 

 

T

T

 

 

1

(3.7)

 

 

 

ρW (α ) = eα Vη E

 

(α )

eα ,

Подставляя (3.4) в (3.7), получим

ρW (α ) = fɶT Vη1eα или

ρW (α ) = fɶT (Vη +α 1KWϕ1KT )1 fɶ . (3.8) Введем параметр γ =1/α. Тогда выражение (3.9) примет вид

 

 

 

ρW (γ ) = fɶT (Vη + γ KWϕ1KT )1

fɶ .

 

 

(3.9)

 

 

W

 

(

η

 

)

( η

 

)

 

N

 

 

M

ρ

 

(γ )

= Sp V ET

(γ )

1

V ET (γ )

=

Sp[I

 

] = N ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где IN

– единичная матрица размера N N .

 

 

 

 

 

 

Статистика

ρ

W

(γ )

пари

γ = γ

W

подчиняется

χ2 -

распределению с N степенями свободы. Тогда проверка гипотезы (3.6) сводится к проверке предположения: подчиняется

ли величина ρW (γ ) χ2 -распределению с N степенями свободы.

Для этого построим интервал

Θ

N

(β ) = ϑ

N

(β 2),ϑ

N

(1− β 2) ,

(3.10)

 

 

 

 

 

 

 

где ϑN (β 2)

– квантиль

χ2 -распределения уровня

β /2 . Если

ρW (α ) попадает в интервал (3.10), т.е. выполняется

неравенство

 

 

 

 

 

 

 

 

 

 

ϑN (β 2) ≤ ρW (γ ) ≤ϑN (1− β 2) ,

(3.11)

то гипотеза (3.6) может быть принята с вероятностью ошибки первого рода, равной β . Следовательно, значение αW , при

котором выполняется (3.11), является оценкой для αopt .

Для

N ≤10

граничные

точки

интервала ΘN (β )

квантили ϑN (β 2) ,

ϑN (1− β 2)

при

β = 0.1

приведены

в

таблице 3.1.

 

 

 

 

 

 

 

 

 

 

Таблица 3.1

 

 

 

 

 

 

 

 

 

 

N

4

 

5

6

7

8

9

 

1

 

 

0

 

 

33

34

ϑN (0.0

 

0

 

1

 

1

 

2

2

3

3

 

 

.71

 

 

.14

 

.64

 

 

.17

.73

.32

 

.94

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ϑN (0.9

 

9

 

1

 

1

 

1

1

1

1

 

 

.49

 

 

1.0

 

2.6

 

 

4.1

5.5

6.9

 

8.3

 

Если N >10 ,

то

 

квантили

достаточно

точно

 

могут

аппроксимироваться следующими выражениями:

 

 

 

 

 

ϑN (0.05) ≈ N 1.64

 

; ϑN (0.95) N +1.64

 

.(3.12)

2N

2N

Для вычисления

γW

используем

итерационную

процедуру ньютоновского типа:

 

 

 

 

 

 

 

 

γ (n) = γ (n1)

ρW (γ (n1) ) N

 

 

 

 

 

 

 

ρW

(γ (n1)

) , n =1,2,...,

(3.13)

 

 

 

 

 

с начальным значением γ (0) 1015 . В качестве γW принимается значение γ (n) , удовлетворяющее (3.12). Заметим, что эта процедура решает нелинейное уравнение ρW (γ ) = N , но момент

останова определяется условием (3.12).

Замечание. Для вычисления статистики (3.9) необходимо вычислять обратную матрицу (Vη + γ KWϕ1KT )1 , что приводит к увеличению трудоемкости вычислений. Чтобы этого избежать, запишем статистику ρW (γ ) в форме ρW (γ ) = f T qγ , где вектор qγ является решением системы

(V + γ KW 1KT ) q = f

.

(3.14)

η

ϕ

В формуле (3.14) используется производная ρW(γ ) , равная

ρW(γ ) = f T qγ, где вектор qγявляется решением системы уравнений

(Vη + γ KWϕ1KT ) (KWϕ1KT )1 q′ = −qγ . (3.15).

Задание 3.1.

Для построенного регуляризованного решения в лабораторной работе №2 при неполной информации (см. задание 2.3 в работе №2) вычислить:

1)параметр регуляризации αW ;

2)регуляризованное решение ϕαW ;

3) ошибку решения α

j

= bα

+

Vξα

 

, j =1,...,M

 

 

j

 

jj

Примечание. При наличии научной задачи магистранта, которую можно свести к системе линейных уравнений, провести исследования этой задачи

§3.2. Алгоритм выбора параметра регуляризации с использованием SVD-разложения на основе критерия оптимальности

Предположим, что:

 

ковариационная матрица Vη допускает

представление

V = σ 2C , и определим сингулярное разложение

 

η

η η

 

 

C12 K = UΛV T ,

(3.16)

 

η

 

допуская при этом, что сингулярные числа λj упорядочены по убыванию, т.е. λj λj+1 и λj = 0, j = p +1,...,M , где p – ранг

(или практический ранг) матрицы системы;

регуляризированное решение ϕα представимо в виде:

p

 

 

λj

 

1

 

 

 

ϕα =

 

 

 

uj ,Cη

2 fɶ

vj ,

(3.17)

2

+αm(λj )

j=1

 

λj

 

 

 

 

 

 

 

 

 

 

 

 

 

 

35

36

где m(λ) невозрастающая функция m(λ ) = λ1τ , где τ ≥ 0.

Нетрудно показать, что вектор ϕα является системы

(KT Cη1K +αWϕ )ϕα = KT Cη1 fɶ ,

вкоторой матрица Wϕ выражается соотношением:

Wϕ = Vp diag{m(λ1 ),m(λ2 ),...,m(λM )}VpT ,

где Vp – матрица размера M × p , составленная из столбцов матрицы V , входящей в разложение (3.16). Теперь статистику ρW (α ) можно записать в виде

 

 

 

 

 

 

 

 

1

 

1

 

T

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ρw (α ) =

 

(Cη

 

2 fɶ) (Cη

 

2eα ) ,

 

 

 

 

 

 

 

 

σ 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

η

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где векторы

C12

fɶ , C12e

допускают представление:

 

 

 

 

η

 

 

 

η

α

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

12 ɶ

 

 

N

 

 

 

12 ɶ

 

 

 

 

N

ɶ

 

 

,

 

 

 

 

 

Cη

f = uj ,Cη

f

uj = yjuj

 

 

 

 

 

 

 

 

 

j=1

 

 

 

 

 

 

 

 

 

j=1

 

 

 

 

 

 

1

2

 

p α m(λj )

 

ɶ

 

 

 

N

 

ɶ

 

 

 

 

Cη

eα =

 

2

 

 

 

 

 

 

uj +

 

 

 

 

 

 

 

 

 

 

 

 

 

 

yj

yjuj

 

 

 

 

 

j=1 λj +αm(λj )

 

 

 

 

j= p+1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где

ɶ

= (uj

12 ɶ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

yj

,Cη

f ) . Тогда

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

p

 

α m(λj )

 

 

ɶ2

N

 

ɶ

2

 

 

 

ρW (α ) =

2

 

2

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

ση

j=1

λj +αm(λj

)

 

 

 

j= p+1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Введем γ = 1/α и функции

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

p

 

m(λj )

 

 

 

ɶ2

 

 

 

 

 

 

RW (γ ) =

2

 

 

2

 

 

 

 

 

 

 

,

 

 

 

 

 

 

+m(λj )

yj

 

 

 

 

 

 

 

 

 

 

ση j=1

γ λj

 

 

 

 

решением

(3.18)

p первых

(3.19)

(3.20)

(3.21)

(3.22)

(3.23)

 

 

 

 

RW (γ )

 

1

 

p

 

λj2 m(λj )

 

 

 

2

 

 

W (

γ

)

=

 

 

= −

 

 

 

 

 

yɶ

j

.

(3.24)

 

 

2

 

 

2

R

 

γ

ση

j=1 γ λj2 +m(λj

)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для вычисления γW используем итерационную процедуру:

 

γ (n)

= γ (n1)

RW (γ (n1) ) p

, n =1,2,...,

 

 

 

 

 

(3.25)

RW(γ (n1) )

 

 

 

 

 

 

с начальным значением γ (0) 1015 . В качестве γW принимается значение γ (n) , удовлетворяющее условию

ϑp (β 2) ≤ RW (γ ) ≤ ϑp (1β 2) .

(3.26)

Задание 3.2.

Для построенного регуляризованного решения в лабораторной работе №2 при неполной информации (см. задание 2.4 в работе №2) используя SVD-разложение, вычислить:

1)параметр регуляризации αW ;

2)регуляризованное решение ϕαW ;

3) ошибку решения α

j

= bα

+

Vξα

 

, j =1,...,M .

 

 

j

 

jj

Примечание. При наличии научной задачи магистранта, которую можно свести к системе линейных уравнений, провести исследования этой задачи

§3.3. Алгоритм выбора параметра регуляризации основе статистического принципа невязки

Для вычисления значения αV проверяется статическая гипотеза

37

38

eα = f Kϕα

H0 :Ve (α) = Vη

(3.27)

Для проверки (3.27) введем статистику ρV (α) = eαTVη1eα .

Здесь - вектор невязки. Учитывая, что ϕα = (KTVη1K + αWϕ )1 KTVη1 fɶ , получим:

eα = f Kϕα = fɶ K (KTVη1K + αWϕ )1 KTVη1 fɶ = (3.28) =Vη (Vη + α1KWϕ1KT )1 f

Тогда выражение для статистики примет вид:

ρV (α) = eαTVη1eα =

= f T (Vη +α1KWϕ1KT )1Vη (Vη +α1KWϕ1KT )1 f

Введем γ =1/α , получим

ρV (γ ) = f T (Vη +γ KWϕ1KT )1Vη (Vη +γ KWϕ1KT )1 f .(3.29)

Вычислим производную по γ . Для этого представим ρV (γ ) в виде

ρV (γ ) = gTVη g ,

(3.30)

где

 

 

g = (Vη + γKWϕ1KT )1 f .

(3.31)

Тогда производная от ρV (γ )

равна

 

(ρ (γ ))′ = 2gTV g,

(3.32)

V

η

 

где

g′ = −(KWϕ1KT )(Vη + γKWϕ1KT )2 f =

. (3.33)

= −(KWϕ1KT )(Vη + γKWϕ1KT )1 g

 

Вычисление gпо формуле

(3.33)

эквивалентно

решению

системы уравнений

 

 

 

 

 

 

(Vη + γKWϕ1KT )(KWϕ1KT )1

g′ = −g .

(3.34)

Для вычисления

γV используем

итерационную

процедуру

ньютоновского типа:

 

 

 

 

γ (n) = γ (n1)

ρV (γ (n1)

) N

,

n =1,2,...,

(3.35)

ρV(γ (n

1) )

 

 

с начальным условиемγ (0) 1015 .

Итерационный процесс завершаем при выполнении условия

ϑN (β 2) ρV (γ ) ϑN (1β 2) .

(3.36)

где ϑN (β 2) , ϑN (1β 2)

– квантили

χ 2 -распределения с

N степенями свободы

уровней

β 2 ,

1β 2

соответственно.

 

 

 

Задание 3.3.

Для построенного регуляризованного решения в лабораторной работе №2 при неполной информации (см. задание 4 в работе №2) вычислить:

1)параметр регуляризации αV ;

2)регуляризованное решение ϕαV ;

3) ошибку решения ∆α j = bα j + Vξα jj , j = 1,...,M .

39

40

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]