Современные проблемы прикладной математики. Часть 2. Практикум
.pdfгде η - вектор ошибки, вычисляемый с помощью нормального датчика случайных чисел для двух случаев:
а) ошибки не коррелированны. Значения СКО задать равными σηi = δi fi , i =1,..., N ; δi = 0.01,0.05,0.01.
Матрица ковариации в этом случае будет диагональной
Vη = diag (σ2η1 ...,σ2ηN ) .
б) ошибки коррелированны. В этом случае вектор ошибок вычисляется по формуле η =Vη1/2ξ, где Vη - заданная
матрица ковариации; ξ - вектор, проекции которого
состоят из нормальных случайных величин с единичной дисперсией и нулевым средним.
4. |
Представить матрицу |
ковариации ошибок Vη в форме |
||||||
V = σ2 |
C |
, где C |
|
= |
1 |
|
V . |
|
|
ση2 |
|
||||||
η |
η |
η |
|
η |
|
|
η |
4. Вычислить решение по формуле (2.10) и вектор ошибки (2.24).
Примечание. При наличии научной задачи магистранта, которую можно свести к системе линейных уравнений, провести исследования этой задачи.
§2.3. Построение регуляризованного решения при неполной информации
В ситуациях, когда отсутствует априорная информация о числовых характеристиках решения и шума, сглаживающий функционал имеет вид
F |
[ϕ] = |
|
fɶ − Kϕ |
|
2 |
|
+α |
|
2 |
(2.25) |
|
|
|
ϕ − ω |
|||||||
α |
|
|
|
|
W |
|
|
ϕ |
W |
|
|
|
|
|
|
|
f |
|
|
ϕ |
|
В этом случае вектор ϕα , доставляющий минимум функционалу (2.25), является решением системы
(KTWf K +αWϕ )ϕα = KTWf fɶ + αWϕωϕ , (2.26)
состоящей из M уравнений относительно M неизвестных.
Здесь α > 0 параметр регуляризации, ωϕ - пробное решение. Параметр регуляризации является неизвестной величиной.
Метод рандомизации. Допустим, что априори известно о принадлежности искомого решения ϕ гиперпрямоугольнику,
определяемому неравенствами
ϕmin |
|
|
|
j ≤ ϕmax |
|
, j = 1,...,M , |
|
j |
≤ ϕ |
j |
(2.27) |
||||
|
|
|
|
|
|
являющимися детерминированными ограничениями. Метод рандомизации позволяет интерпретировать детерминированные ограничения в терминах числовых характеристик некоторых вероятностных распределений (чаще всего нормального
распределения). Первые два момента mϕ , Vϕ нормального
распределения N (mϕ ,Vϕ ) определяется таким образом, чтобы
случайный вектор, подчиняющийся этому распределению с вероятностью β попадал в гиперпрямоугольник (2.27).
Математическое ожидание mϕ такого вектора определяется как
|
|
ϕmin |
+ϕmax |
1 |
ϕmin |
+ϕmax |
2 |
|
ϕmin |
M |
+ϕmax |
M |
|
|
T |
|
|
|
|
||||||||||||||
|
|
|
|
|
||||||||||||
mϕ = |
|
|
1 |
, |
|
2 |
,..., |
|
|
|
|
,(2.28) |
||||
|
|
2 |
|
|
2 |
|
|
|
2 |
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
а корреляционная матрица Vϕ является диагональной и вычисляется по формуле
|
|
(ϕmax1 −ϕmin1 |
)2 |
|
(ϕmax M −ϕmin M |
)2 |
|
Vϕ = diag |
|
|
,..., |
|
|
. (2.29) |
|
4µβ |
|
4µβ |
|
||||
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
Значение β |
= 3. |
|
|
|
|
|
|
21 |
22 |
Если матрица Vη |
задана, |
то, |
подставляя вычислительные |
|||
|
|
|
|
|
|
|
описанным |
образом |
mϕ , Vϕ |
в |
систему уравнений (2.29), |
||
получаем |
матричную |
запись |
алгоритма |
нахождения |
||
«рандомизированного» регуляризированного решения ϕp : |
|
|
|
||
(KTVη−1K +Vϕ−1 )ϕp |
= KTVη−1 fɶ +Vϕ−1mϕ . |
(2.30) |
||
Если информация о шуме измерения задана в виде системы |
||||
неравенств |
|
|
||
|
fɶi − fi |
|
≤ δi , 1≤ i ≤ N , |
(2.31) |
|
|
то вновь обращаемся к методу рандомизации и вычисляем
корреляционную матрицу Vη |
по формуле |
|
|
|
||||
|
|
δ 2 |
, |
δ 2 |
,..., |
δ 2 |
|
(2.32) |
Vη = diag |
1 |
2 |
N |
|
||||
|
|
12 |
|
12 |
|
12 |
|
|
и используем ее в алгоритме (2.30).
Очевидно, что (2.30) является частным случаем системы (2.26) при следующих заменах:
−1 |
; |
−1 |
; |
|
|
|
|
|
|
|
|
|
α =1. |
(2.33) |
Wf =Vη |
Wϕ =Vϕ |
ωϕ = mϕ ; |
||||||||||||
Стабилизирующий функционал |
|
|
|
|
|
|
|
|
|
|
|
|||
Введем квадратичную форму |
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
ϕTWϕϕ = |
|
|
|
ϕ |
|
|
|
2 |
, |
|
(2.34) |
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
Wϕ |
|
|
|
которую назовем стабилизирующим функционалом. Неотрицательно определенная матрица Wϕ находится из
условия: чем «глаже» вектор ϕ , тем меньшее значение принимает функционал (34). Исходя из этого условия, часто матрицу Vϕ формируют как
23
W = DT D |
, |
(2.35) |
|
ϕ |
p p |
|
|
где Dp – матрица, являющаяся дискретным аналогом оператора
дифференцирования |
p -го |
порядка (и тогда говорят о |
||||||
регуляризации p -го |
порядка). Так, при p = 0 матрица Wϕ |
|||||||
является единичной размером M × M . |
|
|||||||
Для p =1 матрица Wϕ |
имеет вид: |
|
||||||
|
|
1 |
−1 |
|
0 |
|
|
|
|
|
|
|
|||||
Wϕ = |
|
−1 2 |
−1 |
−1 |
|
|
(2.36) |
|
|
|
|
−1 |
2 |
|
|
|
|
|
|
0 |
−1 |
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
Если решение ищется на множестве векторов с ограниченной нормой, для которых отсутствует взаимосвязь между «соседними» проекциями, то целесообразно использовать единичную матрицу либо диагональную матрицу вида (2.29), в
этом случае Wϕ =Vϕ−1 и это будет соответствовать регуляризации нулевого порядка.
Вернемся к вектору ωϕ , входящему в функционал (2.25) и названному «пробным» решением. При наличии априорной
информации вида (2.27) его можно задать как ωϕ = mϕ , где mϕ определяется выражением (2.28). При отсутствии такой информации традиционным заданием является ωϕ = 0M .
Матрицу Wf рекомендуется задавать с точностью до константы равной обратной матрицы Vη−1 , т.е.
W |
f |
= C |
V −1 |
, |
(2.37) |
|
|
f η |
|
|
24
где константа Cf > 0 . При наличии информации вида (31) матрицу Vη можно определить соотношением (2.32). При
отсутствии информации о числовых характеристик погрешностей ηi матрицу Wf можно задать диагональной.
Ненулевые элементы такой матрицы интерпретируются как
весовые множители, определяющие значимость (или информативность) соответствующих проекций вектора правой
части fɶ .
В предельном случае (соответствующем отсутствию информации об искомом решении и шуме измерения) матрицы Wf и Wϕ задаются единичными, т.е.
Wf = IN×N ; Wϕ = IM ×M , |
(2.38) |
Ошибка решения ϕα .
Определим ошибку решения ϕα , определяемым вектором (2.26)
εα = ϕα −ϕ + ,
где ϕ + – нормальное псевдорешение системы Kϕ = f при точной правой части f , т.е. ϕ+ = (KTWf K)−1 KTWf f . Как и
прежде, вектор εα |
представим суммой векторов случайной ξα и |
|||
систематической bα |
ошибок: |
|
||
εα |
= ϕα −ϕα+ + ϕα+ −ϕ |
+ = ξα + bα . |
(2.38) |
|
Вектор bα |
= Mη [εα ] можно назвать смещением решения ϕα . |
Систематическая ошибка bα имеет вид
bα = α (KTWf K + αWϕ )−1 Wϕ (ωϕ − ϕ + ).(2.39)
Вектор
ξα = εα − Mη [εα ] = εα − bα |
(2.40) |
является случайным вектором с нулевым средним и определяется выражением
|
|
ξα = (KTWf K + αWϕ )−1 |
KTWfη . |
|
(2.41) |
||||||||||
Ковариационная |
|
матрица Vξα |
|
= M |
|
T |
этого |
вектора |
|||||||
|
|
ξαξα |
|||||||||||||
определяется выражением: |
|
|
|
|
|
|
|
|
|||||||
V = (KTW |
K + αW )−1 KTW |
f |
V W |
K(KTW |
K + αW )−1 , |
||||||||||
ξα |
|
f |
|
|
ϕ |
|
|
|
η |
f |
|
f |
|
ϕ |
|
Полагая W |
f |
=V −1 |
, получим |
|
|
|
|
|
|
|
|
||||
|
|
η |
|
|
|
|
|
|
|
|
|
|
|
|
|
Vξα = (KTWf K + αWϕ )−1 KTWf K(KTWf K + αWϕ )−1 ,(2.42) |
|||||||||||||||
Полная ошибка решения равна |
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
∆α |
j |
= bα |
+ Vξα |
|
, j = 1,...,M |
. |
(2.43) |
|||||
|
|
|
|
|
j |
|
jj |
|
|
|
|
|
Задание 2.3.
1. Задать матрицу системы K , вектор решения ϕ , ограничения на вектор ϕ вида (2.27).
2. Вычислить среднее значение |
|
и матрицу ковариации |
|
|
mϕ |
V ϕ |
|||
по формулам (2.28), (2.29). |
|
|
|
|
3. Для заданной матрицы K и вектора решения ϕ |
вычислить |
правую часть f .
4. Внести шум в правую часть, т.е. вычислить вектор
f = f + η,
25 |
26 |
где η - вектор ошибки, вычисляемый с помощью нормального датчика случайных чисел для двух случаев:
а) ошибки не коррелированны. Значения СКО задать равными σηi = δi fi , i =1,...,N ; δi = 0.01,0.05,0.01.
Матрица ковариации в этом случае будет диагональной
Vη = diag (σ2η1 ...,σ2ηN ) .
б) ошибки коррелированны. В этом случае вектор ошибок вычисляется по формуле η =Vη1/2ξ, где Vη - заданная
матрица ковариации; ξ - вектор, проекции которого
состоят из нормальных случайных величин с единичной дисперсией и нулевым средним.
5. Задать ограничения на вектор f вида (2.31) и вычислить
матрицу V η по формуле (2.32).
6. Вычислить решение системы (2.26) и погрешность по формуле
(2.43) для следующих вариантов:
а) Wf = I, Wϕ = I, ωϕ = 0, для различных значений
α [10−8,1]. Значения |
α определять по формуле |
|
αk = αk−1 10; |
|
|
−1 |
−1 |
|
б) Wf =V η , |
Wϕ =V ϕ |
, ωϕ = mϕ , α = 1. |
Примечание. При наличии научной задачи магистранта, которую можно свести к системе линейных уравнений, провести исследования этой задачи.
§2.4. Регуляризирующий SVD-алгоритм
Обратимся к системе уравнений (2.26) и вычислим решение этой системы, используя сингулярное разложение.
Предположим, что матрица Wf неотрицательно определена, симметрична и допускает представление
|
|
|
|
W |
f |
=W |
12 |
W |
12 . |
|
|
(2.44) |
||
|
|
|
|
|
|
|
|
f |
|
f |
|
|
|
|
Запишем сингулярное разложение |
|
|
|
|
||||||||||
|
|
|
|
W |
f |
12 K =UΛV T |
|
|
(2.45) |
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
и представим матрицу W |
|
в форме |
|
|
|
|
||||||||
|
|
|
|
ϕ |
|
|
|
|
|
|
|
|
|
|
|
|
|
Wϕ =V diag{m(λ1),...,m(λM )} VT |
(2.46) |
||||||||||
Тогда вектор |
ϕα |
регуляризированного решения СЛАУ можно |
||||||||||||
представить как |
|
|
|
|
|
|
|
|
|
|
|
|||
|
p |
|
|
λj |
|
|
|
|
|
1 |
|
|
αm(λj ) |
|
|
ϕα = ∑ |
|
|
|
|
|
uj ,Wf 2 fɶ |
+ |
|
vj ,(2.47) |
||||
|
λj2 +αm(λj ) |
|
||||||||||||
|
j=1 |
|
|
|
|
|
|
|
λj2 +αm(λj ) |
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
где |
vj , uj |
|
– |
j -е столбцы матриц |
V , U соответственно: |
|||||||||
p |
– ранг |
(или |
практический |
ранг) |
матрицы K . Из (2.47) |
непосредственно следует матричное представление решения ϕα :
ϕ |
α |
=V |
p |
R |
pα |
U |
TW |
12 fɶ +V |
Z |
V Tω |
, |
(2.48) |
|
|
|
|
|
p |
f |
p |
|
pα p ϕ |
|
|
|||
где Vp – матрица размера |
M × p , составленная из p первых |
||||||||||||
столбцов |
|
матрицы |
V ; |
|
Up – |
|
матрица |
размера |
N × p , |
||||
составленная из |
p |
первых столбцов матрицы U ; |
Rpα – |
диагональная матрица размера p × p следующей структуры:
27 |
28 |
|
|
|
|
λ1 |
|
0 |
|
0 |
|
|
|
|
|
|
λ2 |
+αm(λ ) |
|
|
|||||
|
|
|
|
|
|
|
|
|
|||
|
|
|
1 |
|
1 |
|
|
|
|
|
|
|
|
|
|
0 |
|
|
λ2 |
|
0 |
|
|
R |
pα |
= |
|
|
|
λ22 +αm(λ2 ) |
|
. (2.49) |
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0 |
|
0 |
|
λp |
|
|
|
|
|
|
|
|
λp2 +αm(λp ) |
|
|
Матрица Zpα имеет структуру
|
αm( |
λ1 ) |
0 |
|
|
||||
|
λ12 +αm(λ1 ) |
|||
|
|
|
||
|
0 |
|
|
αm(λ2 ) |
Zpα = |
|
|
λ22 +αm(λ2 ) |
|
|
|
|
||
|
|
|
|
|
|
0 |
|
0 |
|
|
|
|
|
|
0
|
0 . |
(2.50) |
m(λp )
λp2 +αm(λp )
Функция m(λ) является неубывающей функцией, например
m(λ) = |
1 |
, |
(2.51) |
|
λγ |
||||
|
|
|
||
где γ ≥ 0 . Если γ = 0 , то |
Wϕ = I , что |
соответствует |
регуляризации нулевого порядка. Чем больше значение γ , тем в большей степени проекции вектора ϕα взаимосвязаны между
собой. Это обусловлено тем, что векторы vj , соответствующие малым λ j и имеющие осциллирующие проекции, не войдут в
решение ϕα из-за пренебрежимо малого значения множителя
λj . λj2 +αm(λj )
Точность решения оценим как и ранее вектором
εα = ϕα − ϕ+ , который можно представить как
εα = ξα + bα .
Тогда полная погрешность вычисляется по формуле
|
|
|
|
|
∆α |
|
= bα |
j |
+ |
|
|
Vξα |
|
, j =1,...,M , |
|
|
(2.52) |
|||||||||||||||||||||
|
|
|
|
|
|
|
j |
|
|
|
|
|
|
|
|
|
jj |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
где вектор bα |
|
(см. формулу (39)) в сингулярном представлении |
||||||||||||||||||||||||||||||||||||
равен |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
=V |
|
Z |
|
|
VT (ω − |
|
+ ), |
|
|
|
|
|
|
(2.53) |
||||||||||||||||||
|
|
|
|
|
b |
p |
pα |
ϕ |
|
|
|
|
|
|
||||||||||||||||||||||||
|
|
|
|
|
α |
|
|
|
|
|
|
|
|
p |
|
|
ϕ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
а матрица ковариации решения (42) имеет вид |
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
V |
|
|
=V F VT . |
|
|
|
|
|
|
|
|
|
(2.54) |
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
ξα |
|
|
|
p pα |
p |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
Матрица |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
λp |
|
|
|
2 |
||
|
|
|
|
|
λ |
|
|
|
|
|
|
|
|
|
|
|
λ |
2 |
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
Fpα = diag |
|
|
|
|
1 |
|
|
|
|
|
|
, |
|
|
|
|
|
|
|
|
|
|
|
|
,..., |
|
|
|
|
|
|
|
, |
|||||
λ |
2 |
+ αm(λ ) |
|
|
λ |
2 |
+ αm(λ |
) |
λ |
2 |
+ αm(λ |
|
|
|
||||||||||||||||||||||||
|
|
1 |
|
|
|
|
|
2 |
|
|
|
p |
p |
) |
|
|
||||||||||||||||||||||
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
+ |
равен |
|
+ =VΛ−1UTW1/2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||
а вектор |
ϕ |
ϕ |
|
|
f . |
|
|
|
|
|
|
|
|
|
Задание 2.4.
1.Задать матрицу системы K , вектор решения ϕ .
2.Для заданной матрицы K и вектора решения ϕ вычислить
правую часть f .
3 Внести шум в правую часть, т.е. вычислить вектор
f = f + η,
где η - вектор ошибки, вычисляемый с помощью нормального датчика случайных чисел для двух случаев:
29 |
30 |
а) ошибки не коррелированны. Значения СКО задать равными σηi = δi fi , i = 1,..., N ; δi = 0.01,0.05,0.01.
Матрица ковариации в этом случае будет диагональной
Vη = diag (σ2η1 ...,σ2ηN ) .
б) ошибки коррелированны. В этом случае вектор ошибок вычисляется по формуле η =Vη1/2ξ, где Vη - заданная
матрица ковариации; ξ - вектор, проекции которого
состоят из нормальных случайных величин с единичной дисперсией и нулевым средним.
4. Задать ограничения на вектор f вида (2.31) и вычислить
матрицу V η по формуле (2.32).
5. Представить матрицу ковариации ошибок V η в форме
|
2 |
1 |
|
V |
η = ση Cη , где Cη = |
|
V η . |
σ2 |
|||
|
|
η |
|
6. Вычислить решение системы по формуле (2.48) и погрешность
по |
формуле |
(2.52) |
для |
следующих |
данных: |
Wf |
−1 |
= I, ωϕ = 0 |
для |
различных |
значений |
=V η , Wϕ |
|||||
α [10−8,1]. |
Значения α |
определять по |
формуле |
αk = αk−1 10. Значения параметра γ выбрать эмпирически.
Примечание. При наличии научной задачи магистранта, которую можно свести к системе линейных уравнений, провести исследования этой задачи.
Практическое занятие №3
Алгоритмы выбора параметра регуляризации
§3.1. Выбор параметра регуляризации на основе критерия оптимальности
Рассмотрим систему уравнений
|
Kϕ = f . |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(3.1) |
||||
Здесь K - матрица системы размерности N × M , |
f |
- вектор |
||||||||||||||||||
|
|
|
f |
|
|
|
||||||||||||||
правой части размерности |
|
N , равный |
= |
f |
+ η, где |
f |
- |
|||||||||||||
точная правая часть, η - погрешность |
правой части, которая |
|||||||||||||||||||
описывается |
моментами |
|
|
1-го |
и |
|
|
|
2-го |
|
порядка |
|||||||||
M[η] = 0, M[ηηT ] =Vη . |
|
Матрица |
|
Vη |
допускает |
|||||||||||||||
представление V = σ2 C |
η |
, где |
|
|
σ2 - скалярная величина, C |
η |
||||||||||||||
|
η |
η |
|
|
|
|
|
η |
|
|
|
|
|
|
|
|
|
|
||
- матрица размерности N × N . |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
Регуляризованное |
решение системы |
|
(3.1) ϕα |
является |
||||||||||||||||
решением следующей системы уравнений |
|
|
|
|
|
|
|
|
|
|
|
|||||||||
(KTV |
−1K +ασ |
2W )ϕ |
α |
= KTV −1 fɶ |
, |
|
|
(3.2) |
||||||||||||
η |
η |
|
ϕ |
|
|
|
η |
|
|
|
|
|
||||||||
где α > 0 - параметр регуляризации. |
|
|
|
|
|
|
|
|
|
|
|
|||||||||
Так как σ2 |
является константой, то в дальнейшем будем |
|||||||||||||||||||
|
η |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
рассматривать систему вида |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
(KTV |
−1K +αW |
|
)ϕ |
α |
= KTV |
−1 fɶ |
. |
|
|
|
|
(3.3) |
||||||||
η |
|
ϕ |
|
|
|
η |
|
|
|
|
|
|||||||||
В качестве матрицы Wϕ |
|
используется либо единичная |
||||||||||||||||||
матрица (регуляризация нулевого порядка), либо матрица вида |
|
31 |
32 |
|
|
1 |
−1 |
|
0 |
|
|
|
|
||||
W = |
|
−1 |
2 |
−1 |
|
|
ϕ |
|
|
−1 |
2 |
−1 |
|
|
|
|
|
|||
|
|
0 |
|
−1 |
1 |
|
|
|
|
|
|
|
|
(регуляризация первого порядка).
Рассмотрим вектор невязки eα = f − Kϕα = E (α ) fɶ ,
где E(α) |
- оператор невязки, который для |
решения, |
|||
определяемого из системы (3), равен |
|
|
|||
|
E(α ) = I − K (KTVη−1K +αWϕ )−1 |
KTVη−1 или |
|||
|
E (α ) =Vη (Vη +α −1KWϕ−1KT )−1 . |
|
(3.4) |
||
|
Тогда |
для |
матрицы ковариации |
вектора |
невязки |
V |
(α ) = M[e eT ] |
мы можем записать: |
|
|
|
e |
|
α α |
|
|
|
|
Ve (α ) = E (α )Vfɶ ET (α) . |
|
(3.5) |
где Vfɶ - матрица ковариации вектора правой части
Vf = M[ f f T ].
Вкачестве αopt возьмем такое значение αW , при котором принимается основная статистическая гипотеза:
H |
0 |
: |
V |
(α ) =V ET (α ). |
|
|
|
|
(3.6) |
|
|
e |
η |
|
|
|
|
|
|
Таким образом, значение |
αW |
можно рассматривать как |
|||||||
оценку оптимального параметра регуляризации αopt . |
|
||||||||
Для проверки гипотезы (3.6) введем статистику |
|
||||||||
|
|
|
|
T |
T |
|
|
−1 |
(3.7) |
|
|
|
ρW (α ) = eα Vη E |
|
(α ) |
eα , |
Подставляя (3.4) в (3.7), получим
ρW (α ) = fɶT Vη−1eα или
ρW (α ) = fɶT (Vη +α −1KWϕ−1KT )−1 fɶ . (3.8) Введем параметр γ =1/α. Тогда выражение (3.9) примет вид
|
|
|
ρW (γ ) = fɶT (Vη + γ KWϕ−1KT )−1 |
fɶ . |
|
|
(3.9) |
||||||||
|
|
W |
|
( |
η |
|
) |
( η |
|
) |
|
N |
|
|
|
M |
ρ |
|
(γ ) |
= Sp V ET |
(γ ) |
−1 |
V ET (γ ) |
= |
Sp[I |
|
] = N , |
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
где IN |
– единичная матрица размера N N . |
|
|
|
|||||||||||
|
|
|
Статистика |
ρ |
W |
(γ ) |
пари |
γ = γ |
W |
подчиняется |
χ2 - |
распределению с N степенями свободы. Тогда проверка гипотезы (3.6) сводится к проверке предположения: подчиняется
ли величина ρW (γ ) χ2 -распределению с N степенями свободы.
Для этого построим интервал
Θ |
N |
(β ) = ϑ |
N |
(β 2),ϑ |
N |
(1− β 2) , |
(3.10) |
||
|
|
|
|
|
|
|
|||
где ϑN (β 2) |
– квантиль |
χ2 -распределения уровня |
β /2 . Если |
||||||
ρW (α ) попадает в интервал (3.10), т.е. выполняется |
|||||||||
неравенство |
|
|
|
|
|
|
|
||
|
|
|
ϑN (β 2) ≤ ρW (γ ) ≤ϑN (1− β 2) , |
(3.11) |
то гипотеза (3.6) может быть принята с вероятностью ошибки первого рода, равной β . Следовательно, значение αW , при
котором выполняется (3.11), является оценкой для αopt .
Для |
N ≤10 |
граничные |
точки |
интервала ΘN (β ) |
– |
|||||
квантили ϑN (β 2) , |
ϑN (1− β 2) |
при |
β = 0.1 |
приведены |
в |
|||||
таблице 3.1. |
|
|
|
|
|
|
|
|
|
|
Таблица 3.1 |
|
|
|
|
|
|
|
|
|
|
N |
4 |
|
5 |
6 |
7 |
8 |
9 |
|
1 |
|
|
0 |
|
|
33 |
34 |
ϑN (0.0 |
|
0 |
|
1 |
|
1 |
|
2 |
2 |
3 |
3 |
|
||||||
|
.71 |
|
|
.14 |
|
.64 |
|
|
.17 |
.73 |
.32 |
|
.94 |
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ϑN (0.9 |
|
9 |
|
1 |
|
1 |
|
1 |
1 |
1 |
1 |
|
||||||
|
.49 |
|
|
1.0 |
|
2.6 |
|
|
4.1 |
5.5 |
6.9 |
|
8.3 |
|
||||
Если N >10 , |
то |
|
квантили |
достаточно |
точно |
|
могут |
|||||||||||
аппроксимироваться следующими выражениями: |
|
|
|
|
|
|||||||||||||
ϑN (0.05) ≈ N −1.64 |
|
; ϑN (0.95) ≈ N +1.64 |
|
.(3.12) |
||||||||||||||
2N |
2N |
|||||||||||||||||
Для вычисления |
γW |
используем |
итерационную |
|||||||||||||||
процедуру ньютоновского типа: |
|
|
|
|
|
|
|
|
||||||||||
γ (n) = γ (n−1) − |
ρW (γ (n−1) ) − N |
|
|
|
|
|
|
|
||||||||||
ρW′ |
(γ (n−1) |
) , n =1,2,..., |
(3.13) |
|||||||||||||||
|
|
|
|
|
с начальным значением γ (0) 10−15 . В качестве γW принимается значение γ (n) , удовлетворяющее (3.12). Заметим, что эта процедура решает нелинейное уравнение ρW (γ ) = N , но момент
останова определяется условием (3.12).
Замечание. Для вычисления статистики (3.9) необходимо вычислять обратную матрицу (Vη + γ KWϕ−1KT )−1 , что приводит к увеличению трудоемкости вычислений. Чтобы этого избежать, запишем статистику ρW (γ ) в форме ρW (γ ) = f T qγ , где вектор qγ является решением системы
(V + γ KW −1KT ) q = f |
. |
(3.14) |
|
η |
ϕ |
В формуле (3.14) используется производная ρW′ (γ ) , равная
ρW′ (γ ) = f T qγ′ , где вектор qγ′ является решением системы уравнений
(Vη + γ KWϕ−1KT ) (KWϕ−1KT )−1 q′ = −qγ . (3.15).
Задание 3.1.
Для построенного регуляризованного решения в лабораторной работе №2 при неполной информации (см. задание 2.3 в работе №2) вычислить:
1)параметр регуляризации αW ;
2)регуляризованное решение ϕαW ;
3) ошибку решения ∆α |
j |
= bα |
+ |
Vξα |
|
, j =1,...,M |
|
|
j |
|
jj |
Примечание. При наличии научной задачи магистранта, которую можно свести к системе линейных уравнений, провести исследования этой задачи
§3.2. Алгоритм выбора параметра регуляризации с использованием SVD-разложения на основе критерия оптимальности
Предположим, что: |
|
|
• |
ковариационная матрица Vη допускает |
представление |
V = σ 2C , и определим сингулярное разложение |
|
|
η |
η η |
|
|
C−12 K = UΛV T , |
(3.16) |
|
η |
|
допуская при этом, что сингулярные числа λj упорядочены по убыванию, т.е. λj ≥ λj+1 и λj = 0, j = p +1,...,M , где p – ранг
(или практический ранг) матрицы системы;
• регуляризированное решение ϕα представимо в виде:
p |
|
|
λj |
|
− 1 |
|
|
|
ϕα = ∑ |
|
|
|
uj ,Cη |
2 fɶ |
vj , |
(3.17) |
|
2 |
+αm(λj ) |
|||||||
j=1 |
|
λj |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
35 |
36 |
где m(λ) невозрастающая функция m(λ ) = λ1τ , где τ ≥ 0.
Нетрудно показать, что вектор ϕα является системы
(KT Cη−1K +αWϕ )ϕα = KT Cη−1 fɶ ,
вкоторой матрица Wϕ выражается соотношением:
Wϕ = Vp diag{m(λ1 ),m(λ2 ),...,m(λM )}VpT ,
где Vp – матрица размера M × p , составленная из столбцов матрицы V , входящей в разложение (3.16). Теперь статистику ρW (α ) можно записать в виде
|
|
|
|
|
|
|
|
1 |
|
−1 |
|
T |
|
−1 |
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
ρw (α ) = |
|
(Cη |
|
2 fɶ) (Cη |
|
2eα ) , |
|
|
|
|
|||||||||||
|
|
|
|
σ 2 |
|
|
|
|
|
|
|||||||||||||||
|
|
|
|
|
|
|
|
η |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
где векторы |
C−12 |
fɶ , C−12e |
допускают представление: |
||||||||||||||||||||||
|
|
|
|
η |
|
|
|
η |
α |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
−12 ɶ |
|
|
N |
|
|
|
−12 ɶ |
|
|
|
|
N |
ɶ |
|
|
, |
|
||||
|
|
|
|
Cη |
f = ∑ uj ,Cη |
f |
uj = ∑yjuj |
|
|||||||||||||||||
|
|
|
|
|
|
|
|
j=1 |
|
|
|
|
|
|
|
|
|
j=1 |
|
|
|
|
|||
|
|
−1 |
2 |
|
p α m(λj ) |
|
ɶ |
|
|
|
N |
|
ɶ |
|
|
||||||||||
|
|
Cη |
eα = ∑ |
|
2 |
|
|
|
|
|
|
uj + |
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
yj |
∑ yjuj |
|||||||||||||||
|
|
|
|
|
j=1 λj +αm(λj ) |
|
|
|
|
j= p+1 |
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
где |
ɶ |
= (uj |
−12 ɶ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
yj |
,Cη |
f ) . Тогда |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
1 |
|
p |
|
α m(λj ) |
|
|
ɶ2 |
N |
|
ɶ |
2 |
|
||||||||
|
|
ρW (α ) = |
2 |
|
∑ |
2 |
|
|
|
|
|
|
|
|
|
|
|
. |
|||||||
|
|
|
|
|
ση |
j=1 |
λj +αm(λj |
) |
|
|
|
j= p+1 |
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Введем γ = 1/α и функции |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
1 |
|
|
p |
|
m(λj ) |
|
|
|
ɶ2 |
|
|
||||
|
|
|
|
RW (γ ) = |
2 |
|
∑ |
|
2 |
|
|
|
|
|
|
|
, |
||||||||
|
|
|
|
|
|
+m(λj ) |
yj |
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
ση j=1 |
γ λj |
|
|
|
|
решением
(3.18)
p первых
(3.19)
(3.20)
(3.21)
(3.22)
(3.23)
|
|
|
|
∂RW (γ ) |
|
1 |
|
p |
|
λj2 m(λj ) |
|
|
|
2 |
|
|
|
W ( |
γ |
) |
= |
|
|
= − |
|
|
∑ |
|
|
|
yɶ |
j |
. |
(3.24) |
|
|
|
2 |
|
|
2 |
||||||||||||
R′ |
|
∂γ |
ση |
j=1 γ λj2 +m(λj |
) |
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Для вычисления γW используем итерационную процедуру: |
|
||||||||||||||||
γ (n) |
= γ (n−1) − |
RW (γ (n−1) ) − p |
, n =1,2,..., |
|
|
|
|
|
(3.25) |
||||||||
RW′ (γ (n−1) ) |
|
|
|
|
|
|
с начальным значением γ (0) 10−15 . В качестве γW принимается значение γ (n) , удовлетворяющее условию
ϑp (β 2) ≤ RW (γ ) ≤ ϑp (1− β 2) . |
(3.26) |
Задание 3.2.
Для построенного регуляризованного решения в лабораторной работе №2 при неполной информации (см. задание 2.4 в работе №2) используя SVD-разложение, вычислить:
1)параметр регуляризации αW ;
2)регуляризованное решение ϕαW ;
3) ошибку решения ∆α |
j |
= bα |
+ |
Vξα |
|
, j =1,...,M . |
|
|
j |
|
jj |
Примечание. При наличии научной задачи магистранта, которую можно свести к системе линейных уравнений, провести исследования этой задачи
§3.3. Алгоритм выбора параметра регуляризации основе статистического принципа невязки
Для вычисления значения αV проверяется статическая гипотеза
37 |
38 |
H0 :Ve (α) = Vη |
(3.27) |
Для проверки (3.27) введем статистику ρV (α) = eαTVη−1eα .
Здесь - вектор невязки. Учитывая, что ϕα = (KTVη−1K + αWϕ )−1 KTVη−1 fɶ , получим:
eα = f − Kϕα = fɶ − K (KTVη−1K + αWϕ )−1 KTVη−1 fɶ = (3.28) =Vη (Vη + α−1KWϕ−1KT )−1 f
Тогда выражение для статистики примет вид:
ρV (α) = eαTVη−1eα =
= f T (Vη +α−1KWϕ−1KT )−1Vη (Vη +α−1KWϕ−1KT )−1 f
Введем γ =1/α , получим
ρV (γ ) = f T (Vη +γ KWϕ−1KT )−1Vη (Vη +γ KWϕ−1KT )−1 f .(3.29)
Вычислим производную по γ . Для этого представим ρV (γ ) в виде
ρV (γ ) = gTVη g , |
(3.30) |
|
где |
|
|
g = (Vη + γKWϕ−1KT )−1 f . |
(3.31) |
|
Тогда производная от ρV (γ ) |
равна |
|
(ρ (γ ))′ = 2gTV g′ , |
(3.32) |
|
V |
η |
|
где
g′ = −(KWϕ−1KT )(Vη + γKWϕ−1KT )−2 f = |
. (3.33) |
||||||
= −(KWϕ−1KT )(Vη + γKWϕ−1KT )−1 g |
|||||||
|
|||||||
Вычисление g′ по формуле |
(3.33) |
эквивалентно |
решению |
||||
системы уравнений |
|
|
|
|
|
|
|
(Vη + γKWϕ−1KT )(KWϕ−1KT )−1 |
g′ = −g . |
(3.34) |
|||||
Для вычисления |
γV используем |
итерационную |
процедуру |
||||
ньютоновского типа: |
|
|
|
|
|||
γ (n) = γ (n−1) |
− |
ρV (γ (n−1) |
) − N |
, |
n =1,2,..., |
(3.35) |
|
ρV′ (γ (n |
−1) ) |
||||||
|
|
с начальным условиемγ (0) 10−15 .
Итерационный процесс завершаем при выполнении условия
ϑN (β 2) ≤ ρV (γ ) ≤ ϑN (1− β 2) . |
(3.36) |
||
где ϑN (β 2) , ϑN (1− β 2) |
– квантили |
χ 2 -распределения с |
|
N степенями свободы |
уровней |
β 2 , |
1− β 2 |
соответственно. |
|
|
|
Задание 3.3.
Для построенного регуляризованного решения в лабораторной работе №2 при неполной информации (см. задание 4 в работе №2) вычислить:
1)параметр регуляризации αV ;
2)регуляризованное решение ϕαV ;
3) ошибку решения ∆α j = bα j + Vξα jj , j = 1,...,M .
39 |
40 |