
книги / Математические методы принятия решений
..pdf§ 7.14. Оценка значений параметров в сигноме
Рассмотрим задачу оценки вектора параметров 0 сигнома (са мый общий вид многомерного полинома)
к |
т |
ч=/«,в)=2 |
П |
i = l |
j = 1 |
где aij —показатель степени аргумента сигнома, при условии, что все ошибки измерений —независимые нормально распределенные случайные величины с нулевыми средними и известными диспер сиями o2(xij) и o2(ui). Функционал (7.10) будет иметь вид
р _ J_ у ' / у ' |
foü ~ Sij)2 , (Vi ~ /(£ ь Q))2 |
(7.32) |
|||
2 |
ы \ V“ ï |
°2{Xi^ |
° 1{Vi) |
||
|
|||||
Ограничение |
6 Di можно записать следующим образом: |
||||
|
I%ij |
I ^ |
3o(Xij). |
|
Чтобы упростить вид функционала (7.32), задачу минимизации по 0 сводим к задаче поиска минимума квадратичной формы
(7(0) = у 0М 0 + ат0,
где элементы матрицы квадратичной формы А имеют вид
1 |
п |
|
|
ajr+ccjp |
|
|
|
° 2(Vi) |
п ij |
> г = 1, 2, |
р = 1, 2, . . . , к, |
Xij —значение г-й переменной, полученной в j - м измерении; ат — вектор с компонентами
71 |
П |
г = 1, 2,
Точка минимума формы (7(0) определяется методом сопряжен ных градиентов.
Пересчет точных значений аргументов с учетом усло вий (7.12) сводится к решению п несвязанных между собой систем
точных значениях переменных Çÿ по сравнению с предыдущим шагом итерационного процесса, что приведет к снижению скоро сти сходимости процесса и даже к возникновению колебаний. Для устранения этих нежелательных последствий после пересчета ^
те значения |
на которых произошло увеличение соответствую |
||
щих слагаемых функционала |
|
||
|
р = т |
( x a - l t j f |
( у г - т , в))2 |
|
j=1 |
° 2(Xij) |
° 2(Уг) |
по сравнению с предыдущей итерацией, необходимо заменить зна чениями с предыдущего шага.
Элементы ковариационной матрицы ошибок (матрицы рассеи вания) для оценок вектора искомых параметров 0 подсчитываются как элементы матрицы, обратной матрице N с элементами
где 0 — полученная оценка вектора параметров 0.
Многочисленные вычислительные эксперименты позволяют сде лать вывод о состоятельности рассматриваемых оценок.
Пример. Найти оценки вектора параметров 0 в модели т) = = 0 1 5 , ^ + 0 2 ^ + 0 3 ^ .
Предварительно были взяты значения: 0) = 1, 02 = —1, 0з = 2, 5i = (1, 1, 2, 2, 3 , 3)т, £2 = ( 1, 2, 1, 2, 1, 2)т, и вычислены значения г) =
=(2, 6,1 4,16,48,42)т
Спомощью датчика случайных чисел на точные значения т)
и5 налагались помехи с математическим ожиданием, равным ну лю, и дисперсиями, равными 0,020 для Çj, 0,015 для £2, 0,1 для т). Получены следующие реализации:
у = (2,2057; 6,1090; 14,0602; 15,7987; 47,8996; 42,1214)т, х, = (1,0070; 0,9604; 2,0123; 2,0427; 3,0027; 2,9781)т,
х 2 = (1,0011; 2,0159; 1,0142; 1,9916; 1,0233; 1,9861)т. Результат решения регрессионной задачи следующий:
0,р = 0,895, 02р = -0,893, 03р = 1,975.
методом максимума правдоподобия может быть составлен функ ционал, координаты точки минимума которого будут определять оценку вектора 0 искомых параметров.
Если распределение случайной величины / ( х + 8,0) подчиняет ся нормальному закону, то для оценки вектора параметров 0 полу чим функционал для метода наименьших квадратов, но дисперсия случайной величины f i x + 8, 0) будет зависеть от значений коор динат вектора 0, т. е. соответствующие уравнения для определения оценок 0 будут нелинейными.
Если контролируемая переменная х является случайной величи ной (т. е. определяется с помощью некоторого процесса случайного выбора), полученные выше выводы останутся в силе, когда 8 и е не коррелированы с х [40]. Предположение о некоррелированности для ошибки е обычно выполняется, но для ошибки 8 ситуация слож нее. Например, требование некоррелированности 8 и х в данном случае означает, что большие значения х не приводят к увеличе нию или уменьшению ошибок в определении истинного значения х. Выполнение этого условия может быть проверено только эмпири ческим путем.
Заметим, что при неизвестной дисперсии о2(8) или ее оценки в активной схеме эксперимента не идентифицируемы даже свобод ные параметры кубической параболы [40].
Рассмотрим в качестве примера задачу оценки свободных пара метров 0 в линейном уравнении
Т) = 01 + 02^.
Выражая переменные т) и Ç через х н у , получим структурное соот ношение
Vi = 0 1 + 0 2 x i + 0 2 ^ i + Ег-
Пусть независимые случайные величины 8 и е подчиняются нормальному закону распределения с нулевыми математическими ожиданиями и известными дисперсиями o2(xi) и a2{yi). Функции плотности вероятности случайных величин 028* + е* будут иметь следующие числовые характеристики:
М[0г8г + Ei] = 0,
О2[0г8г + Ег] = 02<72(Xi) + С2(Уг), I = 1, 2, ..., П.
где (pj(Ç) — функции произвольного вида. Тогда структурное соот ношение имеет вид
771
Уг = 00 + 2 Qj'Ÿj(Xi + bi) + Еi.
3 = 1
Здесь не всегда можно выделить случайную составляющую, присутствующую в срj(xi + 8j). Метод максимума правдоподобия (ММП) и в этом случае позволяет получить функционал, точка ми нимума которого дает оценки вектора 0 искомых параметров. Вид функционала ММП и способ получения вектора оценок 0 опреде ляются конкретным видом функций фj(x).
В работе [30], чтобы упростить задачу получения оценок 0, функции ф^-(х) разлагают в ряд в окрестности точки xf.
М[Уг] = 9ТфОг) + 0 ( а 3(Хг)),
1 ^2
Ф Д х О = Ь ( х г) + - 0 2( X i ) t r ^ 7 ,
где tr А — след матрицы А, М[у*] — математическое ожидание зна чений y i . Дисперсия значений ф^-(^) записывается в виде
М[(Уг - м [yi])2] = a2(yi) + CT2(Xi)0T| ^ ^ 0 + О (а 3(я 0).
Задача свелась к классической регрессионной задаче, оценки па раметров 0 находятся итерациями по методу наименьших квадратов
с учетом того, что
Уг = 0Тф(Жг) + pi,
Ы х) = 9j(x) + у о2(х) f ]
M [pi] = 0, М[р?] = о2(уд + о \ х ^ g 0 + 0 (a 3(xi)).
Для линейных функций по этим формулам получим тот же функционал (7.36), что и в пассивной схеме эксперимента. Для нелинейных функций оценки, полученные при обработке одних и тех же данных различными методами, будут существенно отли чаться (очевидно, что экспериментальные данные должны обра батываться тем методом, который следует из условий проведения эксперимента и статистики результатов наблюдений).
Г л а в а 8
ПРИНЯТИЕ РЕШЕНИЙ ПО ВЫБОРКЕ ФИКСИРОВАННОГО ОБЪЕМА С УЧЕТОМ ПОГРЕШНОСТИ ПРИЗНАКОВ
§ 8.1. Статистические свойства параметров функции Гаусса, определенных непосредственно
и с помощью операций линеаризации
Случайные величины, распределенные по нормальному закону, наиболее часто встречаются в практических приложениях, посколь ку сумма даже трех соизмеримых равномерно распределенных слу чайных величин имеет в результате распределение, близкое к нор мальному. Плотность распределения вероятностей в данном случае имеет вид функции Гаусса. В приложениях часто функцию Гаусса
путем преобразования координат сводят к уравнению прямой
а
где tip—р-квантиль случайной величины х с функцией распре деления вероятностей F(x), т. е. такое значение аргумента функ ции F(x), для которого вероятность события х < и р равна заданно му значению вероятности р.
Представим (рис. 8.1) на плоскости х, ир прямую, полученную в процессе линеаризации функции Гаусса. Эта прямая пересекает ось абсцисс в точке L ( X L , 0), а горизонтальную прямую хр = —1 в точке N (X N , —1). Координата x i определяет оценку параметра а, т. е. a = x i , a разность абсцисс точки L ( X L , 0 ) и точки N (x^ , —1) определяет оценку параметра ст, т. е. S = хь —хщ.