Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Churakov_Mat_met_obr_exp_dan_v_ekon

.pdf
Скачиваний:
30
Добавлен:
26.03.2016
Размер:
5.46 Mб
Скачать

min/ = SPKQ^ fn^m^ - /в^ва)^(>^)с1у,

(2.86)

у

 

где KB, niQ — ковариационная матрица и математическое ожидание вектора в соответственно.

Аналогичным образом можно представить и второе слагаемое. Рассмотрим теперь частный случай задачи, позволяющий на основании (2.85) получить алгоритм оценивания как явную функцию от экспериментальных данных у. Этот случай охваты­ вает линейную модель (2.4) при гауссовских некоррелированных векторах в н е , т.е., как и ранее, принимается в ~ Л^(/пе, Ае)? е ~ Л^(0, Ае). Необходимая для оценивания апостериорная плот­ ность |ы(в [д') находится в соответствии с (2.77). Запишем в явном

виде формирующие ее функции:

рпГ^^\Кв\

Общий показатель экспоненты, образующийся после подста­ новки этих функций в (2.77), представим в удобной для последу­ ющего интегрирования форме

(в - me)^ Ке-\е ^те)^(у^ "FOfx^-^iy - Тв) = = ^ + (в - G)^D(e - G).

Величины д, G, D находим из условия тождественного выпол­ нения последнего соотношения

q = we^ Ks'^ те + / Ае"V - G^DG, D = ^^Kf^^ + Ке-\ G = D-\KS-^ me + 4f^K^-^y),

Подставив с использованием этих преобразований функцию (2.77) в (2.85), получим

оо

оо

в= Jeexp{-0,5(e-G)'^Z)(e-G)}de/ Jexp{-0,5(e-G)'^Z)(e-G)}de.

—(Х>

—оо

100

Дальнейшее многомерное интегрирование осуществляется следующим образом (например,[29]). Так как матрица D симмет­ рическая, существует ортогональная матрица R, диагонализирующая матрицу Z), те. обладающая свойствами R^R = Е, R^DR = = 5 = diag [5/], / = 1, 2,..., w + 1, где 5 - диагональная матрица из собственных чисел 5/ матрицы D. Исходя из существования такой матрицы, введем новую переменную Q, которая с вектором в связана соотношением в - G = RQ =» dO = \R\ dQ. Так как R - ор­ тогональная матрица, можем положить |i?| = 1, т.е. de = dQ. В ре­ зультате выражение для оценки в принимает вид

оо

оо

e-^G-R\ вехр{-0,5Q^SQ}dQI

\ ехр{-0,5Q'^5Q}dQ.

 

w+l

Пусть Q= [q\ ^2 -• ^m+il • Тогда Q SQ= ^ SIQI И многомер-

НЫЙ интеграл в числителе оценки в в развернутом виде оказыва­ ется таков:

оо оо

оо

Яг expj-0,5 S SiQi d9id^2-d?/n+l-

 

 

—оо—оо

—оо

 

 

 

Ят+1

Так как в силу нечетности подынтегральной функции

оо

J ^/exp{-0,55ygj}d^y =0, у =1, 2 ..., АИ + 1,

—оо

то второе слагаемое в выражении для в обращается в нуль и окончательно получаем

:=. п-1/шТг^-1

- 1 ,

(2.87)

в = G = D'CP^K^-'y

+ Ке' те).

Оптимальная байесовская оценка, таким образом, при ли­ нейной гауссовскай модели экспериментальных данных и квад­ ратичной функции стоимости оказывается линейной относи­ тельно вектора наблюдений у. Линейность проявляется именно при этих условиях. Если же модель экспериментальных данных окажется нелинейной относительно вектора параметров в или

101

хотя бы один из векторов в, е будет негауссовским, байесовский алгоритм становится нелинейным.

Легко видеть, что байесовский алгоритм (2.87) полностью совпадает с оценкой (2.79), оптимальной по критерию максиму­ ма апостериорной плотности вероятностей. И это не случайно. Гауссовская апостериорная плотность вероятностей вектора в достигает наибольшего значения в точке, являющейся апостери­ орным средним этого вектора. Но и байесовская оценка (2.85) представляет собой апостериорное среднее. Этим и объясняется совпадение обеих оценок. Подобное совпадение обнаруживается при всех унимодальных и симметричных относительно моды апостериорных плотностях вероятностей. Следствием совпаде­ ния оценок (2.79), (2.87) оказывается совпадение и их свойств: байесовская оценка (2.87) является несмещенной и имеет кова­ риационную матрицу ошибки (2.81). Минимальное значение min /байесовского риска (2.82) в данном случае находится доста­ точно просто. По определению min/ = М{\\ в - в|р} = = М{(ё - в)^(в - в)}, где в - байесовская оценка (2^87). С дру­ гой стороны, из (2.81) для этой же оценки имеем М{(0 — в)Об - - в)^} = D~\ Но М{(ё ~ в)^(в - в)} = Sp М{(в - в)(в - в)^} и, следовательно, min J'= SpD .

Следует отметить, что байесовский подход является наиболее универсальным средством оценивания. Можно показать, напри­ мер, что максимально правдоподобные оценки соответствуют минимуму так называемого условного байесовского риска (см. далее) при простой функции потерь. Оценки, соответствующие максимуму апостериорной плотности вероятностей, могут быть получены из условия минимума среднего (безусловного) риска (2.82) также при простой функции потерь.

2.7. Минимаксные оценки регрессионных параметров

Познакомимся еще с одним методом оценивания, который в эконометрических задачах не имеет широкого применения, но потенциально может оказаться полезным. Этот метод формирует так называемые минимаксные оценки и применяется в тех случа­ ях, когда априорная плотность со0(в) случайного параметра в неизвестна и оценивание осуществляется в расчете на наиболее неблагоприятную обстановку.

102

Снова обратимся к средним байесовским потерям (2.82). Вос­ пользуемся уже неоднократно применявшимся представлением v(y,&) = (i)Q(Q)L(y I в) и запишем средний риск в новой форме:

/ = Jr(e)a)e(e)de,

(2.88)

е

 

где функция г(в) называется условными потерями (условным рис­ ком) и определяется очевидным образом:

/-(в) = J С(еМу))Цу I e)d>;.

(2.89)

Пусть каким-либо образом найдена л/обал оценка в\(у). Если эту оценку подставить в (2.89), то, проинтегрировав, найдем ус­ ловный риск как функцию параметра в. Обозначим эту функцию символом ri(e). При некотором в функция ri(e) достигает наи­ большего значения. Пусть это будет в точке в = вь т.е. Qi = = arg max ri(e), и в этой точке условный риск принимает значе­ ние ri{Qi) = max ri{S). Если, далее, взять какую-либо другую оценку В2(У) и проделать те же самые операции, то при сохране­ нии того же принципа обозначений получим ^2(02) = max ^2(6). Для оценки ^з(У) аналогичным образом найдем /'з(вз) = max гз(в). Если теперь абстрактно представить, что удалось перебрать все мыслимые оценки, то найдется такая оценка в (у), которой будет соответствовать значение г*(в ) = max г*(в), меньшее, чем при любой другой оценке. Эта оценка и называется минимаксной.

Формально, таким образом, минимаксная оценка в опреде­ ляется условием

тахг(в,в*) = min шах г(в,в),

(2.90)

е

е е

 

т.е. при минимаксной оценке максимум условного риска по век­ тору регрессионных параметров в оказывается наименьшим среди всех максимумов при любых других оценках, что и определяет название этого метода оценивания.

Критерий (2.90) минимакса на практике часто оказывается не совсем удовлетворительным, так как по сравнению с другими минимаксная оценка может дать выигрыш в очень малой облас­ ти значений вектора в, реальные значения которого этой облас­ ти могут и не принадлежать. Дополнительно на пути поиска ми-

103

нимаксных оценок встречаются не всегда преодолимые аналити­ ческие трудности.

Втеории статистических решений доказывается следующее.

1.Минимаксная оценка существует и представляет собой байесовскую оценку при некоторой априорной плотности веро­ ятностей сов (в) вектора в, которая называется наименее благо­ приятной априорной плотностью. Плотность сое (в) является та­ кой, что оптимальная байесовская оценка при этой плотности ха­ рактеризуется большим средним риском, чем оптимальная байе­ совская оценка при любой другой плотности сое(в) и той же функции стоимости. Таким образом, минимаксная оценка дает наилучший результат в наихудших условиях, которые, вообще го­ воря, могут и не соответствовать решаемой конкретной задаче.

2.Если существует такая байесовская оценка в^(у), при кото­ рой условный риск (2.89) оказывается константой, не зависящей от вектора в, то эта оценка будет минимаксной, т.е. в (у) = в'^(у). Если же условный риск обращается в константу при небайесов­ ской оценке в(у), то это не означает, что в(у) является минимакс­ ной оценкой.

Вторым свойством иногда удается воспользоваться для на­ хождения наименее благоприятной плотности Ш0 (в). Для этого байесовскую оценку как функцию записанной в общем виде ап­ риорной плотности со0(в) (например, как апостериорное среднее при квадратичной функции стоимости) подставляют в выраже­ ние для риска (2.89) и пытаются найти такую плотность сое(в), при которой условный риск обращается в не зависящую от в константу. В случае удачи соответствующая плотность сое(в) ока­ зывается наименее благоприятной плотностью Ше (в), при кото­ рой байесовская оценка оказывается минимаксной. В ряде случа­ ев, в частности при линейной модели (2.4) экспериментальных данных и квадратичной функции стоимости, наименее благопри­ ятной плотностью является равномерная.

Вторая часть

МАТЕМАТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ

ВРЕМЕННЫХ РЯДОВ

Глава 3

СТРУКТУРНО ДЕТЕРМИНИРОВАННЫЕ ВРЕМЕННЫЕ РЯДЫ

ЗЛ. Математические модели структурно детерминированных временных рядов

Часто анализ какого-либо экономического явления сопровожда­ ется изучением свойств некоторой функции y{t), характеризую­ щей его развитие и представляющей собой функцию времени. Такую изменяющуюся во времени функцию принято называть процессом. Так, например, могут представлять интерес ежемесяч­ ный объем продукции, выпускаемой некоторым предприятием, ежемесячная заработная плата какой-либо семьи, ежегодная уро­ жайность определенной сельскохозяйственной культуры, изме­ нение температуры в течение того или иного промежутка време­ ни и т.п. Область определения подобных процессов может быть как непрерывной, так и дискретной. Температура непрерывно изменяется во времени, что может быть измерено прибором и квалифицировано как функция с непрерывной областью опреде­ ления. Заработная плата обычно фиксируется один раз в месяц и, следовательно, определена на дискретном множестве значений ее аргумента. Но независимо от исходной природы процесса практически регистрация его значений обычно осуществляется в дискретные, как правило, равноотстоящие моменты времени

105

/i, /2? •••5 ^м ^/+1 — //= const, следствием чего является совокупность величин Я/]), y{t2)y..., y(tn)- Эти величины удобно обозначить бо­ лее лаконичными символами у\, У2, -••, Ум или yi, / = 1, 2, ..., N. Упорядоченную во времени последовательность наблюдений yi,

/ = 1, 2,..., iV, принято называть временным рядом.

Элементы, или уровни, УиУ2, '•••> з^л^ временного ряда являются случайными величинами в том смысле, что заранее, до проведе­ ния эксперимента, точные значения их предсказать невозможно. Так, едва ли кто-либо совершенно точно может сказать, какая температура будет в шесть часов утра такого-то числа или какая урожайность пшеницы будет в /-м году Даже заработная плата человека, находящегося на окладе, может претерпевать заранее мало ожидаемые изменения.

Временной ряд, отражающий эволюцию какого-либо эконо­ мического процесса, используется для формирования определен­ ных суждений о развитии этого процесса. Чтобы это суждение (решение) выработать, элементы ряда следует подвергнуть мате­ матической обработке по определенному правилу (алгоритму). Но для этого необходимо математически описать сам ряд, т.е. со­ ставить его математическую модель.

Мы будем придерживаться двух взглядов на математическую природу временного ряда. При первом из них зарегистрирован­ ную последовательность уровней УьУг^ ••-> }^лг интерпретируем как реализацию некоторого случайного процесса (случайной после­ довательности) и соответствующую математическую модель строим на основе аппарата теории случайных процессов. Полу­ ченную таким образом математическую модель временного ряда будем называть стохастической. Изучение и применение таких моделей даны в следующей главе.

Вторая точка зрения заключается в том, что мы считаем вре­ менной ряд состоящим из двух слагаемых, первое из которых представляет собой полностью определенную с точностью до не­ скольких параметров функцию (такие функции часто называют квазидетерминированными или структурно детерминированны­ ми), а второе слагаемое является последовательностью независи­ мых центрированных случайных величин. Временные ряды с та­ кой трактовкой структуры их модели будем называть структурно детерминированными (или квазидетерминированными). Их изу­ чению посвящена настоящая глава.

106

Итак, в соответствии со второй концепцией полагаем: yi=fi+Pbi=^\a.-^,N, (3.1)

где/- =Л^/) - квазидетерминированная составляющая, обычно назы­ ваемая трендом временного ряда,/?/— случайная составляющая.

Математически первая из них принимается известной с точ­ ностью до некоторой совокупности неизвестных параметров ^0, ^ь ..., л^, как правило, линейно входящих в выражение тренда /(//). Весьма распространенной такой зависимостью является ли­ нейная комбинация известных функций щ{(), А: = О, 1,..., q\

fi =f{ti)= i ai,i^,,{ti), / = 1, 2, ..., N.

(3.2)

A:=0

Частным случаем модели (3.2) является полиномиальная, в которой 9)t(//) = // и, следовательно,

fiicij^tf.

(3.3)

А:=0

 

В ЭТОМ случае детерминированная составляющая временного ряда (тренд) является многочленом ^-го порядка с неизвестными коэффициентами aj^,k = Q, 1, 2,..., q. Этим коэффициентам мож­ но придать определенный физический смысл, если функцию/(/), считая ее q раз дифференцируемой, разложить в ряд Тейлора в ок­ рестности, например, точки t\ и ограничить разложение {q + 1)-й частичной суммой

В ЭТОМ случае Ф^а/) = ^(^/ -h)\ aj, =/^\н), к = 0,1,..., q, т.е.

неизвестные параметры физически представляют собой значение функции ДО? скорости ее изменения, ускорения и т. д. в точке

Если ввести в рассмотрение (q + 1)-мерные векторы

а = [ао ai... agf, Ф/ = [фо(//) Щ^д ... Ф^(//)]^,

107

то выражение (3.2) можем переписать в более удобной форме:

/ ; = ( Ф , , / |) = Ф А , /=1,2,...,7V,

(3.4)

где, как и ранее, (,) - символ скалярного произведения, ^- символ транспонирования.

Случайная составляющая в (3.1), как уже отмечалось, облада­ ет свойствами:

Л/{/;,} = 0, М{л/7,.} = Г^''' = А

(3.5)

[О, 1Ф]

 

Здесь, как и ранее, М— символ усреднения. Дисперсия а^ мо­ жет быть как известной, так и, что наиболее часто наблюдается в реальных задачах, неизвестной. Последовательность случайных величин со свойствами (3.5) обычно принято называть дискрет­ ным белым шумом. Второе условие в (3.5) является следствием не­

зависимости величин/7/ и/?, при i^L

а дисперсия, вообще говоря,

может меняться во времени, т.е. а

= аД но мы пока ограничим

рассмотрение случаем (3.5).

 

Таким образом, в случае структурно детерминированного временного ряда имеем

M{yi) = (Ф,, а) = фДа, M{(yrf} = а\

где у° - центрированная случайная величина.

Временной ряд (3.1) имеет детерминированное с точностью до вектора а математическое ожидание, и члены ряда относи­ тельно его среднего совершают случайные отклонения со свойст­ вами (3.5). Эти отклонения обусловлены случайными изменени­ ями самого ряда, а также могут быть порождены неточностью из­ мерений, сопровождающих эксперимент.

Всвязи с моделью (3.1), (3.4) возникает ряд важных вопросов,

вчастности: как выбрать функции щ(0, чтобы в последующем получить достаточно «комфортные» алгоритмы обработки ряда; какое число д составляющих модели следует принять, чтобы по­ лучить модель, адекватную реальным наблюдениям; как посту­ пать с неизвестной дисперсией а^ и, наконец, для какой цели ис­ пользуется временной ряд.

108

Ответим прежде всего на последний вопрос. С использова­ нием рядов могут решаться различные прикладные задачи. При­ оритетной из них мы будем считать следующую: временной ряд используется для того, чтобы по имеющимся наблюдениям у,, / = 1, 2, ..., 7V, спрогнозировать будущее значение ряда для како­

го-либо момента tfn > ^м т.е. найти оценку 9^^ = Y(t^) = Ут(Уь Уг

...,у^) будущего значения ряда как функцию имеющихся в нашем распоряжении наблюдений yuy2y;yN- Такую задачу принято на­ зывать задачей прогнозирования (предсказания, экстраполяции) временного ряда. Ответы на остальные вопросы, так же как и jwa вопрос о том, как найти «хорошую» в каком-то смысле оценку У;„, будем искать в процессе последующего изложения материала.

В заключение обратим внимание на внешнее сходство моде­ ли (3.1), (3.4) временного ряда и рассмотренных в первой части пособия регрессионных моделей. По существу они отличаются только физической содержательностью. Если время / в (3.1) ин­ терпретировать как экзогенную переменную, а значения ряда как значения эндогенной переменной, то формально модели окажут­ ся эквивалентными. Это позволяет в теорию временных рядов привнести многое из рефессионного анализа, расмотренного ра­ нее. По этой же причине структурно детерминированные модели временных рядов иногда называют регрессионными.

3.2, Ортонормированные системы функций

3.2.1. Банаховы и гильбертовы пространства

Как уже было отмечено, при разработке математической модели временного ряда большое внимание должно быть уделено свой­ ствам функций (Pk(0, к = О, I, ..., д, используемых для описания детерминированной составляющей (3.2) временного ряда. Удач­ ный выбор этих функций существенно определяет вычислитель­ ную простоту и точность решения задачи. Хотя универсальных и общепринятых рекомендаций по выбору этих функций нет, мож­ но указать класс функций, во многих задачах оказывающихся предпочтительными. Этот класс составляют ортогональные и ор­ тонормированные системы функций. Дадим соответствующие определения. При этом будем ориентироваться на основные по­ нятия конечномерных линейных пространств, изложенные, на-

109

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]