Churakov_Mat_met_obr_exp_dan_v_ekon
.pdfЕ.П.Чураков
МАТЕМАТИЧЕСКИЕ
МЕТОДЫ
ОБРАБОТКИ
ЭКСПЕРИМЕНТАЛЬНЫХ
ДАННЫХ В ЭКОНОМИКЕ
Рекомендовано Учебно-методическим объединением по образованию в области математических методов в экономике в качестве учебного пособия
для студентов высших учебных заведений, обучающихся по специальности 061800 "Математические методы в экономике"
и другим экономическим специальностям
МОСКВА "ФИНАНСЫ И СТАТИСТИКА"
2004
УДК 330.4(075.8) ББК 65в6я73
Ч-93
РЕЦЕНЗЕНТЫ:
кафедра экономической теории
Рязанской государственной радиотехнической академии;
Б. А. Лагоша,
доктор экономических наук, профессор, заведующий кафедрой экономико-математического моделирования МЭСИ
Чураков Е. П.
Ч-93 Математические методы обработки экспериментальных данных в экономике: Учеб. пособие. — М.: Финансы и статис тика, 2004. -240 с: ил.
ISBN 5-279-02745-6
Материал пособия базируется на результатах обработки разнообразной информации, определяющей состояние экономических объектов. Большое внимание уделено различным методам оценивания рефессионных парамет ров. Известные алгоритмы прогнозирования стохастических рядов, основан ные на моделях типа AR, МА, ARMA, AR1MA, обобщаются в форме матричновекторной модели в терминах стохастического вектора состояния, и на ее ос нове строится рекуррентный алгоритм прогнозирования калмановского вида.
Для студентов экономических специальностей вузов и аспирантов, вы полняющих научные исследования в области математических методов.
„ |
1602090000-238 |
.^. _^^ |
УДК 330.4(075.8) |
^ |
010(01)-2004 |
•^"^-^""•* |
ББК65в6я73 |
ISBN 5-279-02745-6 |
© Е. П. Чураков, 2004 |
ПРЕДИСЛОВИЕ
Управленческое решение, как правило, опирается на анализ эм пирических сведений, почерпнутых и представленных тем или иным образом и содержащих в себе информацию, необходимую для его принятия. В простейших ситуациях анализ имеющихся в распоряжении лица, принимающего решение, сведений может быть осуществлен непосредственно автором решения в соответст вии с его профессиональной подготовкой, опытом, интуицией, даром предвидения и т.п. Однако сложные ситуации, в том числе характеризуемые большим объемом данных, часто противоречи вых, с не всегда известной степенью взаимодействия, что харак терно для большинства реальных экономических явлений и про цессов, не позволяют достаточно глубоко проникнуть в их суть только средствами не вооруженного современными математиковычислительными методами человеческого разума. Новые ин формационные технологии, базирующиеся на последних дости жениях в области вычислительных средств и мощном аппарате прикладной математики, позволяют выработать глубоко обосно ванные формализованные рекомендации по принятию конкрет ного решения, создавая тем самым средства его поддержки.
В общем виде процедура выработки рекомендаций по приня тию решения может быть сведена к следующей триаде:
1) разработке средствами математического моделирования формализованной математической модели, с помощью которой должно приниматься решение на основании содержательного су щества проблемы и с учетом всех существенных ограничений и имеющихся эмпирических данных, создающих основу принима емого решения;
2)выбору из арсенала средств прикладной математики мето да обработки данных с использованием уже построенной их ма тематической модели и разработкой соответствующего алгорит мического обеспечения;
3)машинной реализации разработанных алгоритмов и пере дача получаемых рекомендаций заинтересованным лицам.
Внастоящем учебном пособии рассматриваются вопросы, ча стично касающиеся первого элемента этой триады и более фун даментально — второго: математических методов обработки экс-
периментальных данных. Пособие рассчитано прежде всего на студентов специальности 061800 «Математические методы в эко номике». Поэтому предполагается, что подлежащие обработке данные имеют «экономическое происхождение». Как следствие, в пособии отражается основная проблематика задач, связанных с обработкой экономических «измерений», и излагаются наиболее характерные математические методы решения этих задач. Хотя сами по себе математические методы носят универсальный ха рактер и применимы для обработки экспериментальных данных практически любой природы, часто их адаптация к экономичес ким приложениям сопровождается определенными терминоло гическими построениями и специфической расстановкой акцен тов на приоритетах как самих методов, так и способов использу емых доказательств. Это обстоятельство учитывается в пособии, что тем не менее не лишает книгу возможности быть полезной студентам других специальностей и направлений, «сопричаст ных» проблемам обработки экспериментальных данных.
Традиционно включаемые в пособие материалы относят к на учной дисциплине, называемой эконометрикой. Лаконичное оп ределение этой дисциплины, как отмечается в курсе эконометри ки Я.Р. Мангуса, П.К. Катышева и А.А. Перецкого, дать трудно. Тем не менее, следуя курсу прикладной статистики С.А. Айвазя на и B.C. Мхитаряна, условимся под эконометрикой понимать самостоятельную экономико-математическую йаучную дисцип лину, П03В0ЛЯЮШ1УЮ на основе экономической теории и исход ных статистических данных и в соответствии с математико-ста- тистическими методами придавать конкретное количественное содержание общим (качественным) закономерностям, обуслов ленным экономической теорией. Традиционно математико-ста- тистические методы эконометрики, как отмечается в указанных курсах, включают в себя:
•классическую и обобщенную линейные модели множест венной регрессии;
•классический и обобщенный методы наименьших квадра
тов;
•модели и методы статистического анализа временных рядов;
•системы одновременных эконометрических уравнений.
Если последнюю позицию этого перечня можно считать спе цифичным «детищем» эконометрики, то материалы, сосредото ченные в предшествующих трех позициях, активно развиваются
и используются во многих смежных научных направлениях, в ча стности в теории стохастических систем управления, в статисти ческой радиотехнике, при вторичной обработке траекторной ин формации о движущихся объектах, при обнаружении сигналов в шумах, в задачах классификации ситуаций и др. Современный специалист в области математических методов не может в своей профессиональной деятельности ограничиваться только «эконометрическими» наработками, но для него весьма полезна инфор мированность о методах и подходах к решению аналогичных за дач в смежных областях. Поэтому в данном пособии, не затраги вающем проблематики одновременных уравнений, традицион ные эконометрические подходы, широко и всесторонне освеща емые в прекрасных изданиях последнего времени, таких, как уже упоминавшийся курс С.А. Айвазяна и B.C. Мхитаряна, «Введе ние в эконометрику» К. Доугерти, «Эконометрика» под редакци ей И.И. Елисеевой и других, пополняются некоторыми положе ниями, расширяющими кругозор будущего специалиста в облас ти математических методов и способствующими формированию многоальтернативных подходов к решению задач. К элементам новизны можно отнести такие методы оценивания регрессион ных параметров, как рекуррентный метод наименьших квадратов (МНК), максимум апостериорной плотности вероятностей, бай есовский и минимаксный методы, проблему обусловленности МНК-оценок, проблему стохастической сходимости, калмановские методы прогнозирования временных рядов и др. Аналогич ные соображения определили необходимость включения в посо бие фрагментов функционального анализа, кратко затрагиваю щих понятия банаховых и гильбертовых пространств, ортого нальных систем непрерывных и дискретных функций, обобщен ных рядов Фурье и способствующих расширению класса моделей трендов и их математической интерпретации. Ограниченное внимание, уделяемое теории случайных процессов в таких дис циплинах, как «Теория вероятностей» и «Математическая стати стика», вынудило автора предпослать стохастическим временнь1м рядам элементы этой теории, в основном касающиеся той ее части, которую принято называть корреляционной. В целом представляется, что включенные в пособие материалы могут ока заться полезными при изучении таких «родственных» дисцип лин, как «Эконометрика», «Методы социально-экономического прогнозирования», «Эконометрическое моделирование», преду-
смотренных Государственным образовательным стандартом спе циальности 061800 «Математические методы в экономике».
Материал книги изложен в двух частях, из которых первая по священа математическим методам восстановления зависимостей по экспериментальным данным, а вторая — математическим ме тодам обработки временных рядов.
В последние годы наблюдается обширная экспансия (в хоро шем смысле этого слова) современных информационных техно логий в эконометрические методы и их проникновение во все сферы человеческой деятельности. Эта несомненно плодотвор ная тенденция ярко проявляется и в экономических приложени ях. На вооружении экономистов-математиков оказались много численные пакеты прикладных программ (например, Statistica, Mathcad, MatLab, Matematica и др.), средствами которых реша ются практически все эконометрические задачи. Однако крайне важно, чтобы пользователь этих пакетов не оказался механичес ким приложением к ним, слепо использующим возможности со временных вычислительных систем без глубокого погружения и проникновения в сущность соответствующих математических проблем и их алгоритмического завершения. Творческий подход к решению прикладных задач немыслим без фундаментальной подготовки специалиста в области математико-статистических методов, и самый совершенный вычислительный инструмента рий не в состоянии компенсировать пробел в образовании, если таковой был заложен еще в вузовские времена.
Автор надеется, что настоящее пособие будет способствовать уменьшению вероятности появления дискомфортных ситуаций в общении исследователя и компьютера, порожденных недоста точной математической культурой первого. Успех будет сопро вождать тех, кто сможет эффективно сочетать глубокую теорети ческую подготовку с универсальными возможностями современ ных информационных технологий.
Автор выражает глубокую благодарность и признательность рецензентам книги — доктору экономических наук, профессору Б.А. Лагоше и кафедре экономической теории Рязанской госу дарственной радиотехнической академии (заведующий кафедрой доктор экономических наук, профессор В.И. Терехин). Все заме чания читателей автор примет с благодарностью.
Первая часть
МАТЕМАТИЧЕСКИЕ МЕТОДЫ ВОССТАНОВЛЕНИЯ ЗАВИСИМОСТЕЙ ПО ЭКСПЕРИМЕНТАЛЬНЫМ ДАННЫМ
Глава 1 ЗАДАЧИ РЕГРЕССИОННОГО АНАЛИЗА
ИПРЕДВАРИТЕЛЬНЫЙ АНАЛИЗ ДАННЫХ
Ы. Проблема восстановления зависимостей по экспериментальным данным
Одной из важных проблем, возникающих при исследовании эко номических процессов, явлений, систем и т.п. (обобщенно — объектов исследования (ОИ)), выступает поиск и математичес кое описание зависимостей между различными величинами, тем или иным образом взаимодействующими между собой и опреде ляющими состояние изучаемого объекта. Так, при исследовании сельскохозяйственного процесса может представлять интерес за висимость урожайности некоторой культуры от количества вно симого удобрения; при решении социальных проблем исследова нию может быть подвергнута зависимость среднедушевых сбере жений от среднедушевых доходов семьи; при анализе технологи ческого процесса небезынтересной может оказаться зависимость производительности технологической установки от некоторых характеристик используемого сырья и т. п. В подобного рода си туациях все участвующие в формировании изучаемой проблемы величины целесообразно разбить на две группы. Входящие в пер вую группу величины непосредственно характеризуют состояние
объекта исследования, их количественные значения являются отражением наших представлений о том, насколько хорошо или плохо «выглядит» исследуемый объект. Эти величины изменяют ся под действием различного рода факторов, влияющих на них и образующих вторую группу величин. Так, в упомянутых примерах первая группа будет соответственно включать в себя урожай ность, среднедушевые сбережения, производительность, вторая
— количество удобрений, среднедушевые доходы, характеристи ки сырья. Механизм взаимодействия между величинами обеих групп, вообще говоря, неизвестен. Поэтому исследуемый объект можно представить как «черный ящик», причем величины пер вой группы удобно интерпретировать как своеобразные выходы «ящика», а величины второй группы — как входы этого «ящика» (рис. 1.1).
|
Объект |
|
Вход |
исследования |
Выход |
|
черный ящик
Рис. 1.1. Структура формирования эконометрических данных
Выходы, таким образом, определяются входами и внутренни ми свойствами ОИ, однако «заглянуть» внутрь «ящика» и вы явить механизм взаимодействия выходов и входов в большинстве практических задач невозможно. Вместе с тем в подобных зада чах удается установить численное соответствие между входами и выходами, понимаемое в следующем смысле: предполагается, что при различных известных значениях всех или некоторых вхо дов можно измерить (зарегистрировать) соответствующие им численные значения выходов. Полученные экспериментальные данные теперь можно использовать для разработки математичес кой модели, связывающей входы и выходы «черного ящика» без проникновения в существо последнего. В этом и заключается со держательный смысл проблемы восстановления зависимостей по экспериментальным (эмпирическим — полученным из экс перимента) данным.
8
Прежде чем двигаться далее, полезно преодолеть барьер тер минологических особенностей, сопутствующих задаче восста новления зависимостей. В современном научном обиходе выход ные величины принято называть зависимыми переменными, от кликами, эндогенными (внутренними), результирующими, объяс няемыми переменными. Входные переменные принято подраз делять на две части. К первой из них относят те переменные, ко торые поддаются количественной оценке, т.е. в процессе прове дения исследования их можно «измерить» и указать их числен ные значения. Эту часть входных переменных называют незави симыми, факторами-аргументами, предикторами, экзогенными (внешними), объясняющими переменными. Вторая часть вход ных переменных не поддается экспериментальной регистрации, а о существовании части из них мы можем даже не подозревать. В
совокупности их нгiзывдiют латентными (скрытыми) переменны ми и обычно интерпретируют как некие случайные величины с известными или неизвестными вероятностными свойствами.
Обозначим символом ¥= [Y^^^ Y^^^... K^^^]^G R^ вектор эндо генных переменных, где, как обычно, R^ — к-мерное координат ное пространство. Аналогично А'= [Х^^^ Х^^^... Х^^^]^е К^ - вектор экзогенных переменных и Р= [Р^^^ Р^^^... Р^^^еR^- вектор ла тентных переменных. Здесь и далее ^ ~ символ транспонирова ния. Как уже отмечалось, в результате проведения некоторого (пассивного или активного) эксперимента можно зарегистриро вать ряд значений вектора А'и соответствующие значения векто ра К Так, можно указать количество вносимых удобрений и соот ветствующую урожайность за ряд лет. Можно путем опроса мно гих семей выявить их среднедушевые доходы и соответствующие сбережения. При различных значениях характеристик сырья можно зарегистрировать производительность технологической установки и т.п.
Предположим, что эксперимент организуется так, что в про цессе его проведения экзогенные переменные принимают значе ния A:I,JC2, ...,jc^, аэндогенные переменные —значения3^1,>;2, .••,Д^«- Запись Х= дс/ будет означать, что вектор А^при /-м измерении при нял конкретное значение дс/ = [xf^^ хр\... xf^^]^, при этом хр^ - численное значениеу-й компоненты Х^^ вектора ЛГ при /-м изме рении (/ = 1, 2,..., п). Аналогична запись для вектора У. В резуль тате проведения эксперимента получим две числовые матрицы: