
Вся эконометрика / Вся эконометрика / эконометрика 2 тихо / эконометрика шпоры
.doc
Билет 1 1. Назначение экономико-математических моделей. Переменные и параметры модели. Понятие функциональной и регрессионной связи между переменными. Назначение и отличия эконометрических моделей. Эконометрика – наука, дающая количественное выражение взаимосвязей экономических явлений и процессов. Основная цель: модельное описание конкретных количественных взаимосвязей, обусловленных общими качественными закономерностями, изученными в экономической теории. Задачи: обнаружение и анализ статистических закономерностей в экономике; построение на базе выявленных эмпирических экономических зависимостей эконометрических моделей. Модель – это такой материальный или мысленно представляемый объект, который в процессе исследования замещает объект-оригинал так, что его непосредственное изучение дает новые знания об объекте-оригинале. Она выступает в качестве средства анализа и прогнозирования конкретных экономических процессов на основе реальной статистической информации. Необходимость использования метода моделирования определяется тем, что многие объекты (или проблемы, относящиеся к этим объектам) непосредственно исследовать или вовсе невозможно, или же это исследование требует много времени и средств. В любой эконометрической модели, в зависимости от конечных прикладных целей ее использования все участвующие в ней переменные подразделяются на:
Фиктивные вводятся для описания явления, в отношении которого нет данных по качественному признаку. Переменные-заместители искусственно вводятся в модель для отражения явления, кот не может быть количественно охарактеризовано, при этом эта переменная тесно кореллирует с этим явлением. Эконометрическая модель служит для объяснения поведения эндогенных переменных в зависимости от значений экзогенных и лаговых эндогенных переменных. Параметры детализируют форму модели, уточняют ее применение к конкретному случаю. Это коэффициенты перед переменными. В регрессионном анализе рассматривается связь между одной переменной, которая называется зависимой переменной, или признаком, и несколькими другими, которые называются независимыми переменными. Причины использования: 1) описание зависимости между переменными помогает установить наличие возможной причинной связи; 2) получение аналитической зависимости между переменными дает возможность предусматривать будущие значения зависимой переменной по значениям независимых переменных. Функциональными называются связи, при которых наличие взаимосвязи между двумя переменными, означает, что любому заданному значению одной переменной отвечает лишь одно значение второй. Для них характерно то, что изменения результативного признака в целом обусловлены действием факторного признака х: Y=f(X) Особенность функциональной связи: она проявляется с одинаковой силой для каждой единицы совокупности, которая изучается. Поэтому, установив при изучении любой единицы совокупности ту или другую закономерность, ее можно распространять как на каждую единицу, так и на всю совокупность. Можно выделить три основных класса эконометрических моделей: 1. Регрессионные модели с одним уравнением. В таких моделях зависимая (объясняемая) переменная у представляется в виде функции: y = f{x,β) = f(x1,...,xk , β1,..., βk), где x1,x2,...,xk - независимые (объясняющие) переменные; β1,..., βk - параметры. В зависимости от вида функции f(x, β) модели делятся на линейные и нелинейные. 2. Модели временных рядов. К этому классу относятся модели: • тренда: y(t) = T(t) +ξt где t – время; T(t) - временной тренд заданного параметрического вида (например, линейный T(t) = a + bt); ξt - случайная (стохастическая) компонента; • сезонности: y(t) = S(t) + ξt где S(t) - периодическая (сезонная) компонента, ξt - случайная (стохастическая) компонента. • тренда и сезонности: y(t) = T(t) + S(t) + ξt (аддитивная) или y(t) = T(t)S{t) + ξt (мультипликативная) где T(t) - временной тренд заданного параметрического вида; S(t) - периодическая (сезонная) компонента; ξt - случайная (стохастическая) компонента. Кроме того, существуют модели временных рядов, в которых присутствует циклическая компонента, формирующая изменения анализируемого признака, обусловленные действием долговременных циклов экономической демографической или астрофизической природы (волны Кондратьева, циклы солнечной активности и т.д.). Модели временных рядов могут применяться для изучения и прогнозирования объема продаж туристических путевок, спроса на железнодорожные и авиабилеты, при краткосрочном прогнозировании процентных ставок и т.д. 3. Системы одновременных уравнений. Эти модели описываются системами уравнений Системы могут состоять из тождеств и регрессионных уравнений, каждое из которых, кроме объясняющих переменных, может включать в себя объясняемые переменные из других уравнений системы. Системы одновременных уравнений могут быть использованы для моделей национальной экономики. Ярким примером системы одновременных уравнений служит модель спроса и предложения. Пусть QtD – спрос на товар в момент времени t, QtS -предложение товара в момент времени t, Рt – цена на товар в момент времени t, Yt - доход в момент t. Составим систему уравнений "спрос - предложение": QtS = α1 + α2Рt +a3 Рt-1 + ξt (предложение), QtD = β1 + β 2Рt + β 3 Yt + ut (спрос), QtS =QtD (равновесие). Цена товара , Рt и спрос на товар Qt = QtD = QtS определяются из уравнений модели, то есть являются эндогенными переменными Объясняющими переменными в данной модели являются доход Yt и значение цены товара в предыдущий момент времени Рt-1.
|
2. Определение границ доверительных интервалов точечных оценок множественной регрессионной модели
Множественная
регрессия
позволяет построить и проверить модель
линейной связи между зависимой
(эндогенной) и несколькими независимыми
(экзогенными) переменными: y
= f(x1,...,xр
), Для построения уравнения множественной регрессии чаще используются следующие функции:
Можно использовать и другие функции, приводимые к линейному виду Определение границ доверительных интервалов оценок параметров модели
В
условиях нормальной линейной
множественной регрессионной модели,
при построении доверительных интервалов
оценок параметров
Доверительный
интервал имеет границы: где ta - табличное значение статистики Стьюдента с n-k степенями свободы для α%-го уровня значимости. Определение границ доверительного интервала прогноза зависимой переменной
Доверительный
интервал для отдельного (индивидуального)
значения зависимой переменной строится
с учетом рассеяния индивидуальных
значений вокруг линии регрессии, т.е.
с учетом ошибки регрессии:
где
|
Билет 2 1. Случайные переменные (дискретные и непрерывные), их закон распределения и основные количественные характеристики. Выборочные значения основных количественных характеристик случайных величин и их оценивание. Переменная величина x с множеством возможных значений Ax называется случайной, если ее возможные значения ti появляются в некотором опыте со случайными элементарными исходами ui вида: ui: x= ti, где ti. Переменная величина, все значения которой можно занумеровать, называется дискретной переменной. Если возможные значения переменной x непрерывно заполняют собой некий интервал (или объединение интервалов) числовой прямой, т.е. Ax есть интервал числовой прямой между некоторыми точками a и b, Ax =(a,b), то такая величина называется непрерывной. Законом распределения СВ называется всякое соотношение, устанавливающее связь между возможными значениями СВ и соответствующими им вероятностями. Для дискретной СВ закон распределения может быть задан в виде таблицы, аналитически (в виде формулы) и графически. Пример: X:
или
Такая таблица называется рядом распределения дискретной СВ. Для любой дискретной величины
Если по оси абсцисс откладывать значения СВ, по оси ординат – соответствующие их вероятности, то получаемая (соединением точек) ломаная называется многоугольником или полигоном распределения вероятностей. Две СВ называются независимыми, если закон распределения одной из них не меняется от того, какие возможные значения приняла другая величина. Закон (ряд) распределения дискретной СВ даёт исчерпывающую информацию о ней, так как позволяет вычислить вероятности любых событий, связанных со СВ. Однако такой закон (ряд) распределения бывает трудно обозримым, не всегда удобным (и даже необходимым) для анализа. Поэтому для описания случайных величин часто используются их числовые характеристики – числа, в сжатой форме выражающие наиболее существенные черты распределения СВ. Наиболее важными из них являются математическое ожидание, дисперсия, среднее квадратическое отклонение и др. Обращаем внимание на то, что в силу определения, числовые характеристики случайных величин являются числами неслучайными, определёнными. Математическим ожиданием, или средним значением, М(Х) дискретной случайной величины Х называется сумма произведений всех её значений на соответствующие им вероятности:
Для
мат. ожидания используют также
обозначения: E(X),
При
n→∞
мат. ожидание представляет сумму ряда
Свойства мат. ожидания: 1) M(C)=C, где C – постоянная величина; 2) M(kX)=kM(X); 3)M(X±Y)=M(X)±M(Y); 4) M(XY)=M(X)·M(Y), где X,Y – независимые случайные величины; 5) M(X±C)=M(X)±C 6) M(X-a)=0, где a=M(X). Дисперсией D(X) случайной величины Х называется математическое ожидание квадрата её отклонения от математического ожидания: D(X)=M[X-M(X)]2 или D(X)=M(X-a)2 (3), где a=M(X). (Для дисперсии СВ Х используется также обозначение Var(X).) Дисперсия характеризует отклонение (разброс, рассеяние, вариацию) значений СВ относительно среднего значения. Если СВ Х – дискретная с конечным числом значений, то
Дисперсия
D(X)
имеет размерность квадрата СВ, что не
всегда удобно. Поэтому в качестве
показателя рассеяния используют также
величину
Средним квадратическим отклонением (стандартным отклонением или стандартом) σх случайной величины Х называется арифметическое значение корня квадратного из её дисперсии:
Свойства дисперсии СВ: 1) D(C)=0, где C – постоянная величина; 2) D(kX)=k2D(X); 3) D(X)=M(X2)-a2 где a=M(X); 4)D(X+Y)=D(X-Y)=D(X)+D(Y), где X и Y – независимые случайные величины. |
2. Построение эконометрической модели в виде изолированного уравнения парной регрессии. Виды используемых функций. Парная регрессия представляет собой регрессию между двумя переменными – х и у, т.е. модель вида: ŷ = f(x), Где у – зависимая переменная (результативный признак); х – независимая, или объясняющая, переменная (признак-фактор). Парная регрессия достаточна, если имеется доминирующий фактор, который и используется в качестве объясняющей переменной. Уравнение простой регрессии характеризует связь между двумя переменными, которая проявляется как некоторая закономерность лишь в среднем в целом по совокупности наблюдений. В уравнении регрессии корреляционная связь признаков представляется в виде функциональной связи, выраженной соответствующей математич функцией. Практически в каждом отдельном случае величина у складывается из двух слагаемых: yj = ŷxj + εj где yj – фактическое зн-ие результативного признака; ŷxj – теоретическое зн-ие результативного признака, найденное исходя из ур-ия регрессии; εj - случайная величина, характеризующая отклонения реального зн-ия результативного признака от теоретического, найденного по ур-ию регрессии. Случайная величина ε (случайное возмущение) включает влияние не учтенных в модели факторов, случайных ошибок и особенностей измерения. Ее присутствие в модели порождено тремя источниками: спецификацией модели, выборочным характером исходных данных, особенностями измерения переменных. В парной регрессии выбор вида математической функции ŷх = f(x) может быть осуществлен тремя методами:
Класс математических ф-ий для описания связи двух переменных достаточно широк. Основными явл-ся следующие:
|
Билет 3 1. Взаимосвязь случайных переменных. Ковариация и коэффициент корреляции пары случайных величин и их оценивание. Под случайной величиной понимается переменная, которая в результате испытания в зависимости от случая принимает одно из возможного множества своих значений (какое именно – заранее не известно). Ковариация служит для характеристики тесноты связи между случайными величинами. Если (x,y) — пара случайных переменных, то их ковариацией называется константа Сху=Cov(x,y)=E(x·y)-E(x)·E(y) Свойства математического ожидания позволяют представить Сху и так: Сху=E((x-mx)·(y-my)), где mx=E(x), my=E(y) Для вычисления Сху нужно знать закон распределения Pxy(q, r) пары (x,y). Если он неизвестен, то ковариацию можно оценить по выборке из генеральной совокупности Ω(x,y): {(x1, y1), (x2, y2),…,(xn, yn)} Оценкой ковариации служит величина
именуемая выборочной ковариацией. Также тесноту связи определяют при помощи коэффициента корреляции. Существует разные модификации формула данного показателя:
Если |rxy|=1, то y=a0+a1x. Так что при |rxy|=1 между переменными (x,y) существует жесткая (функциональная) линейная связь. |
2. Проблемы построения моделей в виде изолированного уравнения множественной регрессии.
Множественная
регрессия
позволяет построить и проверить модель
линейной связи между зависимой
(эндогенной) и несколькими независимыми
(экзогенными) переменными: y
= f(x1,...,xр
), Множественная линейная регрессионная модель имеет вид: y=a+b1x1+b2x2+…+bpxp+ε Включение в уравнение множественной регрессии того или иного набора факторов связано прежде всего с представлением исследователя о природе взаимосвязи моделируемого показателя с другими экономическими явлениями. Факторы, включаемые во множественную регрессию, должны отвечать следующим требованиям:
Включение в модель факторов с высокой интеркорреляцией, когда ryx1 < rx1x2 может повлечь за собой неустойчивость и ненадежность оценок коэффициентов регрессии. Если между факторами существует высокая корреляция, то нельзя определить их изолированное влияние на результативный показатель, и параметры уравнения регрессии оказываются неинтерпретируемыми. Насыщение модели лишними факторами не только не снижает величину остаточной дисперсии и не увеличивает показатель детерминации, но и приводит к статистической незначимостю параметров регрессии по t-критерию Стьюдента. Поскольку одним из условий построения уравнения множественной регрессии является независимость действия факторов, коллинеарность факторов нарушает это условие. Если факторы явно коллинеарны, то они дублируют друг друга и один из них рекомендуется исключить из регрессии. Предпочтение при этом отдается фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами. Включение в модель мультиколлинеарных факторов нежелательно по следующим причинам:
|
Билет 4 1. Типы данных, используемых в эконометрическом моделировании. Проблемы, связанные с данными. Данные, используемые в эконометрических моделях, делятся на три типа:
Тип данных во многом определяет методику их оценки. Примерами пространственных данных являются финансовые отчеты предприятий за определенный квартал или год, данные о ВВП различных стран в каком-либо конкретном году, и т.п., - то есть это данные об однородных объектах за один и тот же период времени. Примерами временных рядов являются ежедневные значения курса доллара по отношению к рублю за период с 1 января 1994 г. до 22 сентября 2004 г., значения ВВП России за год в период с 1994 до 2002 г., и т.п., - то есть последовательные значения одной экономической переменной в различные периоды времени. Панельные данные - это до некоторой степени обобщение временных рядов и пространственных данных. Например, если с одних и те же предприятий каждый год собираются одни и те же показатели их хозяйственной деятельности, получится массив данных, в котором содержатся и данные об однородных объектах за один и тот же период времени, и последовательные значения одной экономической переменной в различные периоды времени. Однако следует заметить, что если в нашем примере набор предприятий из года в год будет разным, такие данные уже не будут панельными.
Большое внимание в эконометрике уделяется проблеме данных — специальным методам работы при наличии данных с пропусками, влиянию агрегирования данных на эконометрические измерения. Информация может отсутствовать по единицам совокупности и быть только на уровне более крупных единиц (агрегатов). При агрегировании данных во времени опасность искажения результатов измерений гораздо больше, чем при агрегировании пространных данных. С одной стороны, добавляется эффект автокорреляции, а с другой — происходит погашение случайной компоненты. Проблемы данных включают и проблемы селективной выборки в микроэконометрике. Скажем, при устройстве на работу индивид, имеющий соответствующее образование, стремится получить зар плату выше определенного минимума. Тогда регрессия, описывающая зависимость зар платы от образования, будет основана не на всем возможном поле данных (заработная плата выше/ниже установленного минимума), а только на данных индивидов с зар платой выше минимальной. Возникает смещение наблюдаемой регрессии от истинной в результате так называемой самоселекции. Селективное смещение связано с поведением индивидов. |
2. Дисперсионный анализ в парной регрессии. Линейная парная регрессионная модель используется для описания взаимосвязи двух переменных Y и X, если имеется предположения, что между ними существует линейная стохастическая зависимость: y=a+bx+ε, где а и b – параметры модели (постоянные неизвестные коэффициенты); Х- независимая переменная; Y— зависимая переменная; ε - случайная переменная (возмущение, ошибка), возникающая из-за влияния различных неучтенных факторов. Уравнение для отдельных наблюдений зависимой переменной Y записывается в виде: yt=a+bxt+εt где Хt Yt, - набор данных (наблюдений), t = 1, 2,..., n; Xt – экзогенная переменная модели); εt - случайная ошибка в наблюдении t.
Если
отклонение зависимой переменной Yt,
от ее выборочного среднего значения
и
выборочную дисперсию var(Y)
можно представить в виде двух частей:
Часто это уравнение записывают так: TSS = ESS + RSS, где TSS = var(Y) – полная дисперсия (общая сумма квадратов отклонений зависимой переменной от ее выборочного значения); ESS = Σ(Yt-Ŷt)2 – часть дисперсии, необъясненная регрессией (т.к. она содержит ошибки регрессии εt);
Качество подгонки регрессионной модели к наблюденным значениям Yt оценивается при помощи статистики R2 (коэффициента детерминации). Коэффициент детерминации определяется по формуле R2 = 1-ESS / TSS = RSS / TSS; 0≤R2≤1 Часто это уравнение записывают так: TSS = ESS + RSS, где TSS = var(Y) – полная дисперсия (общая сумма квадратов отклонений зависимой переменной от ее выборочного значения); ESS = Σ(Yt-Ŷt)2 – часть дисперсии, необъясненная регрессией (т.к. она содержит ошибки регрессии εt);
Качество подгонки регрессионной модели к наблюденным значениям Yt оценивается при помощи статистики R2 (коэффициента детерминации). Коэффициент детерминации определяется по формуле R2 = 1-ESS / TSS = RSS / TSS; 0≤R2≤1 Чем ближе значение коэффициента детерминации к 1, тем лучше качество подгонки и прогноз Ŷ более точно аппроксимирует Y. Для проверки значимости коэффициента детерминации используется F-статистика:
где k - число независимых переменных. Связь между статистиками F и R2 для случая парной регрессии (k = 1) имеет вид |