Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ВВЕДЕНИЕ РЕГРЕССИОННЫЙ АНАЛИЗ.doc
Скачиваний:
11
Добавлен:
22.07.2019
Размер:
602.11 Кб
Скачать

Введение

Сегодня деятельность в любой области экономики (управления, финансово-кредитной сфере, маркетинге, учете и аудите) требует от специалистов применения современных методов работы, знания достижения мировой экономической мысли, понимания научного языка.

Большинство новых методов основано на эконометрических моделях, концепциях, приемах. Без глубоких знаний эконометрики научиться их использовать невозможно. Поэтому эконометрика (наряду с микроэкономикой и макроэкономикой) входит в число базовых дисциплин современного экономического образования.

Первая часть методических указаний содержит теоретические аспекты и подробный анализ типовых эконометрических задач. Вторая часть предполагает самостоятельную работу студентов по решению задач. Следует отметить, что условия задач в основном базируются на реальной экономической информации.

Общие указания по выполнению контрольных заданий

Контрольная работа по курсу "Эконометрика" выполняется для приобретения студентами опыта построения эконометрических моделей, принятия решений спецификации и идентифика­ции моделей, выбора методов оценки параметров модели, интер­претации результатов, получения прогнозных оценок.

При выполнении контрольных работ следует обратить вни­мание на следующие требования:

1. Задания к контрольной работе составлены в 100 вариан­тах. Каждый студент выполняет один вариант. Номер его вариан­та соответствует последним двум цифрам номера его зачетной книжки. Замена задач не допускается. Номер варианта указывает­ся в самом начале работы.

2. Расчеты можно выполнять с использованием статистиче­ских возможностей, например, электронных таблиц MS Excel для Windows, либо других статистических или эконометрических па­кетов.

3. Нельзя ограничиваться приведением только готовых ответов. Расчеты должны быть представлены в развернутом виде, применяя, где это необходимо табличные оформления исходной информации и расчетов, со всеми формулами, пояснениями и вы­водами, соблюдая достаточную точность вычислений. В пояснениях и выводах показать, что именно и как характеризует исчис­ленный показатель.

3. Работа должна быть написана разборчиво, без помарок. На обложке необходимо указать фамилию, имя, отчество, фа­культет, курс, номер зачетной книжки. Работа должна содержать список использованной литературы, быть подписана студентом, указана дата выполнения работы.

4. Контрольная работа должна быть представлена в установ­ленные учебным планом сроки. Абсолютно идентичные работы, а также работы, переснятые на ксероксе не принимаются и рассматриваются.

5. За консультацией по всем вопросам, возникшим в процессе изучения курса эконометрики и выполнения контрольной работы, следует обращаться на кафедру статистики и ЭММ, ул. Псковская, д. 3, ауд. 505.

6. При выполнении контрольной работы используется литература, рекомендованная в библиографическом списке.

  1. Линейный парный регрессионный анализ

5 Контрольные задания по курсу

Задание № 1.

На основе данных, приведенных в таблице 1 Приложения А и соответст­вующих Вашему варианту (таблица 2 Приложение А), требуется:

  1. Построить уравнение линейной парной регрессии одного при­знака от другого. Один из признаков, соответствующих Ваше­му варианту, будет играть роль факторного , другой - ре­зультативного . Причинно-следственные связи между при­знаками установить самим на основе экономического анализа. Пояснить смысл параметров уравнения.

  2. Рассчитать линейный коэффициент парной корреляции и ко­эффициент детерминации. Сделать выводы.

  3. Оценить статистическую значимость параметров регрессии и коэффициента корреляции с уровнем значимости 0,05.

  4. Выполнить прогноз ожидаемого значения признака-результата Y при прогнозном значении признака-фактора X, составляющим от среднего уровня X. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал с вероятностью 0,95.

  5. Дать оценку полученного уравнения с помощью общего F-критерия Фишера.

Все существующие связи между признаками классифицируют по степени тесноты, направлению, форме, числу факторов.

По степени тесноты связи делят на статистические и функциональные.

Статистическая связь - это такая связь между при­знаками, при которой для каждого значения признака-фактора X признак-результат может в определенных пределах принимать любые значения с некоторыми вероят­ностями; при этом его статистические (массовые) характе­ристики (например, среднее значение) изменяются по опре­деленному закону.

Статистическая связь обусловлена тем, что:

1) на результативный признак оказывают влияние не только факторы, учтенные в модели (которые мы исследуем), но и неучтенные или неконтролируемые факторы;

2) неизбежностью ошибок измерения значений при­знаков.

Модель статистической связи может быть представле­на в общем виде уравнением:

где - зависимая переменная (предиктор, результативный признак) ,фактическое значение результативного призна­ка;

Х – независимая переменная (регрессор);

- детерминированная составляющая - часть результативного признака, сформировав­шаяся под воздействием учтенных известных факторных признаков;

U – случайная составляющая (случайный остаток).

Противоположной статистической связи является функциональная. Функциональной называется такая связь, когда каждо­му возможному значению признака-фактора соответст­вует одно или несколько строго определенных значений ре­зультативного признака . Определение функциональной связи может быть легко обобщено для случая многих при­знаков Модель функциональной связи в об­щем виде можно представить уравнением:

По направлению изменений результативного и фак­торного признаков связи делят на прямые и обратные.

По форме связи (виду функции f) связи делят на пря­молинейные (линейные) и криволинейные (нелинейные).

По количеству факторов в модели связи подразделяют на однофакторные (парные) и многофакторные.

Одним из методов изучения стохастических связей между признаками является регрессионный анализ.

Регрессионный анализ представляет собой установле­ние аналитической зависимости между признаками. Он включает следующие этапы:

1) выбор формы связи (вида аналитического уравнения регрессии);

2) оценка параметров уравнения;

3) оценка качества аналитического уравнения регрес­сии.

Наиболее часто для описания статистической связи признаков используется линейная форма. Внимание к ли­нейной связи объясняется четкой экономической интерпре­тацией ее параметров, ограниченной вариацией переменных и тем, что в большинстве случаев нелинейные формы связи для выполнения расчетов преобразуют (путем логарифми­рования или замены переменных) в линейную форму.

Линейная парная регрессия сводится к нахождению уравнения вида:

где и – параметры уравнения регрессии;

- часть результативного признака, сформировавшая­ся под воздействием неконтролируемых или неучтенных факторов, а также ошибок измерения признаков.

Оценка параметров линейной регрессии проводиться по пространственной выборки (Yi Хi) . Для получения оценок наиболее часто используют метод наименьших квадратов (МНК).

Метод наименьших квадратов дает наилучшие (эффек­тивные и несмещенные) оценки параметров уравнения рег­рессии. Но только в том случае, если выполняются опреде­ленные предпосылки относительно случайного члена и независимой переменной .

МНК позволяет получить такие оценки параметров и , при которых сумма квадратов отклонений фактических значений результативного признака Y – от расчетных (тео­ретических) значений —Ŷ минимальна:

S=Σ(Y-Ŷ)2 → min.

Проиллюстрируем суть данного метода графически. Для этого построим точечный график по данным наблюде­ний в прямоугольной системе координат (та­кой точечный график называют корреляционным полем). Попытаемся подобрать прямую линию, которая ближе всего расположена к точкам корреляционного поля. Согласно ме­тоду наименьших квадратов линия выбирается так, чтобы сумма квадратов расстояний по вертикали между точками корреляционного поля и этой линией была бы минималь­ной.

Y

Ŷ

Y

X

X

Рисунок 1 - Корреляционное поле зависимости между X и Y.

В случае линейной парной зависимости:

.

Значения и нам известны, это данные на­блюдений. В функции S они представляют собой констан­ты. Переменными в данной функции являются искомые оценки параметров – и . Чтобы найти минимум функции двух переменных необходимо вычислить частные произ­водные данной функции по каждому из параметров и приравнять их к нулю, т.е.

В результате получим систему из 2-ух нормальных линейных уравнений:

или

Решая данную систему, найдем искомые оценки пара­метров.

,

,

где , и - средние значения факторов Х, Y и их произведение.

В системе нормальных уравнений индексы опущены для облегчения запоминания .

Правильность расчета параметров уравнения регрес­сии может быть проверена сравнением сумм ΣY=ΣŶ(при этом возможно некоторое расхождение из-за округления расчетов).

Знак коэффициента регрессии указывает направле­ние связи (если , связь прямая, если , то связь обрат­ная). Величина показывает, на сколько единиц изменится в среднем признак-результат –Y при изменении признака-фактора – Х на 1 единицу своего измерения.

Формально значение параметра - среднее значение Y при X равном нулю. Если признак-фактор не имеет и не может иметь нулевого значения, то вышеуказанная трак­товка параметра не имеет смысла.

Оценка тесноты связи между признаками осуществляется с помощью коэффициента линейной парной корреляции - . Он может быть рассчитан по формуле: ,

Для качественной оценки тесноты связи можно использовать следующую классификацию:

0.1- 0.3- слабая связь

0.3-0.5 – умеренная связь

0.5-0.7- заметная связь

0.7-0.9- тесная связь

0.9-0.99- весьма тесная

где - среднее квадратическое отклонение факторного признака, которое определяется по формуле:

.

- среднее квадратическое отклонение результативного признака, которое определяется по формуле:

.

Кроме того, коэффициент линейной парной корреляции может быть определен через коэффициент регрессии .

Область допустимых значений линейного коэффици­ента парной корреляции от -1 до +1. Знак коэффициента корреляции указывает направление связи. Если , то связь прямая; если , то связь обратная.

Если данный коэффициент по модулю близок к еди­нице, то связь между признаками может быть интерпрети­рована как довольно тесная линейная. Если его модуль ра­вен единице , то связь между признаками функцио­нальная линейная. Если признаки X и Y линейно независи­мы, то близок к 0.

Для оценки качества полученного уравнения регрессии рассчитывают теоретический коэффициент детерминации - . Коэффициент детерминации характеризует долю ва­риации (дисперсии) результативного признака Y, объясняе­мую регрессией (а, следовательно, и фактором Х), в общей вариации (дисперсии) Y. Коэффициент детерминации принимает значения от 0 до 1. Соответственно величина характеризует долю дисперсии Y, вызванную влиянием прочих неучтенных в модели факторов и ошибками специ­фикации.

δ2 Σ(Ŷ- )2

R2yx= ____ = _____________

σ2y Σ(Y- )2

где - объясненная уравнением регрессии дисперсия Y;

- общая (полная) дисперсия Y.

В силу теоремы о сложении дисперсий общая диспер­сия результативного признака равна сумме объясненной уравнением регрессии и остаточной (необъясненной) дисперсий:

.

Поэтому коэффициент детермина­ции может быть рассчитан через остаточную и общую дис­персии:

ε2 Σ(Y-Ŷ)2

R2=1- ____ = _____________

σ2y Σ(Y- )2

где - остаточная (необъясненная уравнением регрес­сии) дисперсия Y.

При парной линейной регрессии .

Оценка статистической значимости параметров уравнения регрессии.

С помощью МНК можно получить лишь оценки парамет­ров уравнения регрессии. Чтобы проверить, значимы ли па­раметры (т.е. значимо ли они отличаются от нуля в истинном уравнении регрессии) используют статистические ме­тоды проверки гипотез. В качестве основной гипотезы вы­двигают гипотезу о незначимом отличии от нуля параметра регрессии или коэффициента корреляции. Альтернативной гипотезой, при этом является гипотеза обратная, т.е. о неравенстве нулю параметра или коэффициента корреляции. Для проверки гипотезы используется t-критерий Стьюдента.

Найденное по данным наблюдений значение t-критерия (его еще называют наблюдаемым или фактиче­ским) сравнивается с табличным (критическим) значением, определяемым по таблицам распределения Стьюдента (ко­торые обычно приводятся в конце учебников и практикумов по статистике или эконометрике). Табличное значение оп­ределяется в зависимости от уровня значимости и числа степеней свободы, которое в случае линейной парной рег­рессии равно , n-число наблюдений.

Если фактическое значение t-критерия больше таб­личного (по модулю), то считают, что с вероятностью параметр регрессии (ко­эффициент корреляции) значимо отличается от нуля.

Если фактическое значение t-критерия меньше таб­личного (по модулю), то нет оснований отвергать основную гипотезу, т.е. параметр регрессии (коэффициент корреля­ции) незначимо отличается от нуля при уровне значимости .

Фактические значения t-критерия определяются по формулам:

,

,

где .

Для проверки гипотезы о незначимом отличии от нуля коэффициента линейной парной корреляции используют критерий:

,

где r - оценка коэффициента корреляции, полученная по наблюдаемым данным.

Прогноз ожидаемого значения результативного при­знака Y по линейному парному уравнению регрессии.

Пусть требуется оценить прогнозное значение призна­ка-результата для заданного значения признака-фактора . Прогнозируемое значение признака-результата с дове­рительной вероятностью равной принадлежит интер­валу прогноза:

,

где - точечный прогноз;

t - коэффициент доверия, определяемый по таблицам распределения Стьюдента в зависимости от уровня значи­мости α и числа степеней свободы ;

- средняя ошибка прогноза.

Точечный прогноз рассчитывается по линейному уравнению регрессии, как: .

Средняя ошибка прогноза определяется по формуле:

.

Пример 1.

На основе данных, приведенных в Приложении и соответствующих варианту 100, требуется: