Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
shpor_matesha_2.doc
Скачиваний:
4
Добавлен:
17.09.2019
Размер:
331.26 Кб
Скачать

1 Модель пар лин регрессии

Линейная регрессия сводится к нахождению уравнения вида или .

Уравнение вида позволяет по заданным значениям фактора x иметь теоретические значения результативного признака, подставляя в него фактические значения фактора х.

Построение линейной регрессии сводится к оценке ее пара­метров а и в.

Для нахождения теоретической линии регрессии по данным производственных измерений или специально поставленных экспериментов применяется метод наименьших квадратов, с помощью которого путем определенных вычислений находится уравнение y = f (x), соответствующее взаимосвязи рассматриваемых параметров. А именно, отыскивается теоретическая линия регрессии у по x, что составляет в корреляционном поле такое положение, в котором выполняется требование, чтобы сумма квадратов расстояний от этой линии до каждой точки в корреляционном поле была минимальной.

2. специфікація моделі пар лин модели Простая регрессия является регрессию между двумя переменными-у их, т.е. модель вида, где у - результативный признак; х - признак-фактор.

Спецификация модели - формулировка вида модели, исходя из видповидноитеории связи между переменными. В уравнении регрессии корреляционная по сути связь признаков представляется в виде функциональной связи, вираженоивидповиднои математической функцией. где yj - фактичнезначення результативного признака; yxj-теоретическое значение результативного признака.

Случайная величина, характеризующая отклонения реального значеннярезультативнои признака от теоретического.От правильно выбранной спецификации модели зависит величина випадковихпомилок: они тем меньше, чем в большей степени теоретические значеннярезультативнои признаки подходят к фактическим данным у.

В парной регрессии выбор вида математической функции может быть осуществлен тремя методами: графическим, аналитическим и экспериментальным. Графический метод основан на поле корреляции.

Аналитический метод основан изучении материальной природы связи исследуемых признаков. Экспериментальный метод осуществляется путем сравнения величины залишковоидисперсии

Спецификация модели может быть записана как: Здесь предполагается, что α и β - точные значения параметров модели хи - известные выборочные значения фактора; εи - случайные ошибки модели и-и точке с имовирностнимы свойствами генеральной совокупности.Очевидно, случайные значения показателя yи при этих условиях имеют то же распределение, что и ошибки εи (со смещением)

8Середня помилка апроксимації й коефіцієнт еластичності нел регрессии

Оценку качества построенной модели дает средняя ошибка аппроксимации. Средняя ошибка аппроксимации - среднее отклонение значений, рассчитываемых от фактических:

Средний коэффициент эластичности показывает, на сколько процентов в среднем по совокупности изменится результат у от своей средней величины при изменении фактора х на 1% от своего среднего значения: .

Оценка параметров в полученном уравнении может быть произведена с помощью МНК.

Наибольшее распространение степенной функции в эконометрике связано с тем, что параметр b имеет четкое экономическое истолкование, – он является коэффициентом эластичности. Это значит, что коэффициент b показывает, на сколько % в среднем результат, если фактор изменится на 1%.

4 Перевірка гіпотез щодо параметрів рівняння регресії й показника тісноти зв язку;

Показателями тесноты связи являются: для парной линейной модели - коэффициент парной линейной корреляции, для множественной линейной модели - коэффициент множественной корреляции, для нелинейных моделей (парных и многофакторных)-корреляционное отношение.

Коэффициент b в уравнении регрессии характеризует изменение функции у при изменении аргумента x на единицу. и графически отражает угол наклона линии уравнения регрессии

При решении практических задач регрессионного анализа возникает вопрос оценки тесноты исследуемой взаимосвязи, т. е. насколько полученные на основе обработки производственных или лабораторных данных уравнения регрессии достоверны. Что касается парной линейной корреляции в качестве оценки тесноты связи используют обычно коэффициент корреляции, который рассчитывается по формуле: Числитель выражения для коэффициента корреляции r является разность между средним значением произведения XY и произведением средних значений X * Y измеренных значений параметров x и y исходной информации. Знаменатель равен произведению средних квадратических отклонений значений параметров у и x от своих средних Малая величина коэффициента корреляции свидетельствует об отсутствии линейной связи, однако криволинейная связь между рассматриваемыми параметрами при этом может быть достаточно тесной. Коэффициент корреляции отражает как величину увеличения в за изменения x, а тесноту связи функции и аргумента. Чем больше разброс точек относительно линии регрессии, тем меньше коэффициент корреляции. Это свойство коэффициента корреляции отражено в его формуле как соотношение стандартных отклонений.

№6 Нелинейная регрессия.

Якщо між економічними показниками існують нелінійні співвідношення, то вони виражаються за допомогою відповідних нелінійних функцій. Серед нелінійних регресій розрізняють два класи: регресії, нелінійні за пояснюючою змінною, але лінійні за оцінюваними параметрами, і регресії, нелінійні за оцінюваними параметрами.

Прикладам регресій нелінійних за пояснюючою змінною можуть служити наступні залежності:

  • поліноміальна:

,

;

  • гіперболічна

. (

До регресій, нелінійних за оцінюваними параметрами, відносяться залежності:

  • степенева

  • показникова

  • експоненційна

і т.д.

Регресії, нелінійні за пояснюючою змінною, легко зводяться до лінійних заміною змінних.

Уравнение нелинейной регрессии, так же как и в линейной зависимости, дополняется показателем корреляции, а именно индексом корреляции (R):

или     

Величина данного показателя находится в границах: 0 ≤ R ≤ 1, чем ближе к единице, тем теснее связь рассматриваемых признаков, тем более надежно найденное уравнение регрессии.

Чтобы иметь общее суждение о качестве модели из относительных отклонений по каждому наблюдению, определяют среднюю ошибку аппроксимации как среднюю арифметическую простую.


Ошибка аппроксимации в пределах 5—7 % свидетельствует о хорошем подборе модели к исходным данным.

№ 9Спецификация моделей множественной регрессии.

уравнение множественной регрессии:

Такого рода уравнение может использоваться при изучении потребления.

Множественная регрессия широко использется в решении проблем спроса, доходности акций; при изучении функции издержек производства, в макроэкономических расчетахОсновная цель множественной регрессии — построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, а также совокупное их воздействие на моделируемый показатель.Построение уравнения множественной регрессия начинается с решения вопроса о спецификации модели. Спецификация модели включает в себя два круга вопросов: отбор фак­торов и выбор вида уравнения регрессии.

Требования к факторам.

1 Они должны быть количественно измеримы.

 2.Факторы не должны быть интеркоррелированы и тем более находиться в точной функциональной связи.

Разновидностью интеркоррелированности факторов является мультиколлинеарность - наличие высокой линейной связи между всеми или несколькими факторами.

Причинами возникновения мультиколлинеарности между призанками являются:

1.  Изучаемые факторные признаки, характеризуют одну и ту же сторону явления или процесса. Например, показатели объема производимой продукции и среднегодовой стоимости основных фондов одновременно включать в модель не рекомендуется, так как они оба характеризуют размер предприятия;

2.  Использование в качестве факторных признаков показателей, суммарное значение которых представляет собой постоянную величину;

3. Факторные признаки, являющиеся составными элементами друг друга;

4.  Факторные признаки, по экономическому смыслу дублирующие друг друга.

5.   Одним из индикаторов определения наличия мультиколлинеарности между признаками является превышение парным коэффициентом корреляции величины 0,8 (rxi xj) и др.

Мультиколлинеарность может привести к нежелатель­ным последствиям:

1)  оценки параметров становятся ненадежными, обна­руживают большие стандартные ошибки и меняются с из­менением объема наблюдений (не только в величине, но и по знаку), что делает модель непригодной для анализа и прогнозирования.

2)  затрудняется интерпретация параметров множест­венной регрессии как характеристик действия факторов в «чистом» виде, ибо факторы коррелированны; параметры линейной регрессии теряют экономический смысл;

3) нельзя определить изолированное влияние факторов на результативный показатель.

Включение в модель факторов с высокой интеркорреляцией (Ryx1 Rx1x2) может привести к ненадежности оценок коэф-ов регрессии. Если между факторами существует высокая корреляция, то нельзя определить их изолированное влияние на

результативный показатель и параметры уравнения регрессии оказываются неинтерпретированными. Включаемые во множ.регрессию факторы должны объяснить вариацию независимой переменной. Отбор факторов производится на основе качественного теоретико-экономического анализа, который обычно осуществляется в две стадии: на первой подбираются факторы исходя из сущности проблемы; на второй – на основе матрицы показателей корреляции определяют t-статистики для параметров регрессии.

Если факторы коллинеарны, то они дублируют друг друга и один из них рекомендуется исключить из регрессии. Предпочтение при этом отдается тому фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами.

ПРЕДПОСЫЛКИ МНК.

При оценке параметров уравнения регрессии применяется МНК. При этом делаются определенные предпосылки относительно составляющей   , которая представляет собой в уравнении ненаблюдаемую величину.

Исследования остатков предполагают проверку наличия сле­дующих пяти предпосылок МНК:

1) случайный характер остатков. С этой целью строится график отклонения остатков от теоретических значений признака. Если на графике получена горизонтальная полоса, то остатки представляют собой случайные величины и применение МНК оправдано. В других случаях необходимо применить либо другую функцию, либо вводить дополнительную информацию и заново строить уравнение регрессии до тех пор, пока остатки не будут случайными величинами.

2) нулевая средняя величина остатков, т.е. ,

не зависящая от хi. Это выполнимо для линейных моделей и моделей, нелинейных относительно вклю­чаемых переменных. С этой целью наряду с изложенным графиком зависимости остатков Еі от теоретических значений ре­зультативного признака ух строится график зависимости случай­ных остатковЕі от факторов, включенных в регрессию хi . Если остатки на графике расположены в виде горизонтальной полосы, то они независимы от значений xj. Если же график показывает наличие зависимостиЕі и хj то модель неадек­ватна. Причины неадекватности могут быть разные.

3. Гомоскедастичность — дисперсия каждого отклонения Е одинакова для всех значений хj. Если это условие применения МНК не соблюдается, то имеет место гетероскедастичность. Наличие гетероскедастичности можно наглядно видеть из поля корреляции.

 4. Отсутствие автокорреляции остатков. Значения остатковЕі распределены независимо друг от друга. Автокорреляция остатков означает наличие корреляции между остатками текущих и предыдущих (последующих) наблюдений. Отсутствие автокорреляции остаточных величин обеспечива­ет состоятельность и эффективность оценок коэффициентов ре­грессии.

5. Остатки подчиняются нормальному распределению.

В тех случаях, когда все пять предпосылок выполняются, оценки, полученные по МНК и методу максимального правдоподобия, совпадают между собой. Если распределение случайных остатков Еі не соответствует некоторым предпосылкам МНК, то следует корректировать модель, изменить ее спецификацию, добавить (исключить) некоторые факторы, преобразовать исходные данные, что в конечном итоге позволяет получить оценки коэффициентов регрессии aj, которые обладают свойством несмещаемости, имеют меньшее значение дисперсии остатков, и в связи с этим более эффективную статистическую проверку значимости параметров регрессии.

12 індекс множинної кореляції

Коэффициент (индекс) множественной корреляции R используется для оценки тесноты совместного влияния факторов на зависимую переменную:

Свойства коэффициента множественной корреляции R: 1. Коэффициент множественной корреляции принимает значения на отрезке, то есть. Чем ближе R к единице, тем теснее связь между зависимой y и факторами x1, x2, ..., xp. 2. При R = 1 корреляционная связь является линейной функциональной зависимостью. 3. При R = 0 линейный корреляционная связь отсутствует. Относительно оценки степени взаимосвязи, можно руководствоваться аналогичными эмпирическими правилами, как и для случая ЛПР

13Приватні коефіцієнти кореляції

Ранжирование факторов, участву­ющих во множественной линейной регрессии, может быть прове­дено через стандартизованные коэффициенты регрессии, с помо­щью частных коэффициентов корреляции — для линейных связей. При нелинейной взаимосвязи исследуемых признаков эту функцию выполняют частные индексы детерминации. Кроме того, частные показатели корреляции широко используются при решении проблемы отбора факторов: целесообразность включе­ния того или иного фактора в модель доказывается величиной показателя частной корреляции.

Показатели частной корреляции представляют собой отно­шение сокращения остаточной дисперсии за счет дополнитель­ного включения в анализ нового фактора к остаточной диспер­сии, имевшей место до введения его в модель.

Коэффициент частной корреляции измеряет тесноту линейной связи между отдельным фактором и результатом при устранении воздействия прочих факторов модели.

Для качественной оценки тесноты связи можно использовать следующую классификацию:

0.1- 0.3- слабая связь

0.3-0.5 – умеренная связь

0.5-0.7- заметная связь

0.7-0.9- тесная связь

0.9-0.99- весьма тесная

Для расчета частных коэффициентов корреляции мо­гут быть использованы парные коэффициенты корреляции.

Для случая зависимости Y от двух факторов можно вычислить 2 коэффициента частной корреляции:

 

     Это коэффициенты частной корреляции 1-ого порядка (порядок определяется числом факторов, влияние которых на результат устраняется).

Частные коэффициенты корреляции, рассчитанные по таким формулам изменяются от -1 до +1. Они используют­ся не только для ранжирования факторов модели по степени влияния на результат, но и также для отсева факторов.

№ 11КОЭФФИЦИЕНТЫ ЭЛАСТИЧНОСТИ ПО РАЗНЫМ ВИДАМ РЕГРЕССИОННЫХ МОДЕЛЕЙ.

  1. Линейная y = a + bx + , y′ = b, Э = .

  2. Парабола 2 порядка y = a +bx + c + , y′ = b + 2cx, Э = .

  3. Гипербола y = a+b/x + , y′=-b/ , Э = .

  4. Показательная y=a , y′ = ln , Э = x ln b.

  5. Степенная y = a , y′ = , Э = b.

  6. Полулогарифмическая y = a + b ln x +ε , y′ = b/x , Э = .

  7. Логистическая , y′ = , Э = .

  8. Обратная y = , y′ = , Э = .

15Регресія і Excel

Чтобы упростить и ускорить процесс вычисления тех или иных экономических параметров с помощью методов статистического анализа, в том числе метода линейной регрессии, используются программа MS Excel. Microsoft Excel предоставляет широкие возможности для анализа статистических данных. При решении простых задач всегда под руками встроенные функции. Когда необходимо оценить затраты следующего года или предсказать ожидаемые результаты серии научных экспериментов, используют данную программу для автоматической генерации будущих значений, которые будут базироваться на существующих данных или для автоматического вычисления значений. Для проведення прогнозування за допомогою статистичних функцій в MS Excel використовується регресивний аналіз. Він полягає в підборі графіка для набору спостережень за допомогою методу найменших квадратів. Регресія використовується для аналізу впливу на окрему змінну значень однієї (парна регресія) чи більше незалежних змінних (множинна регресії).

В Excel имеется пять функций для линейной регрессии ЛИНЕЙН, ТЕНДЕНЦИЯ, ПРЕДСКАЗ, НАКЛОН и СТОШYX. Эти функции вводятся как табличные формы и возвращают результат в виде интервала массива.

16 використання багатофак регрессии

Конечно, более актуальными для экономического моделирования является многофакторные регрессии, поскольку редко экономическое явление можно объяснить преимущественно одним фактором влияния. Корреляционно-регрессионный анализ может широко применяться в экономико-статистических исследованиях: для приближенной оценки фактического и планового уровня, как укрупненный норматив (для этого достаточно подставить в уравнение вместо фактических значений факторов их средние значения), для выявления резервов производства, проведения межзаводского сравнительного анализа и наведение на его основе потенциальных возможностей предприятий, а также для краткосрочного прогнозирования развития производства (региона).

С помощью построенных многофакторных регрессионных моделей, которые являются адекватными имеющимся статистическим и расчетным данным и имеют высокие степени значимости оцененных параметров, можно осуществлять прогнозирование изменения смоделированного экономического явления в результате изменения одного или нескольких его факторов. Следует констатировать, что такие модели сегодня не являются постоянными в долгосрочном периоде, поскольку в украинской экономике окружающую среду и его условия меняются довольно часто. Поэтому в будущем целесообразно рассчитать новые параметры регрессионных моделей на основе представленных методов и осуществлять прогнозирование согласно полученным данным.