Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
эконометрика-раздача / УМК-эконометрика-ЮУрГУ-печатать.docx
Скачиваний:
146
Добавлен:
09.05.2015
Размер:
2.5 Mб
Скачать

Литература для самостоятельной работы

        1. Эконометрика: Учебник./ Под ред. И.И. Елисеевой. – 2-е изд.– М.: Финансы и статистика, 2005. – 276 с.

        2. Практикум по эконометрике. Под ред. И.И.Елисеевой. – М.: Финансы и статистика, 2005.

        3. Мхитарян В.С., Архипова М.Ю., Сиротин В.П. Эконометрика: Учебно-методический комплекс. – М.: Изд. центр ЕАОИ. 2008. – 144 с.

        4. Дубров А.М., Мхитарян В.С., Трошин Л.И. Математическая статистика для бизнесменов и менеджеров. – М.: МЭСИ, 2004. – 140 с.

        5. Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс, 3-е изд. – М.: Дело, 2005. – 503 с.

        6. Мхитарян В.С., Трошин Л.И. Исследование зависимостей методами корреляции и регрессии. – М.: МЭСИ, 2004. – 51 с.

        7. Айвазян С.А., Мхитарян В.С. Практикум по прикладной статистике и эконометрике. – М.: МЭСИ, 2003.

INTERNET-ресурсы

1. http://upereslavl.botik.ru/UP/ECON/econometrics/top1/tsld006.htm

2. http://www.nsu.ru/ef/tsy/ecmr/study.htm

3. http://www.nsu.ru/ef/tsy/ecmr/index.htm

4. http://www.statsoft.ru/home/textbook/def ault.htm

5. http://www.nsu.ru/ef/tsy/ecmr/study.htm

6. http://www.dataforce.net/~antl/article/econometric

7. http://www.nsu.ru/ef/tsy/ecmr/study.htm

8. http://www.tvp.ru/vnizd/mathem4.htm

9. http://www.kgtu.runnet.ru/WD/TUTOR/textbook/modules/stmulreg.html

10. http://www.shpargalka.ru/statis.ru/doc/shpr_e31.htm

11. http://www3.unicor.ac.ru/d024/p011993.htm

12. http://www.gauss.ru/educat/systemat/butenkov/.asp

13. http://crow.academy.ru/econometrics/seminars_/sem_08_/sem_08.htm

14. http://crow.academy.ru/econometrics/lectures_/lect_03_/index.htm

7.Задачи экономического анализа, решаемые на основе регрессионных эконометрических моделей

7.1. Измерение тесноты связи между результативным и факторными признаками 135

7.2. Анализ влияния отдельных факторных признаков на результативный признак 145

7.3. ПРАКТИЧЕСКИЙ БЛОК 148

7.4. САМОСТОЯТЕЛЬНАЯ РАБОТА СТУДЕНТОВ 166

7.1. Измерение тесноты связи между результативным и факторными признаками.

7.1.1. Линейная корреляция.

  1. Простая линейная корреляция при несгруппированных данных.

Если между двумя явлениями х и у существует линейное стохастическое соотношение – линейная регрессия, то степень интенсивности связи можно измерить с помощью коэффициента корреляции rxy. Корреляция в широком смысле слова означает связь, соотношение между объективно существующими явлениями и процессами. Соотношение между регрессией и корреляцией можно представить в виде следующей схемы, предложенной Браве и Пирсоном.

Пусть заданы значения переменных х и у, между которыми существует линейное соотношение.

у, х – средние значения переменных или их математические ожидания;

n – число проведенных наблюдений;

σх – стандартное отклонение х;

σу – стандартное отклонение у.

Представим уравнение

в эквивалентном виде

В этой системе величина

показывает, на сколько величин σу изменится в среднем у, когда х увеличится на одно σх.

Величина r является показателем тесноты связи и называется выборочным коэффициентом корреляции или простым линейным коэффициентом корреляции или парным коэффициентом или просто коэффициентом корреляции.

Отметим другие модификации формулы для r.

В данной формуле σх и σу – выборочные средние квадратические отклонения для переменных х и у, а σху – выборочный корреляционный момент или выборочная ковариация.

Определение. Ковариацией случайных величин х и у называется математическое ожидание произведения отклонений этих величин от своих математических ожиданий, т.е.

Ковариация двух случайных величин характеризует как степень связи случайных величин, так и их рассеяние вокруг точки (х, у). Ковариация – величина размерная, что затрудняет ее использование для оценки степени зависимости случайных величин. Коэффициент корреляции лишен этих недостатков.

Для практических расчетов наиболее удобна следующая формула

По ней коэффициент корреляции находится непосредственно из данных наблюдений и на его значении не скажутся округления данных, связанные с расчетом средних и отклонений от них.

Коэффициент корреляции обладает следующими свойствами:

  • Принимает значения на отрезке от –1 до 1, т.е. -1≤ r ≤ 1. Чем ближе | rух | к 1, тем теснее связь.

  • При rух = ±1 корреляционная связь представляет собой линейную функциональную зависимость. При этом все наблюдаемые значения располагаются на прямой линии. При r = 1 между отклонениями хi – х и уi – у существует прямая связь, а при r = -1 обратная.

  • r = 0 показывает на отсутствие линейной связи между переменными, а не на отсутствие связи вообще. При этом линия регрессии параллельна оси «Ох».

  • При вычислении коэффициента корреляции для линейной регрессии безразлично, какая переменная является зависимой, а какая объясняющей, т.е. rух = rху.

Коэффициент корреляции не изменится, если переменные подвергнуть преобразованию или изменить их единицы измерения.

  1. Простая линейная корреляция при сгруппированных данных.

Отклонения хj – х взвешиваем по частотам gi j-го интервала значений объясняющей переменной х, отклонения уk – у – по частотам hk k-го интервала зависимой переменной у, а произведение отклонений (хj – х)(ук – у) – по условным частотам pkj.

Поэтому

Коэффициент корреляции, вычисленный по несгруппированному материалу более точен, чем коэффициент корреляции вычисленный по сгруппированным данным, так как свободен от погрешности вносимой группировкой данных.

  1. Связь между коэффициентами корреляции, регрессии и детерминации.

Коэффициент а1 простой линейной регрессии y = а0 + а1x переменной у на х определяется отношением

Коэффициент корреляции определяется следующим соотношением:

Для оценки качества подбора линейной функции рассчитывается квадрат линейного коэффициента корреляции, называемый коэффициентом детерминации. Коэффициент детерминации для простой линейной регрессии (парной детерминации) определяется следующим соотношением:

Это отношение показывает, какая часть общего рассеяния значений у обусловлена изменчивостью переменной х. Это соотношение можно преобразовать:

Если коэффициент детерминации равен 1, то все эмпирические данные лежат на корреляционной прямой, а если он равен 0, то ни о какой численной линейной зависимости переменной у от х в статистическом понимании не может быть и речи. Коэффициент детерминации – безразмерная величина, не реагирующая на преобразования переменных.

С коэффициентом детерминации связано понятие меры неопределенности регрессии:

Рассмотрим теперь сопряженную регрессию:

Тогда

и поэтому

  1. Линейная множественная корреляция. Частная корреляция.

Показатель множественной корреляции характеризует тесноту связи рассматриваемого набора факторов с исследуемым признаком, или, иначе, оценивает тесноту совместного влияния факторов на результат. Независимо от формы связи показатель множественной корреляции может быть найден по формуле как индекс множественной корреляции

где σу2 – общая дисперсия результативного признака,

Значение индекса множественной корреляции лежит в пределах от 0 до 1 и должно быть больше или равно максимальному парному индексу корреляции:

= 1, 2, …m

При линейной зависимости признаков формула индекса корреляции может быть представлена и через стандартизированные коэффициенты регрессии следующим образом:

rухi – парные коэффициенты корреляции результата с каждым фактором.

Формула индекса множественной корреляции для линейной регрессии получила название линейного коэффициента множественной корреляции, или, совокупного коэффициента корреляции.

При линейной зависимости возможно так же определение совокупного коэффициента корреляции через матрицу парных коэффициентов корреляции

Эта формула позволяет определять совокупный коэффициент корреляции, не обращаясь при этом к уравнению множественной регрессии, а используя лишь парные коэффициенты корреляции.

Частные коэффициенты (или индексы) корреляции, измеряющие влияние на у фактора хi при неизменном уровне других факторов, можно определить по формуле

или по рекуррентной формуле

Частные коэффициенты корреляции изменяются в пределах от –1 до 1. Качество построенной модели в целом оценивает коэффициент (индекс) детерминации. Он рассчитывается как квадрат индекса множественной корреляции: R2yx1…xm.

  1. Влияние неучтенных факторов на коэффициент корреляции.

На коэффициент корреляции при экономических расчетах могут оказывать влияние следующие факторы:

  • географический фактор: природно-климатические и физико-географические условия;

  • фактор времени: следует учитывать, за какой период по экономическим данным вычисляется коэффициент корреляции – за месяц, квартал, год;

  • однородность группировки социально-экономических явлений по комплексу признаков. Исследователь должен располагать теоретически обоснованным критерием определения статистической однородности.

7.1.2. Нелинейная корреляция.

1. Нелинейная корреляция для парного уравнения регрессии.

Уравнение нелинейной регрессии, как и в линейной зависимости, дополняется показателем корреляции, а именно индексом корреляции:

где Так как

то индекс корреляции можно выразить как

Величина данного показателя находится в границах: 0≤R≤1, чем ближе к единице, тем теснее связь рассматриваемых признаков, тем более надежно найденное уравнение регрессии.

Если нелинейное относительно объясняемой переменной уравнение регрессии при линеаризации принимает форму линейного уравнения парной регрессии, то для оценки тесноты связи может быть использован линейный коэффициент корреляции, величина которого в этом случае совпадает с индексом корреляции Rху= rуz, где z – преобразованная величина признака-фактора, например, z = 1/x или z = ln x.

Обратимся для примера к равносторонней гиперболе y = b + a/x. Заменив 1/x на z, имеем линейное уравнение y = b + az, для которого может быть определен линейный коэффициент корреляции: r=a×sz/sy . Возводя данное выражение в квадрат, получим:

Преобразовывая далее, придем к следующему выражению для

следовательно,

Но так как

и , то

Таким образом, приходим к формуле индекса корреляции

Заменив далее z на 1/х, получим , соответственно. Аналогично для других функций подобного вида, в которых образования в линейный вид не затрагивают зависимую переменную, и требование МНКвыполнимо.

Иначе обстоит дело, когда преобразования уравнения в линейную форму связаны с зависимой переменной. В этом случае линейный коэффициент корреляции по преобразованным значениям признаков дает лишь приближенную оценку тесноты связи и численно не совпадает с индексом корреляции.

Например, при степенной функции после перехода к логарифмически линейному уравнениюможет быть найден линейный коэффициент корреляции не для фактических значенийх и у, а для их логарифмов, то есть . Соответственно квадрат его значения будет характеризовать отношение факторной суммы квадратов отклонений к общей, но не дляу, а для его логарифмов:

Между тем при расчете индекса корреляции используются суммы квадратов отклонений признака у, а не их логарифмов. С этой целью определяются теоретические значения результативного признака, то есть у, как антилогарифм рассчитанной по уравнению величины lny и остаточная сумма квадратов как . Индекс корреляции определяется по формуле

В знаменателе расчета участвует сумма квадратов отклонений фактических значенийу от их средней величины, а в расчете участвует. Соответственно различаются числители рассматриваемых показателей:

–в индексе корреляции и – в коэффициенте корреляции.

Необходимо также помнить, что если при линейной зависимости признаков сопряженные регрессии имеют один и тот же коэффициент корреляции, то есть , то при криволинейной зависимости они не равны, то есть.

Так как в расчете индекса корреляции используется соотношение факторной и общей суммы квадратов отклонений, то R2 имеет тот же смысл, что и коэффициент детерминации. В специальных исследованиях величину R2 для нелинейных связей называют индексом детерминации.

Оценка существенности индекса корреляции проводится, так же как и оценка надежности коэффициента корреляции. Индекс детерминации используется для проверки существенности в целом уравнения линейной регрессии по F –критерию Фишера:

,

где n – число наблюдений, m – число параметров при переменной х. Величина m характеризует число степеней свободы для факторной суммы квадратов, а (n-m-1) – число степеней свободы для остаточной суммы квадратов.

Индекс детерминации можно сравнивать с коэффициентом детерминациидля обоснования возможности применения линейной функции. Чем больше кривизна линии регрессии, тем величина коэффициента детерминациименьше индекса детерминации. Близость иx означает, что нет необходимости усложнять форму уравнения регрессии и можно использовать линейную функцию. Если , то предположение о линейной форме связи считается оправданным. В противном случае проводится оценка существенности различияи, вычисленных по одним и тем же исходным данным черезt-критерий Стьюдента:

, где – ошибка разности междуи.

Если tф > tт, то различия между рассматриваемыми показателями корреляции существенны и замена нелинейной регрессии уравнением линейной функции невозможна. Если t < 2, то различия несущественны и, следовательно, возможно применение линейной регрессии.

2. Нелинейная корреляция для множественного уравнения регрессии.

Для криволинейной зависимости, нелинейной по переменным, индекс множественной корреляции равен совокупному коэффициенту корреляции.

Например, пусть для фирмы модель прибыли у имеет вид

у = a0 + а1x1 + а2x2 + а3lnx3 + а4lnx4 ,

где х1 – удельные расходы на рекламу;

х2 – капитал фирмы;

х3 – доля продукции фирмы в общем объеме продаж данной группы товаров по региону;

х4 – процент увеличения объема продаж фирмы по сравнению с предыдущим годом.

Тогда независимо от того, что фактор х1 задан линейно, а х2, х3, х4 – в логарифмах, оценка тесноты связи может быть произведена с помощью линейного коэффициента множественной корреляции.

Иначе обстоит дело с криволинейной регрессией, нелинейной по оцениваемым параметрам. Предположим, что рассматривается производственная функция Кобба-Дугласа:

, где P – объем продукции, L – затраты труда, К – величина капитала, b1+b2=1.

Логарифмируя ее, получим линейное уравнение в логарифмах

Ln P = lna + b1lnL + b2lnK

Индекс детерминации для нелинейных по оцениваемым параметрам функции принять называть «квази R2» определения по функциям, использующим логарифмические преобразования (степенная, экспонента), необходимо найти сначала теоретические значения ln y, затем трансформировать их через антилогарифмы, то есть найти теоретические значения результативного признака и далее определять индекс детерминации как «квази R2» по формуле

Величина индекса множественной корреляции, определенная как «квази R2» не будет совпадать с совокупным коэффициентом корреляции.

Для того чтобы не допустить возможного преувеличения тесноты связи, используется скорректированный индекс (коэффициент) множественной корреляции. Он содержит поправку на число степеней свободы и рассчитывается по формуле

, где n – число наблюдений, m – число факторов.

Чем больше величина m, тем сильнее различия между .

Для линейной зависимость признаков скорректированный коэффициент корреляции определяется по той же формуле, что и индекс множественной корреляции. Отличие заключается лишь в том, что в линейной зависимости под m понимается число факторов, включенных в анализ, а в криволинейной зависимости это число параметров при х. Например, если y=f(x1,x2), то для линейной зависимости m = 2, а для регрессии вида

у = a0 + а1x1212x1 + а2x222x22

число параметров при х равно 4, то есть m = 4.

    1. Анализ влияния отдельных факторных признаков на результативный признак.

7.2.1.Эластичность и ее свойства.

Понятие эластичности было введено Аланом Маршаллом в связи с анализом функции спроса. По существу, это понятие является чисто математическим и может применяться при анализе любых дифференцируемых функций.

Эластичностью функции у =f(x) в точке х0 называется следующий предел

Если из контекста ясно, в какой точке определяется эластичность, и какая переменная является независимой, то в обозначении эластичности могут опускаться отдельные символы. Эластичность Еу – это коэффициент пропорциональности между относительными изменениями величин у и х. Если, например, х увеличится на один процент, то у увеличивается (приближенно) на Еу процентов.

Для вычисления эластичности используют несколько эквивалентных формул (если существует конечная производная функции у =f(x) в точке х0):

Рассмотрим теперь ряд свойств эластичности.

1. Эластичность суммы у=у1+…+уп положительных функций уi удовлетворяет соотношению ЕminЕуЕmax, где Еmin(Еmax) – это минимальная (максимальная) эластичность функций уi.

2. Эластичность произведения функций u=u(x) и v=v(x) равна сумме эластичностей функций u и v: Еuv = Еu +Еv.

3. Эластичность частного функций u=u(x) и v=v(x) равна разности эластичностей функций u и v: Еuv = ЕuЕv.

  1. Для сложной функции у=f(g(t)) эластичность у по t удовлетворяет равенству Еуt = ЕуxЕxt.

  2. Эластичность обратной функции удовлетворяет соотношению Еху=Еух-1.

Примеры:

у = х+С,

у=ха,

Как видим, эластичность степенной функции не зависит от значения х. В других функциях коэффициент эластичности зависит от значений фактора x. В силу этого для них обычно рассчитывается средний показатель эластичности

Пример 7.1. По группе предприятий, производящих однородную продукцию, известно, как зависит себестоимость единицы продукции y от факторов, приведенных в таблице. Определить с помощью коэффициентов эластичности силу влияния каждого фактора на результат. Проранжировать факторы по силе влияния. Данные представлены в таблице 7.1.

Таблица 7.1.

Объем производства (х1)

у(х1)=0,62+58,74∙(1/х1)

2,64

Трудоемкость единицы продукции (х2)

у(х2)=9,3+9,83∙х2

1,38

Оптовая цена за 1т. энергоносителя (х3)

у(х3)=11,75+х31,6281

1,503

Доля прибыли, изымаемая государством (х4)

у(х4)=14,87∙1,016х4

26,3

Тогда получаем:

  1. для гиперболы у=b+a/x

  1. для линейной функции у=b+ax

  1. для степенной функции у=bxа

  1. для показательной функции у=bах

Наиболее слабое влияние на изменение признака у оказывает фактор x4, поскольку коэффициент эластичности по абсолютной величине имеет самое низкое значение 0,1813.

Это означает, что при росте доли прибыли, изымаемой государством, на 1% себестоимость увеличится на 0,18%. Наиболее сильное влияние на изменение признака у оказывает фактор x3, поскольку коэффициент эластичности по абсолютной величине имеет самое высокое значение 1,6281. Это означает, что при росте цены за одну тонну энергоносителя на 1%, себестоимость возрастет на 1,63%.

Упорядочим факторы по силе влияния на изменение себестоимости:

Ранг

Факторный признак

Обозна- чение

Коэффициент эластичности

Комментарий

1

Доля прибыли, изымаемой государством

x4

0,1813

Инфраэластичность. Влияние практически отсутствует. Фактор оказывает наименьшее влияние на себестоимость

2

Трудоемкость единицы продукции

x1

0,5933

При изменении трудоемкости единицы продукции на 1% себестоимость изменится на 0,59%. Инфраэластичность, влияние слабое.

3

Объем производства

x2

-0,9728

Между изменением объема производства и себестоимости существует обратная зависимость. С увеличением объема производства на 1% себестоимость снижается на 0,97%.

4

Цена за одну тонну энерго-носителя

x3

1,6281

При изменении фактора на 1% себестоимость изменяется на 1,63%. Ультраэластичность, влияние сильное. Фактор оказывает наибольшее влияние на себестоимость

Пример 7.2. В таблице 7.2. указаны парные коэффициенты корреляции. Провести анализ целесообразности включения заданных факторов в уравнение множественной линейной регрессии.

Таблица 7.2.

у

x1

x2

x3

x4

у

1

x1

0,71

1

x2

0,58

0,53

1

x3

0,08

0,2

0,13

1

x4

0,62

0,81

0,3

0,25

1

Между y и x3 связь практически отсутствует. Между y и x1 связь сильная, между y и x2, x4 – умеренная.

Отсюда следует вывод о нецелесообразности включения фактора x3 в уравнение множественной линейной регрессии (коэффициент парной корреляции с результатом равен 0,08).

Между факторами x1 и x4 существует сильная прямая связь (коэффициент парной корреляции >0,8). Для того чтобы избежать явления мультиколлинеарности, один из этих факторов должен быть исключен из анализа. Исключается фактор x1, умеренно коррелирующий с x2 (коэффициент их парной корреляции равен 0,53). Факторы, включенные в модель множественной регрессии: x2, x4.

    1. Практический блок

Пример

По данным, представленным в таблице 7.3, изучается зависимость балансовой прибыли предприятия торговли Y (тыс. руб.) от следующих факторов:

X 1 - объем товарных запасов, тыс. руб.;

X 2 - фонд оплаты труда, тыс. руб.;

X 3 - издержки обращения, тыс. руб.;

X4 - объем продаж по безналичному расчету, тыс. руб.

Таблица 7.3.

Месяц

У

Х1

Х2

Х3

Х4

1

41321,57

300284,10

19321,80

42344,92

100340,02

2

40404,27

49107,21

20577,92

49000,43

90001,35

3

37222,12

928388,75

24824,91

50314,52

29301,98

4

37000,80

724949,11

28324,87

48216,41

11577,42

5

29424,84

730855,33

21984,07

3301,30

34209,84

6

20348,19

2799881,13

11000,02

21284,21

29300,00

7

11847,11

1824351,20

4328,94

28407,82

19531,92

8

14320,64

1624500,80

7779,41

40116,00

17343,20

9

18239,46

1115200,93

18344,11

32204,98

4391,00

10

22901,52

1200947,52

20937,31

30105,29

14993,25

11

27391,92

1117850,93

27344,30

40294,40

104300,00

12

44808,37

1379590,02

31939,52

42239,79

119804,33

13

40629,28

588365,77

29428,60

55584,35

155515,15

14

31324,80

434281,91

30375,82

49888,17

60763,19

15

34847,92

1428243,59

33000,94

59866,55

8763,25

16

33241,32

1412181,59

31322,60

49975,79

4345,42

17

29971,34

1448274,10

20971,82

3669,92

48382,15

18

17114,90

4074616,71

11324,93

26032,95

10168,00

19

8944,94

1874298,99

8341,52

29327,21

22874,40

20

17499,58

1525436,47

10481,14

40510,01

29603,05

21

19244,80

1212238,89

18329,90

37444,69

16605,16

22

34958,32

1154327,22

29881,52

36427,22

32124,63

23

44900,83

1173125,03

34928,60

51485,62

200485,00

24

57300,25

1435664,93

41824,92

49959,92

88558,62

Задание:

  1. Для заданного набора данных постройте линейную модель множественной регрессии.

  2. Оцените точность и адекватность построенного уравнения регрессии.

  3. Выделите значимые и незначимые факторы в модели.

  4. Постройте уравнение регрессии со статистически значимыми факторами. Дайте экономическую интерпретацию параметров модели.

  5. Для полученной модели проверить выполнение условия гомоскедастичности остатков, применив тест Голдфельда-Квандта.

  6. Проверить полученную модель на наличие автокорреляции остатков с помощью теста Дарбина-Уотсона.

Решение.

Для получения отчета по построению модели в среде EXCEL необходимо выполнить следующие действия:

1. В меню Сервис выбираем строку Анализ данных (в случае отсутствия данной строки необходимо установить флажок в окне Надстройки в меню Сервис напротив функции Пакет анализа). На экране появится окно

Рис. 7.1. Анализ данных

2. В появившемся окне выбираем пункт Регрессия. Появляется диалоговое окно, в котором задаем необходимые параметры.

3. Диалоговое окно заполняется следующим образом:

Входной интервал Y - диапазон (столбец), содержащий данные со знамениями объясняемой переменной;

Входной интервал X - диапазон (столбцы), содержащий данные со значениями объясняющих переменных.

Метки - флажок, который указывает, содержат ли первые элементы отмеченных диапазонов названия переменных (столбцов) или нет;

Константа-ноль - флажок, указывающий на наличие или отсутствие свободного члена в уравнении регрессии ();

Выходной интервал - достаточно указать левую верхнюю ячейку будущего диапазона, в котором будет сохранен отчет по построению модели;

Новый рабочий лист - можно задать произвольное имя нового листа, в котором будет сохранен отчет.

Если необходимо получить значения и графики остатков (еi), установите соответствующие флажки в диалоговом окне. Нажмите на кнопку ОК.

Вид отчета о результатах регрессионного анализа представлен на рис. 7.2.

Рис. 7.2. Вывод итогов

Рассмотрим таблицу "Регрессионная статистика".

Множественный R - это , где R2 - коэффициент детерминации.

R-квадрат — это R2. В нашем примере значение R2 = 0,8178 свидетельствует о том, что изменения зависимой переменной Y (балансовой прибыли) в основном (на 81,78%) можно объяснить изменениями включенных в модель объясняющих переменных – X1, Х2, X3, X4. Такое значение свидетельствует об адекватности модели.

Нормированный R-квадрат - поправленный (скорректированный по числу степеней свободы) коэффициент детерминации.

Стандартная ошибка регрессии S = ,где S2 = - необъясненнаядисперсия (мера разброса зависимой переменной вокруг линии регрессии); п — число наблюдений (в нашем примере равно 24), т - число объясняющих переменных (в нашем примере равно 4).

Рассмотрим таблицу с результатами дисперсионного анализа.

df - degrees of freedom - число степеней свободы связано с числом единиц совокупности п и с числом определяемых по ней констант (m+1).

SS - sum of squares - сумма квадратов (регрессионная (RSS-regression sum of squares), остаточная (ESS — error sum of squares) и общая (TSS— total sum of squares), соответственно). MS-mean sum - сумма квадратов на одну степень свободы.

F - расчетное значение F-критерия Фишера. Если нет табличного значения, то для проверки значимости уравнения регрессии в целом можно посмотреть Значимость F. На уровне значимости уравнение регрессии признается значимым в целом, если Значимость F< 0.05, и незначимым, если Значимость F 0.05.

Для нашего примера имеем следующие значения (таблица 7.3.)

Таблица 7.3.

Результаты дисперсионного анализа

df

SS

MS

F

Значимость F

Регрессия

m = 4

RSS=2,82E+09

RSS/df=7,04E+08

21,32

8,28E-07

Остаток

n-m-1=19

ESS=6,27E+08

ESS/df=3,30E+07

Итого

n-1 = 23

TSS=3,44E+09

Расчетное значение F-критерия Фишера составляет 21,32.

Значимость F= 8,28Е-07, что меньше 0,05. Таким образом, полученное уравнение в целом значимо.

В таблице 7.4. приведены значения параметров (коэффициентов) модели, их стандартные ошибки и расчетные значения t-критерия Стьюдента для оценки значимости отдельных параметров модели.

Таблица 7.4

Оценка коэффициентов регрессии

Коэффициенты

Стандартная ошибка

t-статистика

Р-значение

Нижние 95%

Верхние 95%

Y

a0 = 7825.51

mb0=5350.78

tb0=7825.51 / 5350.78 =

= 1,4625

0.1599

-3373.80a019024.8

X1

a1=-0.00098

mb1=0.00172

tb1=-0.569

0.5762

-0,0046 a10,0026

X2

a2=0.8806

mb2=0.15891

tb2=5.5417

0.00002

0,5480 a21,2132

X3

a3=0.0094

mb3=0.09754

tb3=0.0961

0.9244

-0,1948 a30,2135

X4

a4=0.0617

mb4=0.02647

tb4=2.3312

0.0309

0,0063a40,1171

Анализ таблицы 7.4. позволяет сделать вывод о том, что на уровне значимости = 0.05 значимыми оказываются лишь коэффициенты при факторах X2 и Х4, так как только для них Р-значение меньше 0,05. Таким образом, факторы X1 и Х3 не существенны, и их включение в модель нецелесообразно.

Поскольку коэффициент регрессии в эконометрических исследованиях имеют четкую экономическую интерпретацию, то границы доверительного интервала для коэффициента регрессии не должны содержать противоречивых результатов, как, например, -0,1948а30,2135. Такого рода запись указывает, что истинное значение коэффициента регрессии одновременно содержит положительные и отрицательные величины и даже ноль, чего не может быть. Это также подтверждает вывод о статистической незначимости коэффициентов регрессии при факторах X1 и Х3.

Исключим несущественные факторы X1 и Х3 и построим уравнение зависимости Y (балансовой прибыли) от объясняющих переменных X2 и Х4. Результаты регрессионного анализа приведены в таблицах 7.5, 7.6, 7.7.

Таблица 7.5

Регрессионная статистика

Множественный R

0,9024465

R-квадрат

0,8144098

Нормированный R-квадрат

0,7967345

Стандартная ошибка

5515,53984

Наблюдения

24

Таблица 7.6

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

2

2803387968

1401693984

46,076253

2,08847E-08

Остаток

21

638844774,1

30421179,72

 

 

Итого

23

3442232742

 

 

 

Таблица 7.7

Оценка коэффициентов регрессии

Коэффициенты

Стандартная

ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Y-пересечение

5933,1025

2844,612

2,085733

0,0494

17,40698

11848,798

Переменная X 2

0,9162546

0,132497

6,915287

7,83E-07

0,640712

1,1917972

Переменная X 4

0,0645183

0,024941

2,586860

0,0172

0,012651

0,1163856

Оценим точность и адекватность полученной модели.

Значение R2 = 0,8144 свидетельствует о том, что вариация зависимой переменной Y (балансовой прибыли) по-прежнему в основном (на 81,44%) можно объяснить вариацией включенных в модель объясняющих переменных – Х2 и Х4. Это свидетельствует об адекватности модели.

Значение поправленною коэффициента детерминации (0,7967) возросло по сравнению с первой моделью, в которую были включены все объясняющие переменные (0,7794).

Стандартная ошибка регрессии во втором случае меньше, чем в первом (5515 < 5745).

Расчетное значение F-критерия Фишера составляет 46,08. Значимость F = 2.08847Е-08, что меньше 0,05. Таким образом, полученное уравнение в целом значимо.

Далее оценим значимость отдельных параметров построенной модели. Из таблицы 7.3 видно, что теперь на уровне значимости = 0.05 все включенные в модель факторы являются значимыми: Р-значение < 0,05.

Границы доверительного интервала для коэффициентов регрессии не содержат противоречивых результатов:

с надежностью 0.95 (с вероятностью 95%) коэффициент а1 лежит в интервале 0.64 а11,19;

- с надежностью 0.95 (с вероятностью 95%) коэффициент а2 лежит в интервале 0,01 а20,12

Таким образом, модель балансовой прибыли предприятия торговли запишется в следующем виде:

= 5933,1 + 0,916*Х2+ 0,065*Х4

Параметры модели имеют следующую экономическую интерпретацию. Коэффициент а1 = 0,916, означает, что при увеличении только фонда оплаты труда (X2) на 1 тыс. руб. балансовая прибыль в среднем возрастает на 0,916 тыс. руб., а то, что коэффициент а2 = 0,065, означает, что увеличение только объема продаж по безналичному расчету (Х4) на 1 тыс. руб. приводит в среднем к увеличению балансовой прибыли на 0,065 тыс. руб. Как было отмечено выше, анализ Р-значений показывает, что оба коэффициента значимы.

Средние коэффициенты эластичности рассчитываются по формуле, приведенной выше.

Рассчитаем средние значения Y, X2, X4.

=29800,38

=22371,65

=52220,1

Эх2=0,916*22371,65/29800,38=0,6877

Согласно коэффициенту эластичности по второму фактору - рост фонда оплаты труда на 1% приводит к увеличению балансовой прибыли на 0,6877%.

Эх4=0,065*52220,1/29800,38=0,1139

Второй средний коэффициент эластичности доказывает увеличению балансовой прибыли на 0,1139% при росте объема продаж по безналичному расчету на 1%.

Для выполнения задания 5 снова воспользуемся “Пакетом анализа”, встроенным в EXCEL.

В соответствии со схемой теста Голдфельда-Квандта упорядочим данные по возрастанию переменной X4, предполагая, что дисперсии ошибок зависят от величины этой переменной.

В нашем примере т =n/3 = 8.

Результаты дисперсионного анализа модели множественной регрессии, построенной по первым 8 наблюдениям (после ранжирования по возрастанию переменной Х4), приведены в таблице 7.8.

Таблица 7.8.

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

2

5,07Е+08

2.53E+08

20,95996

0.003707

Остаток

5

ЕSS1=6.04E+07

1.21E+07

 

 

Итого

7

5.67E+08

 

 

 

Результаты дисперсионного анализа модели, построенной по последним 8 наблюдениям, приведены в таблице 7.9.

Таблица 7.9.

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

2

1,77Е+08

88459011

1.000617

0.398654

Остаток

5

ЕSS2=3.98E+08

79576906

 

 

Итого

7

5.75E+08

 

 

 

Рассчитаем статистику Fрасч, = ESS2/ESS1 (т.к. ESS2>ESS1). Для нашего примера получаем: F= 3,98Е+08/6,04Е+07 = 6,58.

Для того, чтобы узнать табличное значение, воспользуемся встроенной в EXCEL функцией FРАСПОБР(0,05;6;6) с параметрами 0,05 - заданная вероятность ошибки гипотезы Н0; m-р = 8-2 = 6; m-р = 6 - параметры распределения Фишера. Данная функция находится в категории «статистических» функций.

Статистика Fрасч больше табличного значения F=FPACIIOБP(0,05;6;6)=4,28. Следовательно, модель гетероскедастична.

Для выполнения задания 6 по уравнению регрессии определим значения отклонений еi=yi-,для каждого наблюдения i (i=1,2,..., n).

Для этого в диалоговом окне Регрессия в группе Остатки следует установить одноименный флажок Остатки. Затем рассчитываем статистику Дарбина-Уотсона по формуле (6.3).

Результаты расчетов представлены в таблице 7.10.

Таблица 7.10.

Таким образом, расчетное значение равно d=6,5Е+08/6,4Е+08 = 1,02.

По таблице критических точек распределения Дарбина-Уотсона для заданного уровня значимости , числа наблюдений п и количества объясняющих переменных т определить два значения: dн- нижняя граница и dв,- верхняя граница (таблица 7.11.).

Таблица 7.11

В нашем случае модель содержит 2 объясняющие переменные (m=2), нижняя и верхняя границы равны соответственно dн = 1,19 и dв = 1,55.

Расчетное значение d-статистики лежит в интервале 0 d dн. Следовательно, в ряду остатков существует положительная автокорреляция.