Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
эконометрика-раздача / УМК-эконометрика-магистры.doc
Скачиваний:
59
Добавлен:
09.05.2015
Размер:
5.46 Mб
Скачать

7.1. Измерение тесноты связи между результативным и факторными признаками.

7.1.1. Линейная корреляция.

  1. Простая линейная корреляция при несгруппированных данных.

Если между двумя явлениями х и у существует линейное стохастическое соотношение – линейная регрессия, то степень интенсивности связи можно измерить с помощью коэффициента корреляции rxy. Корреляция в широком смысле слова означает связь, соотношение между объективно существующими явлениями и процессами. Соотношение между регрессией и корреляцией можно представить в виде следующей схемы, предложенной Браве и Пирсоном.

Пусть заданы значения переменных х и у, между которыми существует линейное соотношение.

у, х – средние значения переменных или их математические ожидания;

n – число проведенных наблюдений;

σх – стандартное отклонение х;

σу – стандартное отклонение у.

Представим уравнение

в эквивалентном виде

В этой системе величина

показывает, на сколько величин σу изменится в среднем у, когда х увеличится на одно σх.

Величина r является показателем тесноты связи и называется выборочным коэффициентом корреляции или простым линейным коэффициентом корреляции или парным коэффициентом или просто коэффициентом корреляции.

Отметим другие модификации формулы для r.

В данной формуле σх и σу – выборочные средние квадратические отклонения для переменных х и у, а σху – выборочный корреляционный момент или выборочная ковариация.

Определение. Ковариацией случайных величинхи у называется математическое ожидание произведения отклонений этих величин от своих математических ожиданий, т.е.

Ковариация двух случайных величин характеризует как степень связи случайных величин, так и их рассеяние вокруг точки (х, у). Ковариация – величина размерная, что затрудняет ее использование для оценки степени зависимости случайных величин. Коэффициент корреляции лишен этих недостатков.

Для практических расчетов наиболее удобна следующая формула

По ней коэффициент корреляции находится непосредственно из данных наблюдений и на его значении не скажутся округления данных, связанные с расчетом средних и отклонений от них.

Коэффициент корреляции обладает следующими свойствами:

  • Принимает значения на отрезке от –1 до 1, т.е. -1≤ r ≤ 1. Чем ближе | rух | к 1, тем теснее связь.

  • При rух = ±1 корреляционная связь представляет собой линейную функциональную зависимость. При этом все наблюдаемые значения располагаются на прямой линии. При r = 1 между отклонениями хi – х и уi – у существует прямая связь, а при r = -1 обратная.

  • r = 0 показывает на отсутствие линейной связи между переменными, а не на отсутствие связи вообще. При этом линия регрессии параллельна оси «Ох».

  • При вычислении коэффициента корреляции для линейной регрессии безразлично, какая переменная является зависимой, а какая объясняющей, т.е. rух = rху.

Коэффициент корреляции не изменится, если переменные подвергнуть преобразованию или изменить их единицы измерения.

  1. Простая линейная корреляция при сгруппированных данных.

Отклонения хj – х взвешиваем по частотам gi j-го интервала значений объясняющей переменной х, отклонения уk – у – по частотам hk k-го интервала зависимой переменной у, а произведение отклонений (хj – х)(ук – у) – по условным частотам pkj.

Поэтому

Коэффициент корреляции, вычисленный по несгруппированному материалу более точен, чем коэффициент корреляции вычисленный по сгруппированным данным, так как свободен от погрешности вносимой группировкой данных.

  1. Связь между коэффициентами корреляции, регрессии и детерминации.

Коэффициент а1 простой линейной регрессии y = а0 + а1x переменной у на х определяется отношением

Коэффициент корреляции определяется следующим соотношением:

Для оценки качества подбора линейной функции рассчитывается квадрат линейного коэффициента корреляции, называемый коэффициентом детерминации. Коэффициент детерминации для простой линейной регрессии (парной детерминации) определяется следующим соотношением:

Это отношение показывает, какая часть общего рассеяния значенийу обусловлена изменчивостью переменной х. Это соотношение можно преобразовать:

Если коэффициент детерминации равен 1, то все эмпирические данные лежат на корреляционной прямой, а если он равен 0, то ни о какой численной линейной зависимости переменной у от х в статистическом понимании не может быть и речи. Коэффициент детерминации – безразмерная величина, не реагирующая на преобразования переменных.

С коэффициентом детерминации связано понятие меры неопределенности регрессии:

Рассмотрим теперь сопряженную регрессию:

Тогда

и поэтому

  1. Линейная множественная корреляция. Частная корреляция.

Показатель множественной корреляции характеризует тесноту связи рассматриваемого набора факторов с исследуемым признаком, или, иначе, оценивает тесноту совместного влияния факторов на результат. Независимо от формы связи показатель множественной корреляции может быть найден по формуле как индекс множественной корреляции

где σу2 – общая дисперсия результативного признака,

Значение индекса множественной корреляции лежит в пределах от 0 до 1 и должно быть больше или равно максимальному парному индексу корреляции:

= 1, 2, …m

При линейной зависимости признаков формула индекса корреляции может быть представлена и через стандартизированные коэффициенты регрессии следующим образом:

rухi – парные коэффициенты корреляции результата с каждым фактором.

Формула индекса множественной корреляции для линейной регрессии получила название линейного коэффициента множественной корреляции, или, совокупного коэффициента корреляции.

При линейной зависимости возможно так же определение совокупного коэффициента корреляции через матрицу парных коэффициентов корреляции

Эта формула позволяет определять совокупный коэффициент корреляции, не обращаясь при этом к уравнению множественной регрессии, а используя лишь парные коэффициенты корреляции.

Частные коэффициенты (или индексы) корреляции, измеряющие влияние на у фактора хi при неизменном уровне других факторов, можно определить по формуле

или по рекуррентной формуле

Частные коэффициенты корреляции изменяются в пределах от –1 до 1. Качество построенной модели в целом оценивает коэффициент (индекс) детерминации. Он рассчитывается как квадрат индекса множественной корреляции: R2yx1…xm.

  1. Влияние неучтенных факторов на коэффициент корреляции.

На коэффициент корреляции при экономических расчетах могут оказывать влияние следующие факторы:

  1. географический фактор: природно-климатические и физико-географические условия;

  2. фактор времени: следует учитывать, за какой период по экономическим данным вычисляется коэффициент корреляции – за месяц, квартал, год;

3) однородность группировки социально-экономических явлений по комплексу признаков. Исследователь должен располагать теоретически обоснованным критерием определения статистической однородности.

7.1.2. Нелинейная корреляция.

1. Нелинейная корреляция для парного уравнения регрессии.

Уравнение нелинейной регрессии, как и в линейной зависимости, дополняется показателем корреляции, а именно индексом корреляции:

где Так как

то индекс корреляции можно выразить как

Величина данного показателя находится в границах: 0≤R≤1, чем ближе к единице, тем теснее связь рассматриваемых признаков, тем более надежно найденное уравнение регрессии.

Если нелинейное относительно объясняемой переменной уравнение регрессии при линеаризации принимает форму линейного уравнения парной регрессии, то для оценки тесноты связи может быть использован линейный коэффициент корреляции, величина которого в этом случае совпадает с индексом корреляции Rху= rуz, где z – преобразованная величина признака-фактора, например, z = 1/x или z = ln x.

Обратимся для примера к равносторонней гиперболе y = b + a/x. Заменив 1/x на z, имеем линейное уравнение y = b + az, для которого может быть определен линейный коэффициент корреляции: r = a× sz /sy . Возводя данное выражение в квадрат, получим:

Преобразовывая далее, придем к следующему выражению для

следовательно,

Но так как

и , то

Таким образом, приходим к формуле индекса корреляции

Заменив далее z на 1/х, получим , соответственно. Аналогично для других функций подобного вида, в которых образования в линейный вид не затрагивают зависимую переменную, и требование МНКвыполнимо.

Иначе обстоит дело, когда преобразования уравнения в линейную форму связаны с зависимой переменной. В этом случае линейный коэффициент корреляции по преобразованным значениям признаков дает лишь приближенную оценку тесноты связи и численно не совпадает с индексом корреляции.

Например, при степенной функции после перехода к логарифмически линейному уравнениюможет быть найден линейный коэффициент корреляции не для фактических значенийх и у, а для их логарифмов, то есть . Соответственно квадрат его значения будет характеризовать отношение факторной суммы квадратов отклонений к общей, но не дляу, а для его логарифмов:

Между тем при расчете индекса корреляции используются суммы квадратов отклонений признака у, а не их логарифмов. С этой целью определяются теоретические значения результативного признака, то есть у, как антилогарифм рассчитанной по уравнению величины lny и остаточная сумма квадратов как . Индекс корреляции определяется по формуле

В знаменателе расчета участвует сумма квадратов отклонений фактических значенийу от их средней величины, а в расчете участвует. Соответственно различаются числители рассматриваемых показателей:

–в индексе корреляции и – в коэффициенте корреляции.

Необходимо также помнить, что если при линейной зависимости признаков сопряженные регрессии имеют один и тот же коэффициент корреляции, то есть , то при криволинейной зависимости они не равны, то есть.

Так как в расчете индекса корреляции используется соотношение факторной и общей суммы квадратов отклонений, то R2 имеет тот же смысл, что и коэффициент детерминации. В специальных исследованиях величину R2 для нелинейных связей называют индексом детерминации.

Оценка существенности индекса корреляции проводится, так же как и оценка надежности коэффициента корреляции. Индекс детерминации используется для проверки существенности в целом уравнения линейной регрессии по F –критерию Фишера:

,

где n – число наблюдений, m – число параметров при переменной х. Величина m характеризует число степеней свободы для факторной суммы квадратов, а (n-m-1) – число степеней свободы для остаточной суммы квадратов.

Индекс детерминации можно сравнивать с коэффициентом детерминациидля обоснования возможности применения линейной функции. Чем больше кривизна линии регрессии, тем величина коэффициента детерминациименьше индекса детерминации. Близость иx означает, что нет необходимости усложнять форму уравнения регрессии и можно использовать линейную функцию. Если , то предположение о линейной форме связи считается оправданным. В противном случае проводится оценка существенности различияи, вычисленных по одним и тем же исходным данным черезt-критерий Стьюдента:

, где – ошибка разности междуи.

Если tф > tт, то различия между рассматриваемыми показателями корреляции существенны и замена нелинейной регрессии уравнением линейной функции невозможна. Если t < 2, то различия несущественны и, следовательно, возможно применение линейной регрессии.

2. Нелинейная корреляция для множественного уравнения регрессии.

Для криволинейной зависимости, нелинейной по переменным, индекс множественной корреляции равен совокупному коэффициенту корреляции.

Например, пусть для фирмы модель прибыли у имеет вид

у = a0 + а1x1 + а2x2 + а3lnx3 + а4lnx4 ,

где х1 – удельные расходы на рекламу;

х2 – капитал фирмы;

х3 – доля продукции фирмы в общем объеме продаж данной группы товаров по региону;

х4 – процент увеличения объема продаж фирмы по сравнению с предыдущим годом.

Тогда независимо от того, что фактор х1 задан линейно, а х2, х3, х4 – в логарифмах, оценка тесноты связи может быть произведена с помощью линейного коэффициента множественной корреляции.

Иначе обстоит дело с криволинейной регрессией, нелинейной по оцениваемым параметрам. Предположим, что рассматривается производственная функция Кобба-Дугласа:

, где P – объем продукции, L – затраты труда, К – величина капитала, b1+b2=1.

Логарифмируя ее, получим линейное уравнение в логарифмах

Ln P = lna + b1lnL + b2lnK

Индекс детерминации для нелинейных по оцениваемым параметрам функции принять называть «квази R2» определения по функциям, использующим логарифмические преобразования (степенная, экспонента), необходимо найти сначала теоретические значения ln y, затем трансформировать их через антилогарифмы, то есть найти теоретические значения результативного признака и далее определять индекс детерминации как «квази R2» по формуле

Величина индекса множественной корреляции, определенная как «квази R2» не будет совпадать с совокупным коэффициентом корреляции.

Для того чтобы не допустить возможного преувеличения тесноты связи, используется скорректированный индекс (коэффициент) множественной корреляции. Он содержит поправку на число степеней свободы и рассчитывается по формуле

, где n – число наблюдений, m – число факторов.

Чем больше величина m, тем сильнее различия между .

Для линейной зависимость признаков скорректированный коэффициент корреляции определяется по той же формуле, что и индекс множественной корреляции. Отличие заключается лишь в том, что в линейной зависимости под m понимается число факторов, включенных в анализ, а в криволинейной зависимости это число параметров при х. Например, если y=f(x1,x2), то для линейной зависимости m = 2, а для регрессии вида

у = a0 + а1x1212x1 + а2x222x22

число параметров при х равно 4, то есть m = 4.

    1. Анализ влияния отдельных факторных признаков на результативный признак.

7.2.1.Эластичность и ее свойства.

Понятие эластичности было введено Аланом Маршаллом в связи с анализом функции спроса. По существу, это понятие является чисто математическим и может применяться при анализе любых дифференцируемых функций.

Эластичностью функции у =f(x) в точке х0 называется следующий предел

Если из контекста ясно, в какой точке определяется эластичность, и какая переменная является независимой, то в обозначении эластичности могут опускаться отдельные символы. Эластичность Еу – это коэффициент пропорциональности между относительными изменениями величин у и х. Если, например, х увеличится на один процент, то у увеличивается (приближенно) на Еу процентов.

Для вычисления эластичности используют несколько эквивалентных формул (если существует конечная производная функции у =f(x) в точке х0):

Рассмотрим теперь ряд свойств эластичности.

1. Эластичность суммы у=у1+…+уп положительных функций уi удовлетворяет соотношению ЕminЕуЕmax, где Еmin(Еmax) – это минимальная (максимальная) эластичность функций уi.

2. Эластичность произведения функций u=u(x) и v=v(x) равна сумме эластичностей функций u и v: Еuv = Еu +Еv.

3. Эластичность частного функций u=u(x) и v=v(x) равна разности эластичностей функций u и v: Еuv = ЕuЕv.

  1. Для сложной функции у=f(g(t)) эластичность у по t удовлетворяет равенству Еуt = ЕуxЕxt.

  2. Эластичность обратной функции удовлетворяет соотношению Еху=Еух-1.

Примеры:

у = х+С,

у=ха,

Как видим, эластичность степенной функции не зависит от значениях. В других функциях коэффициент эластичности зависит от значений фактора x. В силу этого для них обычно рассчитывается средний показатель эластичности

Пример 7.2.1. По группе предприятий, производящих однородную продукцию, известно, как зависит себестоимость единицы продукции y от факторов, приведенных в таблице. Определить с помощью коэффициентов эластичности силу влияния каждого фактора на результат. Проранжировать факторы по силе влияния. Данные представлены в таблице 7.2.1.

Таблица 7.2.1.

Объем производства (х1)

у(х1)=0,62+58,74∙(1/х1)

2,64

Трудоемкость единицы продукции (х2)

у(х2)=9,3+9,83∙х2

1,38

Оптовая цена за 1т. энергоносителя (х3)

у(х3)=11,75+х31,6281

1,503

Доля прибыли, изымаемая государством (х4)

у(х4)=14,87∙1,016х4

26,3

Тогда получаем:

  1. для гиперболы у=b+a/x

  1. для линейной функции у=b+ax

  1. для степенной функции у=bxа

  1. для показательной функции у=bах

Наиболее слабое влияние на изменение признака у оказывает фактор x4, поскольку коэффициент эластичности по абсолютной величине имеет самое низкое значение 0,1813.

Это означает, что при росте доли прибыли, изымаемой государством, на 1% себестоимость увеличится на 0,18%. Наиболее сильное влияние на изменение признака у оказывает фактор x3, поскольку коэффициент эластичности по абсолютной величине имеет самое высокое значение 1,6281. Это означает, что при росте цены за одну тонну энергоносителя на 1%, себестоимость возрастет на 1,63%.

Упорядочим факторы по силе влияния на изменение себестоимости:

Ранг

Факторный признак

Обозна- чение

Коэффициент эластичности

Комментарий

1

Доля прибыли, изымаемой государством

x4

0,1813

Инфраэластичность. Влияние практически отсутствует. Фактор оказывает наименьшее влияние на себестоимость

2

Трудоемкость единицы продукции

x1

0,5933

При изменении трудоемкости единицы продукции на 1% себестоимость изменится на 0,59%. Инфраэластичность, влияние слабое.

3

Объем производства

x2

-0,9728

Между изменением объема производства и себестоимости существует обратная зависимость. С увеличением объема производства на 1% себестоимость снижается на 0,97%.

4

Цена за одну тонну энерго-носителя

x3

1,6281

При изменении фактора на 1% себестоимость изменяется на 1,63%. Ультраэластичность, влияние сильное. Фактор оказывает наибольшее влияние на себестоимость

Пример 7.2.2. В таблице 7.2.2. указаны парные коэффициенты корреляции. Провести анализ целесообразности включения заданных факторов в уравнение множественной линейной регрессии.

Таблица 7.2.2.

у

x1

x2

x3

x4

у

1

x1

0,71

1

x2

0,58

0,53

1

x3

0,08

0,2

0,13

1

x4

0,62

0,81

0,3

0,25

1

Между y и x3 связь практически отсутствует. Между y и x1 связь сильная, между y и x2, x4 – умеренная.

Отсюда следует вывод о нецелесообразности включения фактора x3 в уравнение множественной линейной регрессии (коэффициент парной корреляции с результатом равен 0,08).

Между факторами x1 и x4 существует сильная прямая связь (коэффициент парной корреляции >0,8). Для того чтобы избежать явления мультиколлинеарности, один из этих факторов должен быть исключен из анализа. Исключается фактор x1, умеренно коррелирующий с x2 (коэффициент их парной корреляции равен 0,53). Факторы, включенные в модель множественной регрессии: x2, x4.

  1. Системы эконометрических уравнений.

Объектом статистического изучения в экономике являются сложные системы. При использовании отдельных уравнений регрессии изменение факторов влечет за собой, как правило, изменения во всей системе взаимосвязанных признаков. Именно поэтому в последние десятилетия в экономических, биометрических и социологических исследованиях важное место заняла проблема описания структуры связей между переменными системой одновременных уравнений, называемых такжеструктурными уравнениями.В них одни и те же зависимые переменные в одних уравнениях входят в левую часть, а в других уравнениях – в правую часть системы

y1=b12y2 + b13y3 +…+ b1nyn+ a11x1+ a12x2+…+ a1mxm1,

y2=b21y1 + b23y3 +…+ b2nyn+ a21x1+ a22x2+…+ a2mxm2,

…………………………………………………………………..

yn=bn1y1 + bn2y2 +…+ bnn-1yn-1+ an1x1+ an2x2+…+ anmxmn.

Зависимые переменные (у), число которых равно числу уравнений в системе, называютсяэндогенными переменными,предопределенные переменные (х), влияющие на эндогенные переменные, но не зависящие от них, называютсяэкзогенными переменными.

Экономические переменные могут выступать в одних моделях как эндогенные, а в других как экзогенные переменные. Целесообразно в качестве экзогенных переменных выбирать такие переменные, которые могут быть объектом регулирования. Меняя их и управляя ими, можно получать целевые значения эндогенных переменных.

Примером системы одновременных уравнений может служить модель динамики цены и заработной платы вида

y1=b12y2 + a11x1 + ε1,

y2=b21y1 + a22x2+ a23x32,

где y1 – темп изменения месячной заработной платы;

y2– темп изменения цен;

х1– процент безработных;

х2– темп изменения постоянного капитала;

х3– темп изменения цен на импорт сырья.

В отличие от предыдущих разделов каждое уравнение системы одновременных уравнений не может рассматриваться самостоятельно, и для нахождения его параметров традиционный МНК неприменим. С этой целью используются следующие специальные приемы оценивания:

– косвенный метод наименьших квадратов;

– двухшаговый метод наименьших квадратов;

  • трехшаговый метод наименьших квадратов;

  • метод максимального правдоподобия с полной информацией;

  • метод максимального правдоподобия при ограниченной информации.

Данные методы подробно описаны в литературе [6], первые два являются традиционными, достаточно легко реализуемыми.

Метод максимального правдоподобия рассматривается как наиболее общий метод оценивания, результаты которого при нормальном распределении признаков совпадают с МНК. Однако при большом числе уравнений системы этот метод приводит к достаточно сложным вычислительным процедурам. Поэтому в качестве модификации используется метод максимального правдоподобия при ограниченной информации, разработанный в 1949 г. Т.Андерсоном и Н.Рубиным. В этом методе сняты ограничения на параметры, связанные с функционированием системы в целом. Несмотря на его значительную популярность, к середине 60-х годов он был практически вытеснен двухшаговым методом наименьших квадратов (ДМНК) в связи с гораздо большей простотой последнего.

Дальнейшим развитием ДМНК является трехшаговый метод наименьших квадратов, предложенный в 1962 г. А.Зельнером и Г.Тейлом. Однако при некоторых ограничениях на параметры более эффективным оказывается все же ДМНК. Метод получил название двухшагового метода наименьших квадратов, ибо дважды используется МНК: на первом шаге при определении формы модели зависимости эндогенных переменных только от экзогенных (так называемая приведенная модель) и нахождении на ее основе оценок теоретических значений эндогенных переменных, и, затем, на втором шаге, используя эти теоретические значения эндогенных переменных, применительно к исходным уравнениям модели. См. также [4].

Практикум

Задача 1. Оценить регрессию, построить график, найти коэффициент корреляции, стандартные ошибки коэффициентов регрессии, дать интерпретацию уравнению регрессии и коэффициентов корреляции.

А)

x

1351.7

1369.3

1479.1

1682.5

1799.0

1924.5

2046.0

y

117,9

122,5

125,5

129,2

134,3

138,4

141,0

Здесь х – совокупные личные доходы;

y – текущие расходы на одежду, среднестатистической американской семьи с 1976 по 1982 г.

Оценим регрессию

y=78,967+0.031x

Найдем коэффициент корреляции:

rxy=0.986

Построим график:

Вывод: С каждого дополнительного доллара американская семья в период 1976-1982 г. тратила 3,1 центов на текущие расходы на одежду.

Б)

x

1351.7

1369.3

1479.1

1682.5

1799.0

1924.5

2046.0

y

164,3

173,7

181,3

243,2

337,9

376,4

356,6

Здесь х – совокупные личные доходы;

y – текущие расходы на бензин, среднестатистической американской семьи с 1976 по 1982 г.

Оценим регрессию

y=-281,825+0.327x

Найдем коэффициент корреляции:

rxy=0.962

Построим график:

Вывод: С каждого дополнительного доллара американская семья в период 1976-1982 г. тратила 32,7 центов на текущие расходы на бензин.

Задача 2. Вычислить коэффициенты регрессии общей суммы налогового сбора (переменная y) на сумму поступлений налога на добавленную стоимость (х) данным:

Время наблюдения

y,

млрд. руб.

x,

млрд. руб.

xi2

yi2

xiyi

январь

38,9

13,4

179,56

1513,21

521,26

февраль

45,3

15,4

237,16

2052,09

697,62

март

61,1

16,7

278,89

3733,21

1020,37

апрель

70,4

16,2

262,44

4956,16

1140,48

май

63,8

13,0

169

4070,44

829,4

июнь

67,7

15,0

225

4583,29

1015,5

июль

70,6

20,8

432,64

4984,36

1468,48

август

78,9

16,4

268,96

6225,21

1293,96

сентябрь

73,2

17,4

302,76

5358,24

1273,68

октябрь

78,1

23,6

556,96

6099,61

1843,16

ноябрь

103,0

23,9

571,21

10609

2461,7

декабрь

133,4

34,4

1183,36

17795,56

4588,96

Σ

884,4

226,1

4667,94

71980,4

18154,6

среднее

График уравнения регрессииy на x выглядит следующим образом:

Задача 3. у= b +ах b и а - ?

а = nxy-x*y

nx2-(x)2

b = y-bx

n

Х

Y

X2

XY

1

-3

-0,71

9

2,13

2

-2

-0,1

4

0,02

3

-1

0,51

1

-0,51

4

0

0,82

0

0

5

1

0,88

1

0,88

6

2

0,81

4

1,62

7

3

0,49

9

1,47

Сум

0

2,79

28

5,61

а = 7*5,61-0*2,79 = 39,27 = 0,20 y= b +аx

7*28-02 196 y= 0,40+0,20x

b = 2,79-(0,20)*0 = 0,40 -уравнение линейной регрессии

Задача 4. х - мощность пласта, у - смена добычи угля.

Х

Y

X2

XY

1

8

5

64

40

2

11

10

121

110

3

12

10

144

120

4

9

7

81

63

5

8

5

64

40

6

8

6

64

48

7

9

6

81

54

8

9

5

81

45

9

8

6

64

48

10

12

8

144

96

Сум

94

68

908

664

a= 10*664-94*68 = 1.02

10*908-(94)2

b = 68-(-2,75)*94 = -2.75

10

Уравнение регрессии

y= 1,02x-2,75.

Коэфф. корреляции

R= n*xy-xy = 10*664 - 94*68 =0.866

(n*x2-(x)2)(n*y2-(y)2) (10*908-(94)2)(10*496-(68)2)

Связь между Х и Y ближе к линейной.

Коэфф. детерминации R2 R1

 0.8662 = 0.749  на 74,9% смена добычи угля зависит от мощности пласта и 25,1% от других факторов.

Задача 5. В таблице указаны парные коэффициенты корреляции. Проведите анализ целесообразности включения заданных факторов в уравнение множественной линейной регрессии.

y

x1

x2

x3

x4

y

1

x1

0,71

1

x2

0,58

0,53

1

x3

0,08

0,2

0,13

1

x4

0,62

0,81

0,3

0,25

1

РЕШЕНИЕ. Между y и x3 связь практически отсутствует. Между y и x1 связь сильная, между y и x2, x4 – умеренная.

Отсюда следует вывод о нецелесообразности включения фактора x3 в уравнение множественной линейной регрессии (коэффициент парной корреляции с у равен 0,08).

Между факторами x1 и x4 существует сильная прямая связь (коэффициент парной корреляции > 0,8). Для того, чтобы избежать явления мультиколлинеарности, один из этих факторов должен быть исключен из анализа. Исключается фактор x1, умеренно коррелирующий с x2 (коэффициент их парной корреляции равен 0,53).

Факторы, включенные в модель множественной регрессии: x2, x4.

Задача 6. По некоторым территориям районов края известны значения средней суточного душевого дохода в у.е. (фактор X) и процент от общего дохода, расходуемого на покупку продовольственных товаров (фактор Y).

Требуется для характеристики зависимости У от X рассчитать параметры линейной, степенной, показательной функции и выбрать оптимальную модель (провести оценку моделей через среднюю ошибку аппроксимации (А) и F-критерий Фишера.

Район

у

х

Пожарский (1)

68,8

45,1

61,277

7,5231

11,4989

56,5970

Кавалеровский (2)

61,2

59,0

56,4689

4,7311

2,00817

22,3833

Дальнегорский (3)

59,9

57,2

57,0915

2,8085

0,63123

7,88767

Хасанский (4)

56,7

61,8

55,5004

1,1996

5,69109

1,43904

Лесозаводский (5)

55,0

58,8

56,5381

1,5381

1,81683

2,36575

Хорольский (6)

54,3

47,2

60,5505

6,2505

7,09956

39,0687

Анучинский (7)

49,3

55,2

57,7833

8,4833

0,01055

71,9664

итого

405,2

32,534

28,7563

201,708

среднее

57,886

4,6477

РЕШЕНИЕ.

1а. Для расчета параметров а и b линейной регрессии у=аx+ b решаем систему нормальных уравнений относительно а и b (или используем EXCEL).

Получаем уравнение регрессии: у = 76,88 – 0,35x.

С увеличением среднедневной заработной платы на 1 руб. доля расходов на покупку продовольственных товаров снижается в среднем на 0,35 %-ных пункта.

Рассчитаем линейный коэффициент парной корреляции: r= -0,35326.

Связь умеренная, обратная.

Определим коэффициент детерминации:

R2 = 0,1248.

Вариация результата на 12,5% объясняется вариацией фактора х. Подставляя в уравнение регрессии фактические значения х, определим теоретические (расчетные) значения (см.табл.).

Найдем величину средней ошибки аппроксимации А:

(4,647744/57,88571)100%=0,080292.

В среднем расчетные значения отклоняются от фактических на 8,03%.

Рассчитаем F-критерий:

Fтабл = 6,6 > Fфакт, при γ = 0,05.

Полученное значение указывает на необходимость принять гипотезу Н0 о случайной природе выявленной зависимости и статистической незначимости параметров уравнения и показателя тесноты связи.

1б. Построению степенной модели у= bxа предшествует процедура линеаризации переменных. Линеаризация производится путем логарифмирования обеих частей уравнения:

lgy = lg b + a lgх , или Y = С + аХ,

где Y = lg(y), X = lg(x), C = lg(b).

Для расчетов используем формулы для линейной регрессии(или используем EXCEL).

Получим уравнение: у = 190,03х-0,2984 . R2 =0,1157.

Характеристики степенной модели указывают, что она несколько хуже линейной функции описывает взаимосвязь.

1в. Построению уравнения показательной кривой у=х предшествует процедура линеаризации переменных при логарифмировании обеих частей уравнения:

lgy = lg b + хlgа , или Y = С + хlgа, и опять же можно использовать формулы для линейной регрессии(или EXCEL).

Получим уравнение: у = 77,24е-0,0053х . R2 =0,1026.

Показательная функция еще хуже, чем степенная, описывает изучаемую зависимость.

1г. Уравнение равносторонней гиперболы у=а/x+ b линеаризуется при замене: x = 1/z .

Тогда у=аz+b. Для расчетов используем формулы для линейной регрессии(или используем EXCEL).

Получено уравнение: у = 38,435 + 1054.7/x. R2 =0.1539.

По уравнению равносторонней гиперболы получена наибольшая оценка тесноты связи (по сравнению с линейной, степенной и показательной регрессиями). A остается на допустимом уровне: 8,1%.

Следовательно, принимается гипотеза Н0 о статистически незначимых параметрах этого уравнения. Этот результат можно объяснить сравнительно невысокой теснотой выявленной зависимости и небольшим числом наблюдений.

Задача 7. Построить модель связи между указанными факторами, проверить её адекватность, осуществить точечный и интервальный прогноз методом экстраполяции.

7.1. Исходные данные отложить на координатной плоскости и сделать предварительное заключение о наличии связи.

Таблица 1 Диаграмма 1

x

y

2,1

29,5

2,9

34,2

3,3

30,6

3,8

35,2

4,2

40,7

3,9

44,5

5,0

47,2

4,9

55,2

6,3

51,8

5,8

56,7

Вывод: Из диаграммы 1 видно, что связь между факторами x и y

прямая сильная линейная связь.

7.2. Рассчитайте линейный коэффициент корреляции. Используя t-критерий Стьюдента, проверьте значимость коэффициента корреляции. Сделайте вывод о тесноте связи между факторами х и у.

Таблица2

xy

1

2,1

29,5

4,41

870,25

61,95

27,91

1,59

0,054

2

2,9

34,2

8,41

1169,64

99,18

33,46

0,74

0,022

3

3,3

30,6

10,89

936,36

100,98

36,23

-5,63

0,184

4

3,8

35,2

14,44

1239,04

133,76

39,69

-4,49

0,128

5

4,2

40,7

17,64

1656,49

170,94

42,47

-1,77

0,043

6

3,9

44,5

15,21

1980,25

173,55

40,39

4,11

0,092

7

5,0

47,2

25

2227,84

236

48,01

-0,81

0,017

8

4,9

55,2

24,01

3047,04

270,48

47,32

7,88

0,143

9

6,3

51,8

39,69

2683,24

326,34

57,02

-5,22

0,101

10

5,8

56,7

33,64

3214,89

328,86

53,55

3,15

0,056

ИТОГО:

42,2

426

193,34

19025,04

1902,04

426

 

0,840

Среднее зн.

4,22

42,56

19,334

1902,504

190,204

 

 

 

7.2.1.Проверим тесноту связи между факторами:

;

Вывод: связь сильная.

7.2.2.Проверим статистическую значимость по критерию Стьюдента:

1)Критерий Стьюдента: tвыб<=tкр

2)Но: r=0 tкр=2,31

tвыб=rвыб*

Вывод: таким образом поскольку tвыб=5,84<tкр=2,31, то с доверительной вероятностью

90% нулевая гипотеза отвергается, это указывает на наличие сильной линейной связи.

7.3. Полагая, что связь между факторами х и у может быть описана линейной функцией, используя процедуру метода наименьших квадратов, запишите систему нормальных уравнений относительно коэффициентов линейного уравнения регрессии. Любым способом рассчитайте эти коэффициенты.

Последовательно подставляя в уравнение регрессии из графы (2) табл.2, рассчитаем значения и заполним графу (7) табл.2

7.4. Для полученной модели связи между факторами Х и У рассчитайте среднюю ошибку аппроксимации. Сделайте предварительное заключение приемлемости полученной модели.

Для расчета заполним 8-ую и 9-ую графу табл.2

<Екр=12%

Вывод: модель следует признать удовлетворительной.

7.5. Проверьте значимость коэффициента уравнения регрессии a1 на основе t-критерия Стьюдента.

Решение: Таблица 3

1

2,1

29,5

27,91

2,5281

214,623

170,5636

2

2,9

34,2

33,46

0,5476

82,81

69,8896

3

3,3

30,6

36,23

31,6969

40,069

143,0416

4

3,8

35,2

39,69

20,1601

8,237

54,1696

5

4,2

40,7

42,47

3,1329

0,008

3,4596

6

3,9

44,5

40,39

16,8921

4,709

3,7636

7

5

47,2

48,01

0,6561

29,703

21,5296

8

4,9

55,2

47,32

62,0944

22,658

159,7696

9

6,3

51,8

57,02

27,2484

209,092

85,3776

10

5,8

56,7

53,55

9,9225

120,78

199,9396

ИТОГО:

42,2

425,6

426,1

174,8791

732,687

911,504

Среднее

4,22

42,56

 

 

 

 

Статистическая проверка:

Вывод: С доверительной вероятностью 90% коэффициентa1- статистически значим, т.е. нулевая гипотеза отвергается.

7.6. Проверьте адекватность модели (уравнения регрессии) в целом на основе F-критерия Фишера-Снедекора.

Решение:

Процедура статистической проверки:

:модель не адекватна

Вывод: т.к. Fвыб.>Fкр., то с доверительной вероятностью 95% нулевая гипотеза отвергается (т.е. принимается альтернативная). Изучаемая модель адекватна и может быть использована для прогнозирования и принятия управленческих решений.

7.7. Рассчитайте эмпирический коэффициент детерминации.

Решение:

(таб. 3)

-показывает долю вариации.

Вывод: т.е. 80% вариации объясняется фактором включенным в модель, а 20% не включенными в модель факторами.

7.8. Рассчитайте корреляционное отношение. Сравните полученное значение с величиной линейного коэффициента корреляции.

Решение:

Эмпирическое корреляционное отношение указывает на тесноту связи между двумя факторами для любой связи, если связь линейная, то , т.е. коэффициент корреляции совпадает с коэффициентом детерминации.

7.9. Выполните точечный прогноз для .

Решение:

7.10-7.12. Рассчитайте доверительные интервалы для уравнения регрессии и для результирующего признака при доверительной вероятности=90%. Изобразите в одной системе координат:

а) исходные данные,

б) линию регрессии,

в) точечный прогноз,

г) 90% доверительные интервалы.

Сформулируйте общий вывод относительно полученной модели.

Решение:

-математическое ожидание среднего.

Для выполнения интервального прогноза рассматриваем две области.

  1. для y из области изменения фактора x доверительные границы для линейного уравнения регрессии рассчитывается по формуле:

  1. для прогнозного значения доверительный интервал для рассчитывается по формуле:

Исходные данные:

  1. n=10

  2. t=2,31(таб.)

4)

5): 27,91 42,56 57,02 66,72

6)19,334-4,222)=1,53.

Таблица 4

 

 

1

2,1

-2,12

4,49

3,03

1,74

2,31

4,68

18,81

27,91

9,10

46,72

2

4,22

0,00

0,00

0,1

0,32

2,31

4,68

3,46

42,56

39,10

46,02

3

6,3

2,08

4,33

2,93

1,71

2,31

4,68

18,49

57,02

38,53

75,51

4

7,7

3,48

12,11

9,02

3

2,31

4,68

32,43

66,72

34,29

99,15

Вывод: поскольку 90% точек наблюдения попало в 90% доверительный интервал, данная модель и ее доверительные границы могут использоваться для прогнозирования с 90% доверительной вероятностью.

Задача 8. Построить линейную множественную регрессию общей суммы налогов и платежей на общую сумму поступлений по налогу на добавленную стоимость (x1) и налогу на прибыль (доход) (x2).

Время наблюдения

y,

млрд. руб.

x1,

млрд. руб.

x2,

млрд. руб.

январь

38,9

5,6

13,4

февраль

45,3

6,7

15,4

март

61,1

13,1

16,7

I квартал

145,3

25,3

45,5

апрель

70,4

16,9

16,2

май

63,8

18,4

13

июнь

67,7

19,1

15

II квартал

201,9

54,4

44,2

I полугодие

347,2

79,8

89,7

июль

70,6

16,1

20,8

август

78,9

23,3

16,4

сентябрь

73,2

19,2

17,4

III квартал

222,7

58,6

54,6

9 месяцев

569,9

138,3

144,3

октябрь

78,1

16,1

23,6

ноябрь

103

31,8

23,9

декабрь

133,4

35,4

34,4

IV квартал

314,5

83,3

81,9

II полугодие

537,2

141,9

136,5

январь-декабрь

884,4

221,6

226,1

а0=-9.7

а1=1.84

а2=2.62

Полученное уравнение

Задания для самостоятельной работы

  1. Имеются следующие ряды оценок по тестам чтения и арифметики:

Чтение 43 58 45 53 37 58 55 61 46 64 46 62 60 56

Арифметика 32 25 28 30 22 25 22 20 20 30 21 28 34 28

Вычислите коэффициент корреляции.

2. Известны данные по числу преступлений на 100 тысяч человек, тыс. (y) в зависимости от среднедушевого дохода, тыс.руб. (x) по 10 регионам России. Построить линейную модель.

y

4,62

2,87

3,55

2,34

2,30

1,92

1,85

1,30

2,39

1,38

x

4,9

6,5

6,9

7,2

7,6

8,8

9,5

11,2

15,6

17,4

3. Дана зависимость зарплаты y, руб./мес. от стажа x, лет на некотором предприятии. Построить линейную модель.

зарплата

стаж

4 949

2

9 094

15

9 167

7

11 836

11

9 683

3

9 927

1

11 970

24

10 607

10

5 747

2

15 327

14

9 844

9

4 953

8

6 152

1

9 109

4

1 6235

7

2 621

1

13 702

12

5 771

6

15 416

9

12 035

5

4. Известна доля владельцев персональных компьютеров в зависимости от среднедушевого дохода; объем выборки.

Логистическая модель:

Построить линейную зависимость z от х.

x

p

1

0,2

-1,386

2

0,1

-2,197

3

0,2

-1,386

4

0,3

-0,847

5

0,2

-1,386

6

0,6

0,405

7

0,4

-0,405

8

0,8

1,386

9

0,5

0

10

0,6

0,405

11

0,6

0,405

12

0,8

1,386

13

0,7

0,847

14

0,8

1,386

15

0,8

1,386

16

0,9

2,197

17

0,7

0,847

18

0,8

1,386

19

0,9

2,197

20

0,9

2,197

5. Имеются данные по 10 фирмам, продающим компакт-диски, – объемы продаж, тыс. шт. / мес. (y), цены, руб. (x1), вложения в рекламу, тыс. руб. / мес. (x2).

y

15

18

10

17

14

26

11

25

6

12

x1

80

100

90

75

120

85

100

70

120

75

x2

25

40

0

10

60

80

10

0

15

5

А) Построить регрессионную зависимость

Б) Проверить гипотезу о значимости коэффициентов регрессии при уровнях значимости и.

В) Построить доверительные интервалы для коэффициентов регрессии а0, а1, а2 с вероятностью .

Г) Вычислить множественный коэффициент корреляции, проверить гипотезу о значимости модели при уровнях значимости и.

6. Известны данные: – цена квартиры, x1 – общая площадь, x2– площадь кухни.

y

x1

x2

630

30

7

640

31,5

6,2

610

31,8

5,6

980

48

7

950

46

6

1020

48,8

7,9

920

45

5,6

1050

52

7,2

1280

63

6

1310

66

6,8

1360

68

6,5

1650

72

8

А) Построить регрессионную зависимость

Б) Проверить гипотезу о значимости коэффициентов регрессии при уровнях значимости и.

В) Построить доверительные интервалы для коэффициентов регрессии а0, а1, а2 с вероятностью .

Г) Вычислить множественный коэффициент корреляции, проверить гипотезу о значимости модели при уровнях значимости и.

7. Определите вид и параметры тренда в динамическом ряде: – реальный обменный курс, х – время.

год

y

х

1995

2,5

0

1996

2,3

1

1997

2

2

1998

1,7

3

1999

3,5

4

2000

3,3

5

2001

2,8

6

2002

2,4

7

2003

2,2

8

2004

2,1

9

2005

2

10

8.Определите вид и параметры тренда в динамическом ряде выплавки стали.

Год 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000

Выплавка 65,3 70,8 76,3 80,2 85,0 91,0 96,9 102,2 106,5 110,3 115,9

стали, млн.т.

9. Известен объем предложения акций на фондовом рынке в зависимости от цены. Определить лучшую регрессионную модель.

x, цена, $

y, объем, тыс.шт.

11

104

12

119

13

137

14

169

15

201

16

263

17

312

18

364

19

451

20

517

10. Имеются данные по ценам на квартиры, тыс.руб. (y) в зависимости от общей площади, м2 (x1) и площади кухни, м2 (x2).

  1. Построить регрессионную зависимость

  2. Обосновать наличие гетероскедастичности.

  3. С помощью обобщенного метода наименьших квадратов построить зависимость с учетом гетероскедастичности.

y

995

1200

780

1150

750

1650

1880

930

2400

835

x1

46

48

30

48

31

73

88

44

73

31

x2

6

8

6

9

5

9

12

5

12

6

11. Имеются данные по странам за год.

Страна

Душевой доход,

долл., y

Индекс челове­ческого развития (ИЧР),x1

Индекс челове­ческой бедности (ИЧБ), x2

Объединенные Арабские Эмираты

1600

0,866

14,9

Таиланд

7100

0,833

11,7

Уругвай

6750

0,883

11,7

Ливия

6130

0,801

18,8

Колумбия

6110

0,848

10,7

Иордания

4190

0,730

10,9

Египет

3850

0,514

34,8

Марокко

3680

0,566

41,7

Перу

3650

0,717

22,8

Шри-Ланка

3280

0,711

20,7

Филиппины

2680

0,672

17,7

Боливия

2600

0,589

22,5

Китай

2600

0,626

17,5

Зимбабве

2200

0,513

17,3

Пакистан

2150

0,445

46,8

Уганда

1370

0,328

41,3

Нигерия

1350

0,393

41,6

Индия

1350

0,446

36,7

Индекс челове­ческого развития объединяет три показателя: валовой внутренний продукт на душу населения, уровень грамотности и продолжительность жизни.

Индекс челове­ческой бедности определяется как средневзвешенное абсолютного (<1.5 $ на душу) и относительного (<3 $ на душу) индекса бедности.

Задание:

Постройте линейное уравнение множественной регрессии и пояс­ните экономический смысл его параметров.

Рассчитайте частные коэффициенты эластичности.

Определите коэффициенты регрессии.

Сделайте вывод о силе связи результата и факторов.

Определите парные коэффициенты корреляции, сделайте выводы.

Дайте оценку полученного уравнения на основе коэффициента детерминации.

12. Известны посезонные данные по объемам продаж сноубордов, шт. (y) в зависимости от цены, тыс.руб. (x). Построить линейную регрессионную модель с учетом сезонности.

2006

2007

2008

весна

лето

осень

зима

весна

лето

осень

зима

весна

лето

осень

зима

y

49

67

101

163

86

43

190

204

118

50

201

216

x

4,5

5

6

6,5

5

5,5

5,5

7

3,5

5

5

6

13. Даны помесячные данные о печати фотографий в некоторой фирме. Построить линейную регрессионную модель с учетом сезонности.

месяц

y, кол-во, шт.

x1, цена, руб.

x2, рекл., руб.

x3, праздники

x4, индекс цен

1

январь, 2006

12 500

2,5

0

3

1

2

февраль

7 600

3

0

1

0,99

3

март

6 900

3

0

1

1,01

4

апрель

13 500

3

5 000

0

1,01

5

май

9 700

3

0

3

1,03

6

июнь

10 700

3

2 000

1

1,04

7

июль

12 100

3

2 000

0

1,05

8

август

9 700

3,5

2 000

0

1,03

9

сентябрь

7 000

4

2 000

0

1,05

10

октябрь

7 200

4

2 000

0

1,05

11

ноябрь

8 200

4

2 000

1

1,06

12

декабрь

8 400

4

2 000

1

1,1

13

январь, 2007

13 100

4

2 000

3

1,11

14

февраль

8 700

4

0

1

1,12

15

март

12 200

4

5 000

1

1,14

16

апрель

6 900

4

0

0

1,16

17

май

6 200

4

0

3

1,17

18

июнь

9 600

4

0

1

1,19

19

июль

8 700

4

0

0

1,18

20

август

11 900

4

4 000

0

1,18

21

сентябрь

12 600

4

6 000

0

1,2

22

октябрь

7 900

4

1 000

0

1,22

23

ноябрь

9 300

4

2 000

1

1,24

24

декабрь

11 800

4

2 000

1

1,27

14. Объем продаж мороженого (млн.шт.) за 5 лет в зависимости от цены (руб.) и сезона.

год

сезон

y, кол-во

цена

индекс цен

x, цена инд.

z(1), весна

z(2), лето

z(3), осень

2003

весна

1,5

3

1

3,00

1

0

0

лето

2,6

4

1,11

3,60

0

1

0

осень

1,7

3,5

1,15

3,04

0

0

1

зима

0,9

3,5

1,26

2,78

0

0

0

2004

весна

1,4

4

1,34

2,99

1

0

0

лето

3

4

1,40

2,86

0

1

0

осень

2,8

4

1,45

2,76

0

0

1

зима

1,6

4

1,52

2,63

0

0

0

2005

весна

1,9

4,5

1,59

2,83

1

0

0

лето

3,2

5

1,63

3,07

0

1

0

осень

2,7

4,5

1,68

2,68

0

0

1

зима

2

4,5

1,78

2,53

0

0

0

2006

весна

2,2

5

1,87

2,67

1

0

0

лето

3,4

5

1,95

2,56

0

1

0

осень

2,6

5

2,01

2,49

0

0

1

зима

2,1

5

2,09

2,39

0

0

0

2007

весна

2,9

5

2,16

2,31

1

0

0

лето

3,3

6

2.19

2,74

0

1

0

осень

2,5

6

2,24

2,68

0

0

1

зима

2,2

6

2,32

2,59

0

0

0

15. Изучается влияние стоимости основных и оборотных средств на величину валового дохода торговых предприятий.

Для этого по 12 торговым предприятиям были получены следующие данные.

Номер предприятия

Валовой доход за год, млн. руб.

Среднегодовая стоимость, млн. руб.

основных фондов

оборотных средств

1

203

118

105

2

63

28

56

3

45

17

54

4

113

50

63

5

121

56

28

6

88

102

50

7

110

126

54

8

56

124

42

9

80

114

36

10

237

154

106

11

160

115

88

12

75

98

46

Задание:

Постройте линейное уравнение множественной регрессии и пояс­ните экономический смысл его параметров.

Рассчитайте частные коэффициенты эластичности.

Определите коэффициенты регрессии.

Сделайте вывод о силе связи результата и факторов.

Определите парные коэффициенты корреляции, а также множественный коэффициент корреляции; сделайте выводы.

Дайте оценку полученного уравнения на основе коэффициента детерминации.

16. Имеются данные о деятельности крупнейших компаний США в 2006г.

№ п/п

Чистый доход, млрд долл.США, у

Оборот капитала, млрд долл. США, х1

Использованный капитал, млрд долл. США, х2

Числен­ность служа­щих, тыс.чел., х3

Рыночная капитали-зация компании, млрд долл. США, х4

1

0,9

31,3

18,9

43,0

40,9

2

1,7

13,4

13,7

64,7

40,5

3

0,7

4,5

18,5

24,0

38,9

4

1,7

10,0

4,8

50,2

38,5

5

2,6

20,0

21,8

106,0

37,3

6

1,3

15,0

5,8

96,6

26,5

7

4,1

137,1

99,0

347,0

37,0

8

1,6

17,9

20,1

85,6

36,8

9

6,9

165,4

60,6

745,0

36,3

10

0,4

2,0

1,4

4,1

35,3

11

1,3

6,8

8,0

26,8

35,3

12

1,9

27,1

18,9

42,7

35,0

13

1,9

13,4

13,2

61,8

26,2

14

1,4

9,8

12,6

212,0

33,1

15

0,4

19,5

12,2

105,0

32,7

16

0,8

6,8

3,2

33,5

32,1

17

1,8

27,0

13,0

142,0

30,5

18

0,9

12,4

6,9

96,0

29,8

19

1,1

17,7

15,0

140,0

25,4

20

1,9

12,7

11,9

59,3

29,3

21

-0,9

21,4

1,6

131,0

29,2

22

1,3

13,5

8,6

70,7

29,2

23

2,0

13,4

11,5

65,4

29,1

24

0,6

4,2

1,9

23,1

27,9

25

0,7

15,5

5.8

80,8

27,2

Задание:

Рассчитайте параметры линейного уравнения множественной регрессии с полным перечнем факторов.

Дайте сравнительную оценку силы связи факторов с результатом с помощью коэффициентов эластичности.

Рассчитайте матрицы парных коэффициентов корреляции и на их основе отберите информативные факторы в модель. Постройте модель только с информативными факторами и оцените ее параметры.

Рассчитайте прогнозное значение результата, если прогнозные значения факторов составляют 80% от их максимальных значений.

Рассчитайте ошибки и доверительный интервал прогноза для уровня значимости 5 или 10% (γ = 0,05; γ = 0,10).

17. Имеются данные о деятельности крупнейших компаний США в 2006г.

№ п/п

Чистый доход, млрд долл. у

Оборот капи­тала, млрд долл. США, х1

Использованный капитал, млрд долл. х2

Численность, тыс. чел., х3

1

6,6

6,9

83,6

222,0

2

3,0

18.0

6,5

32,0

3

6,5

107,9

50,4

82,0

4

3,3

16,7

15,4

45,2

5

0,1

79,6

29,6

299,3

6

3,6

16,2

13,3

41,6

7

1,5

5,9

5,9

17,8

8

5,5

53,1

27,1

151,0

9

2,4

18,8

11,2

82,3

10

3,0

35,3

16,4

103,0

11

4,2

71,9

32,5

225,4

12

2,7

93,6

25,4

675,0

13

1,6

10,0

6,4

43,8

14

2,4

31,5

12,5

102,3

15

3,3

36,7

14,3

105,0

16

1,8

13,8

6,5

49,1

17

2,4

64,8

22,7

50,4

18

1,6

30,4

15,8

480,0

19

1,4

12,1

9,3

71,0

20

0,9

31,3

18,9

43,0

Задание:

Рассчитайте параметры линейного уравнения множественной рег­рессии с полным перечнем факторов.

Дайте сравнительную оценку силы связи факторов с результатом с помощью коэффициентов эластичности.

Рассчитайте матрицы парных и частных коэффициентов корреляции и на их основе отберите информативные факторы в модель. Постройте модель только с информативными факторами и оцените ее параметры.

Рассчитайте прогнозное значение результата, если прогнозные значения факторов составляют 80% от их максимальных значений.

Рассчитайте ошибки и доверительный интервал прогноза для уровня значимости 5 или 10% (а = 0,05; а = 0,10).

Оцените полученные результаты, выводы оформите в аналитической записке.

Соседние файлы в папке эконометрика-раздача