Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
9.doc
Скачиваний:
28
Добавлен:
10.04.2015
Размер:
444.42 Кб
Скачать

3. Корреляционно-регрессионный анализ

Для определения формы влияния факторных признаков на результативный применяют методы корреляционного и регрессионного анализа.

Задачи корреляционного анализа сводятся к измерению тесноты известной связи между варьирующими признаками, определению неизвестных причинных связей и оценке факторов, оказывающих наибольшее влияние на результативный признак.

Задачи регрессионного анализа - выбор типа модели (формы связи), установление степени влияния независимых переменных на зависимую и определение расчетных значений зависимой переменной.

Решение всех названных задач приводит к необходимости комплексного использования этих методов.

Связь между признаками единиц статистической совокупности проявляется в том, что с изменением значения одного из них меняется величина другого. Различают два типа связи между признаками - функциональную и статистическую. При функциональной связи за изменением одного признака (независимой переменной, фактора) всегда следует строго определенное изменение другого (зависимой переменной, результата). Функциональная связь может быть выражена математическим уравнением, действительным для любого значения аргумента.

При статистической связи наряду с изучаемым фактором на результат действуют многие случайные причины. Это приводит к тому, что разным значениям фактора соответствуют разные вероятностные распределения значений результата. Если изменение одной переменной служит причиной изменения другой, то это случай регрессионной зависимости и связь переменных может быть оценена уравнением регрессии Xo=f(xi). Уравнение регрессии - это формула статистической связи между переменными, которая действительна лишь в среднем, а не для каждого наблюдения. Уравнение регрессии называют также математической моделью связи.

Корреляционно-регрессионный анализ позволяет по данным статистического наблюдения решить две основные задачи:

  1. Определить среднее изменение результативного признака (функции) при изменении фактора (аргумента) на единицу в абсолютном и относительном измерении.

  2. Установить меру относительного влияния факторного признака на изменение результативного, разложить вариацию последнего по источникам образования и определить роль фактора в общем объеме вариации результата.

Поскольку корреляционно-регрессионный анализ изучает связи, проявляющиеся в среднем, то при его проведении следует соблюдать общие условия применения средних величин: качественная однородность совокупности и достаточно большое число единиц наблюдения.

Корреляционно-регрессионный анализ ведется в определенной последовательности и состоит из ряда этапов:

    1. Установление причинных зависимостей в изучаемом общественном явлении.

    2. Формирование корреляционной модели связи.

    1. Расчет и анализ показателей регрессии.

    2. Расчет и анализ показателей тесноты связи.

На основании данных выборочной совокупности хозяйств Канской зоны, представленных проведем корреляционно-регрессионный анализ.

Как уже говорилось, из предыдущего раздела факторными признаками мы выбрали уровень оплаты труда, затраты на корма на 1 голову, выход приплода на 100 маток. На основании выбора результативного и факторных признаков построим и рассчитаем корреляционно-регрессионную модель.

Данные расчета полученной модели при помощи компьютерной программы Microsoft Excel представлены в приложении 1.

По матрице парных линейных коэффициентов корреляции можно судить о тесноте связи факторов с результативным признаком и между собой. Матрица парных коэффициентов для нашего примера говорит об отсутствии коллинеарных (т. е. линейно-связанных) факторов, что позволяет включить все эти факторы в уравнение регрессии.

На основе этой матрице вычисляются наиболее общие показатели тесноты связи всех входящих в уравнение регрессии факторов с результативным признаком - коэффициенты множественной корреляции и множественной детерминации.

Коэффициент множественной корреляции - показывает тесноту связи между результативным и несколькими факторными признаками. Может принимать значение от -1 до 1.

Независимо от формы связи, показатель множественной корреляции можно рассчитать как индекс множественной корреляции:

О2

^ ост

/т2 '

Uy

р

пухгх2...хп

2 i^2-Xn)Z

где oocm — - остаточная дисперсия для уравнения

У = f(Xl> Х2' • - • >хп)-

Величина R2 называется коэффициентом множественной детерминации.Она показывает, какая доля вариации изучаемого показателя объясняется влиянием факторов, включённых в уравнение множественной регрессии. Может также принимать значения от 0 до 1. Формула скорректированного индекса множественной детерминации имеет вид:

2(У ~y)2:(n- 1) где ш - число параметров при переменных х\ nп - число наблюдений.

В нашем случае коэффициент множественной корреляции и коэффициент множественной детерминации равны 0,9933 и 0,9867 соответственно, следовательно связь сильная.

Количественно зависимость изменения теоретического значения ухот изменения х, которую выражают коэффициенты регрессии, часто бывает удобнее выразить в относительных величинах. Для этого исчисляюткоэффициент эластичности (Э).Он характеризует, на сколько процентов увеличивается у при увеличении х на один процент, другими словами, он показывает, на сколько изменится признак-результат, если признак-фактор изменится на один процент. Коэффициент эластичности рассчитывается по формуле:

«уY"

rs _2о —2о —71

Расчитаем коэффиценты эластичности для нашего примера:

3i=3,19*-^- = 0,633 34,09

Коэффициент показывает, что при увеличении затрат корма на 1% надои возрастут на 0,633%

9 93

Э2~ 0,81 • -—— = о,24 34,09

Коэффициент показывает, что при увеличении оплаты труда на 1% надой возрастут на 0,24%

Э3=- 0,07242 - = -2,887

39,09

По показателям элатичности можно суджить, что при увеличнии приплода на 1% вличина надоев на 1 корову уменьшится на 2,887 %

/? -коэффициент- показывает, на сколько стандартных отклонений изменится вариация результативного признака, если у соответствующего данному /? - коэффициенту фактора вариация увеличится на одно стандартное отклонение, при фиксированном положении остальных факторов. Этот коэффициент позволяет сравнивать влияние колеблемости различных факторов на вариацию исследуемого показателя, на основе чего выявляются факторы, в развитии которых заложены наибольшие резервы изменения результативного показателя. /3 — коэффициент рассчитывается по формуле:

Pi =* Р2=' -■' "> Рп=

Оу - Оу — Оп

В нашем случае /3 - коэффициент равен:

А=3,.9.М!И=О,77

12,556

/?, = 0,81 ■ в>401783_ ^

2,556

0 047?

А = (-0,07242) • ^fzlt =-0,0013 2,556

р - коэффициенты показывают, что если затраты на корма увеличатся на величину своего среднеквадратического отклонения (а^), то уровень молочной продуктивности изменится в среднем на 0,7 gXq. Изменение уровня оплаты труда на сг2приведет к изменению уровня молочной продуктивности на 0,1271 gxq. А изменение выхода приплода на сг3приведет к изменению уровня молочной продуктивности на-0,013 oxq.

Уравнение множественной регрессии можно строить в линейной форме:

Ух = ао + + агхг + + &пхп>

где а0 -свободный член уравнения;

коэффициенты регрессии, которые показывают, на сколько единиц изменится результативный признак у, если соответствующий данному коэффициенту регрессии фактор Xj увеличится на одну единицу при зафиксированном на средних уровнях значениях остальных факторов.

На основе корреляционно-регрессионной модели в нашем случае уравнение регрессии имеет вид:

j) =8,869312+ 3,186897х,+0,808407х2-0,07242х3.

Н основании данного уравнения можно сделать вывод, что увеличение оплаты труда и затрат на кормление приведет к росту молочной продуктивности, а вот увеличние приплода, наоборотЮ, оказывет отрицательное влияние и в тком случае наметится спад надоев на 1 голову скота.

Рассчитаем j>min,j>mas, > подставляя соответствующие значенияXj: j>min =8,869+ 3,187*1,99 + 0,808*4,01 - 0,072*57,26-14,33j>max =8,869+3,187*10,85 + 0,808*16,55 - 0,072*146,52=46,27iw =8,869+3,187*6,76 +0,808*9,93 - 0,07242*106,27=30,74

Рассмотрим процедуру оценки существенности уравнения регрессии при помощи критерия Фишера.

Фактическое значение F-критерия равно 7,34, а табличное значениеF- критерия при уровне значимости 0,05 и числе степеней свободы вариацииi/, —3 — 1=2 иv2 =25 - 3=22 равно 5,205

Далее рассмотрим процедуру оценки существенности коэффициента регрессии при помощи критерия Стьюдента.

Для оценки значимости коэффициентов регрессии при линейной зависимости уот факторных признаков используютt-критерий Стьюдента. Расчетное значениеt-критерия по параметруa ta=2,53 больше, чем табличное. гтабл=2,0595 при 5%-ном уровне значимости и 25 степенях свободы(n-m-1=30-4-1=25). Значит, параметр аявляется значимым. Расчетные значенияt-критерия Стьюдента по параметрамВ]Ив2tB]=5,1844 иtB2=2,012048 меньше, чем табличное значение, значит эти параметры не являются значимыми. Критерий Стьюдента по параметру в3tB3=-1,53348 больше, чем его табличное значение, следовательно, параметр является значимым.