Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Калининградский филиал федерального государстве...doc
Скачиваний:
6
Добавлен:
23.08.2019
Размер:
476.67 Кб
Скачать

7.Корреляционно-регрессионный метод анализа зависимости.

Комплекс методов статистического измерения взаимосвязей, основанный на регрессионной модели, называется корреляционно-регрессионным анализом.

Регрессионный анализ заключается в определении аналитического выражения связи. Корреляционный и регрессионный анализы тесно связаны между собой. Корреляционный оценивает силу и тесноту связи, а регрессионный - оценивает форму связей, при этом, при регрессионном анализе заранее подразумевается наличие причинно-следственных связей между результативным и факторным признаком.

Первая задача теории корреляции — установить фор­му корреляционной связи, т.е. вид функции регрессии (ли­нейная, квадратичная показательная и т. д.). Наиболее часто функции регрессии оказываются линейными. Если обе функции регрессии f(x) и линейны, то корреляцию называют линейной; в противном случае — нелинейной. Очевидно, при линейной корреляции обе линии регрессии являются прямыми линиями.

Вторая задача теории корреляции — оценить тесноту (силу) корреляционной связи. Теснота корреляционной за­висимости Y от X оценивается по величине рассеяния зна­чений Y вокруг условного среднего . Большое рассеяние свидетельствует о слабой зависимости Y от X либо об отсутствии зависимости. Малое рассеяние указывает на­личие достаточно сильной зависимости; возможно даже, что Y и X связаны функционально, но под воздействием второстепенных случайных факторов эта связь оказалась размытой, в результате чего при одном и том же значении х величина Y принимает различные значения. Аналогично (по величине рассеяния значений X во­круг условного среднего оценивается теснота корре­ляционной связи X от Y.

Приведем свойства выборочного коэффициента корре­ляции, из которых следует, что он служит для оценки тес­ноты линейной корреляционной зависимости.

1. Абсолютная величина выборочного коэффициента кор­реляции не превосходит единицы.

2. Если выборочный коэффициент корреляции равен нулю и выборочные линии регрессии — прямые, то X и y не связаны линейной корреляционной зависимостью.

Из приведенных свойств вытекает смысл : выборочный коэффициент корреляции характеризует тесноту линей­ной связи между количественными признаками в выборке: чем ближе | | к 1, тем связь сильнее; чем ближе | | к О, тем связь слабее.

Если выборка имеет достаточно большой объем и хорошо представляет генеральную совокупность (репрезентатив­на), то заключение о тесноте линейной зависимости между признаками, полученное по данным выборки, в известной степени может быть распространено и на генеральную со­вокупность

Замечание 1. Знак выборочного коэффициента корре­ляции совпадает со знаком выборочных коэффициентов регрессии и указывает направление связи, прямая при плюсе и обратная при минусе.

Замечание 2 Выборочный коэффициент корреляции равен среднему геометрическому выборочных коэффициентов регрес­сии

Корреляционный анализ взаимосвязи себестоимости и урожайности зерновых и зернобобовых.

Для описания, анализа и прогнозирования явлений и про­цессов в экономике применяют математические модели в фор­ме уравнений или функций. Модель экономического объекта (или производственного процесса), отражая основные его свойства и абстрагируясь от второстепенных, позволяет су­дить о его поведении в определенных конкретных условиях.

В случае прямолинейной формы связи результативный признак изменяется под влиянием факторного равномерно. Уравнение прямой линии может быть записано в виде: . Параметры а и b находят, решая систему нормальных уравнений:

годы

признак факторный

признак результат.

квадраты

произведе

ние.

пр. фактор

пр. резул.

х

y

х²

хy

2000

18,8

190

353,44

36100

3572

2001

24

226

576

51076

5424

2002

17,7

544

313,29

295936

9628,8

2003

18

411

324

168921

7398

2004

18,8

479

353,44

229441

9005,2

Итгого

Σ 97,3

Σ 1850

Σ 1920,17

Σ 781474

Σ 35028

Подставляя данные таблицы в систему, получим:

1850=5*а+b*97,3

35028=97,3*а+b*1920,17

Освобождаемся от коэффициентов при а , для чего первое уравнение делим на 5, второе на 97,3 и получаем:

370= а+b*19,46

360= а+b*19,73

Из первого уравнения вычтем второе и получим: ; 10 = -0,27 *b ;

b=10/-0,27=-37,04 коэффициент регрессии.

отсюда находим а

370=а – 37,04*19,46

370 + 720,8 = а

а= 1090,8

Уравнение примет вид:

ỹх = 1090,8 + (-37,04)*х

Коэффициент регрессии b показывает, на сколько изменяется в среднем значение результативного признака при увеличении факторного на единицу. В данной задаче он показывает, что с увеличением урожайности на 1 ц/га себестоимость снизится на 37,04 руб/ц в данных условиях.

1850 / 5 = 370

Занесем дополнительные расчетные величины в таблицу

годы

y

δ²фактическая

δ² остаточная

(ỹ – yˉ)²

(yі – ỹ)²

2000

394,45

597,80

41799,80

2001

201,84

28277,79

583,71

2002

435,19

4249,74

11839,61

2003

424,08

2924,64

171,09

2004

394,44

597,31

7150,39

Итгого

Σ 1850

Σ 36647,28

Σ 61544,6

Для оценки параметров уравнения рассчитывается t-критерий Стьюдента и сравнивается с табличным.

Для оценки параметра уравнения а:

t-критерий Стьюдента расчетный

׀a׀ * √n - m /δост = ׀1090,8׀*√5-2 /248,08 ≈ 7,62

t-критерий Стьюдента табличный 3,18, при α = 0,05, γ = 3 - степеней свободы.

t-критерий Стьюдента расчетный 7,62 > 3,18 t-критерий Стьюдента табличный, это означает, что параметр а, полученый коэффициент регрессии существенен.

Для оценки параметра уравнения b:

t-критерий Стьюдента расчетный

׀b׀ *√n- m / δ ост. *δх ׀37,04׀ * √5-2 /248,8* 2,31≈0,60

X¯= ΣX/ n 97,3/5=19,46

δX = √ΣX²/n – (X¯)² = √1920,17/5 – (19,46)² = 2,31 - среднеквадратическое отклонение факторного признака

t-критерий Стьюдента табличный 3,18, при α=0,05, γ= 3 - степеней свободы.

t-критерий Стьюдента расчетный 0,60 < 3,18 t-критерий Стьюдента табличный, это означает, что параметр b не существенен.

Оценка надежности и значимости выбранного уравнения регрессии достигается с помощью F-критерия Фишера, сравниваются F-критерий Фишера расчетный с F-критерий Фишера табличным :

F расчетный = δ²факт (n-m) / δ²остат. (m-1)

F = 36647,2*3 /61544,6*1 = 1,79

F-критерий Фишера табличный 10,13, при α = 0,05, γ1 = (2-1) =1, γ2 = (5-2) = 3

F-критерий Фишера расчетный 1,79 < 10.13 F-критерий Фишера табличный, это означает, что уравнение прямой не значимо, не существенно и не отражает закономерности развития.

Далее проведем оценку тесноты связи между факторным и результативным признаками, которая определяется парным коэффициентом корреляции.

= (7005,6 – 19,46*370 / 2,3*139,3 = -0,607 - по степени тесноты связь слабая, по характеру связь обратная, так как -1 < r < 0, при увеличении факторного признака результативный уменьшается.

где = 244676,6 / 5 = 48935,32

= 97,3 / 5 = 19,46

= 1850 / 5 = 370

δх = √Σх ²/n – (х¯)² = 2,31

δy = √Σy²/n – (y¯)² = 139,3

Теперь определим теоретическое корреляционное отношение:

- межгрупповая (факторная) дисперсия

=

общая дисперсия = 36647,28 + 61544,6 = 98191,88

η = √36647,28/ 98191,88 = 0,61

т. е. теоретическое корреляционное отношение говорит о слабой тесноте связи.

0,37 – коэффициент детерминации показывает, что урожайность не существенный фактор, так как составляет 37%, а другихе факторы составляет 63% и влияние их очень существенно на изменение себестоимости зерновых.

Оценим точность линейного коэффициента корреляции для малого объёма выборки:

t- критерий Стьюдента расчетный:

׀r׀ / √1- r²* √n – 2 ≈ 1,33

t- критерий Стьюдента табличный 3,18, при α = 0,05, γ = (n-2) = (5-2) = 3

t- критерий Стьюдента расчетный 1,33 < 3,18 t- критерия Стьюдента табличного – полученный линейный коэффициент не значим.

Теперь рассчитаем среднеквадратическую ошибку выборочного коэффициента парной корреляции:

δr = 1- r² / √n – 1 ≈ 0,16

на 16% - отклонения коэффициента корреляции на число степеней свободы n-2 , уровнем значимости α = 0,05.