Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Корреляционно (1).doc
Скачиваний:
0
Добавлен:
01.03.2025
Размер:
214.53 Кб
Скачать
  1. Статистические методы моделирования связи.

Для изучения функциональных связей применяется балансовый и индексный методы. В статистике широко используют балансовые построения, как метод анализа связей и пропорций в экономике.

Для исследования корреляционных связей широко используется метод составления двух параллельных рядов, метод аналитических группировок, корреляционно-регрессионный анализ.

Метод составления двух параллельных рядов заключается в сопоставлении значений факторного и результативного признака. Для этого значения факторных признаков располагают в возрастающем или убывающем порядке. Параллельно записывают значения результативных признаков. Путем сопоставления, таким образом, рядов значений выявляют существование связи и ее направление.

Пример: Проанализируем методом приведения параллельных данных зависимость успеваемости (балл в сессию) студентов по предмету «Теория статистики» от пропущенных ими семинаров в первом семестре:

Номер студента

Балл в сессию, у

Количество пропущенных семинаров, х

Приведенные параллельные данные

х

у

1

5

1

1

5

2

3

8

2

5

3

4

3

2

5

4

4

5

3

4

5

3

8

4

4

6

2

10

5

4

7

5

2

6

3

8

4

4

8

3

9

5

2

8

3

10

3

6

10

2

Мы видим, что с количеством пропущенных семинаров их успеваемость имела тенденцию к снижению и можно сделать, вывод, что связь между этими признаками обратная.

Метод аналитических группировок. Чтобы выявить зависимость с помощью этого метода, нужно провести группировку единиц совокупности по факторному признаку и для каждой группы вычислить среднее значение результативного признака. Сопоставляя затем изменения результативного признака по мере изменения факторного признака можно выявить направление, характер и тесноту связи между ними. Однако, метод группировок не позволяет определить форму влияния факторных признаков на результативный.

Корреляционно - регрессионный анализ решает следующие задачи:

Корреляционный анализ имеет своей задачей количественное определение тесноты связи между двумя признаками. Теснота связи между признаками предполагает определение меры соответствия вариации результативного признака от одного (при изучение парной зависимости) или нескольких (множественных факторов)

Задачами регрессионного анализа являются выбор типа модели (формы связи), установление степени влияния независимых переменных на зависимую и определение расчётных значений зависимой переменной (функции регрессии).

Решение всех названных задач приводит к необходимости комплексного использования этих методов.

При парной регрессии связь между признаками можно увидеть, если построить график, отложив на оси абсцисс значения факторного признака (х), на оси ординат – значения результативного признака. Нанеся на график точки, соответствующие значениям х и у, можно получить корреляционное поле, благодаря которому по характеру расположения точек можно судить о направлении и силе связи. Если точки беспорядочно разбросаны по всему полю, это говорит об отсутствии зависимости между двумя признаками. Если они концентрируются вокруг оси, идущей от нижнего левого угла в верхний правый, то имеется прямая зависимость между варьирующими признаками. Если точки концентрируются вокруг оси, идущей от верхнего левого угла в нижний правый, то существует обратная зависимость.

Аналитическая связь между двумя признаками (парная регрессия) описывается следующими уравнениями:

По форме зависимости различают:

линейную регрессию, которая выражается уравнением прямой (линейной функции) вида: ух = а0 + а{х ;

нелинейную регрессию, которая выражается уравнениями вида:

параболическая функция — ух = а0+ а,х + а2х2;

гиперболическая у = а0 + а1

а1- коэффициент регрессии, который показывает насколько изменяется у при изменение х на единицу.

ао – коэффициент, который характеризует влияние всех остальных факторов, кроме рассматриваемого.

В уравнениях регрессии показывает ао показывает усредненное влияния на результативный признак неучтенных (не выделенных для исследования) факторов; параметр а1 (а в уравнение параболы и а2) – коэффициент регрессии показывает, насколько изменяется в среднем значение результативного признака при увеличении факторного на единицу собственного измерения.

По направлению связи различают:

1) прямую регрессию (положительную), возникающую при условии, если с увеличением или уменьшением независимой величины значения зависимой также соответственно увеличиваются или уменьшаются;

2) обратную (отрицательную) регрессию, появляющуюся при условии, что с увеличением или уменьшением независимой величины зависимая соответственно уменьшается или увеличивается. Так, с увеличением уровня фондоотдачи снижается себестоимость единицы производимой продукции.

Оценка параметров уравнения регрессии осуществляется методом наименьших квадратов. Метод заключается в минимизации суммы квадраов отклонений эмпирических значений результативного признака от теоретических, полученных по выбранному уравнению регрессии.

Система нормальных уравнений для нахождения параметров линейной регрессии методом наименьших квадратов примет следующий вид:

Определить тип уравнения можно, исследуя зависимость графически. Однако существуют более общие указания, позволяющие выявить уравнения связи, не прибегая к графическому изображению. Если результативный и факторный признаки возрастают одинаково, примерно в арифметической прогрессии, то это свидетельствует о том, что связь между ними линейная. Если факторный признак увеличивается в арифметической прогрессии, а результативный значительно быстрей, то используется связь параболистическая или степенная. Также на современном этапе использование современной вычислительной техники облегчает определение типа выбора уравнения.

После расчетов коэффициентов регрессии рассчитывается коэффициент эластичности.

,

Коэффициент показывает на сколько % изменяется у при изменение х на один процент.

Корреляционный и регрессионный анализ обычно (особенно в условиях так называемого малого и среднего бизнеса) проводится для ограниченной по объёму совокупности. Поэтому показатели регрессии и корреляции – параметры уравнения регрессии, коэффициенты корреляции и детерминации могут быть искажены действием случайных факторов. Чтобы проверить, насколько эти показатели характерны для всей генеральной совокупности, не являются ли они результатом стечения случайных обстоятельств, необходимо проверить адекватность построенных статистических моделей.

Значимость коэффициентов простой линейной регрессии (применительно к совокупностям, у которых n<30) осуществляют с помощью t-критерия Стьюдента. При этом вычисляют расчетные (фактические) значения t-критерия:

И змерение тесноты и направления связи является важной задачей изучения и количественного измерения взаимосвязи социально экономических явлений.

Проверка адекватности регрессионной модели может быть дополнена корреляционным анализом. Для этого необходимо определить тесноту корреляционной связи между переменными х и у.

При линейной зависимости теснота связи характеризуется линейным коэффициентом корреляции по формуле:

Линейный коэффициент корреляции имеет большое значение при исследовании социально-экономических явлений и процессов, распределение которых близко к нормальному. Он показывает, в каких случаях из 100 при изменении х изменяется у.

Линейный коэффициент корреляции изменяется в пределах от – 1 до +1. Отрицательные значения указывают на обратную связь, положительные на прямую. При r = 0 линейная связь отсутствует. Чем ближе коэффициент корреляции по абсолютной величине к единице, тем теснее связь между признаками. И, наконец, при r = ±1 – связь функциональная.

По степени тесноты связи различают количественные критерии оценки тесноты связи:

Величина коэффициента корреляции

Характер связи

До ±0,3

Практически отсутствует

±0,3 - ±0,5

Слабая

±0,5 - ±0,7

Умеренная

±0,7 -±1,0

Сильная

Пример: Оценить тесноту связи между объемом производства и балансовой прибыли.

Объем производства, млн. руб.

Балансовая прибыль, млн. руб.

ху

1

6,1

3

18,3

2,0449

1,69

2

6,0

2

12

2,3409

5,29

3

7,2

6

43,2

0,1089

2,89

4

7,4

2

14,8

0,0169

5,29

5

6,8

4

27,2

0,5329

0,09

6

7,4

3

22,2

0,0169

1,69

7

9,1

8

72,8

2,4649

13,69

8

8,5

6

51

0,9409

2,89

9

8,6

5

43

1,1449

0,49

10

8,2

4

32,8

0,4489

0,09

75,3

43

337,3

10,061

34,1

Связь между признаками сильная и прямая.

Квадрат линейного коэффициента корреляции r2 называется линейным коэффициентом детерминации. Из определения коэффициента детерминации очевидно, что его числовое значение всегда заключено в пределах от 0 до 1, то есть 0 ≤ r2 ≤ 1. Степень тесноты связи полностью соответствует теоретическому корреляционному отношению, которое является более универсальным показателем тесноты связи по сравнению с линейным коэффициентом корреляции.

Факт совпадений и несовпадений значений теоретического корреляционного отношения η и линейного коэффициента корреляции r используется для оценки формы связи.

Выше отмечалось, что посредством теоретического корреляционного отношения измеряется теснота связи любой формы, а с помощью линейного коэффициента корреляции – только прямолинейной. Следовательно, значения η и r совпадают только при наличии прямолинейной связи. Несовпадение этих величин свидетельствует, что связь между изучаемыми признаками не прямолинейная, а криволинейная. Установлено, что если разность квадратов η и r не превышает 0,1 , то гипотезу о прямолинейной форме связи можно считать подтвержденной.

Теснота корреляционной связи, как и любой другой, может быть измерена эмпирическим корреляционным отношением ηэ , когда δ2 (межгрупповая дисперсия) характеризует отклонения групповых средних результативного признака от общей средней: .

где: - эмпирическое корреляционное отношение;

- общая дисперсия зависимого признака;

- межгрупповая дисперсия зависимого признака.

Говоря о корреляционном отношении как о показателе измерения тесноты зависимости, следует отличать от эмпирического корреляционного отношения – теоретическое.

Теоретическое корреляционное отношение η представляет собой относительную величину, получающуюся в результате сравнения среднего квадратического отклонения выровненных значений результативного признака, то есть рассчитанных по уравнению регрессии, со средним квадратическим отношением эмпирических (фактических) значений результативности признака σ:

Теоретическое корреляционное отношение по формулам:

где

где: - теоретическое корреляционное отношение; – общая дисперсия зависимого признака

по несгруппированным данным;

– остаточная дисперсия;

– теоретическое значение;

- простая средняя арифметическая эмпирического ряда;

– численность совокупности.

Как видно из вышеприведенных формул корреляционное отношение может находиться от 0 до 1. Чем ближе корреляционное отношение к 1, тем связь между признаками теснее. Теоретическое корреляционное отношение показывает качество теоретической линии (чем ближе к 1 тем выше качество).

Подкоренное выражение корреляционного выражения представляет собой коэффициент детерминации (мера определенности, причинности). Коэффициент детерминации показывает долю вариации результативного признака под влиянием вариации признака-фактора.

Теоретическое корреляционное выражение применяется для измерения тесноты связи при линейной и криволинейной зависимостях между результативным и факторным признаком.

Изучение связи между тремя и более связанными между собой признаками носит название множественной регрессии. При исследовании зависимостей методами множественной регрессии требуется определить аналитическое выражение связи между результативным признаком (У) и множеством факторных признаков (х1, х2,..хп).

Построение моделей множественной регрессии включает следующие этапы:

  • Выбор формы связи (уравнение регрессии);

  • Отбор факторных признаков;

  • Обеспечение достаточного объема совокупности для получения реальных оценок.