Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
1.4 Пособие.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
702.98 Кб
Скачать

3.2. Методика корреляционно-регрессионного анализа

Построение корреляционно-регрессионной модели осуществляется в несколько этапов:

1. Постановка задачи.

2. Сбор статистических данных.

3. Корреляционно-регрессионный анализ данных.

4.Прогнозирование на основе полученной зависимости.

Постановка задачи. На первом этапе дается постановка задачи. Например, определить численность занятых в стране в зависимости от произведенного валового продукта; зависимость затрат от количества работников на предприятии и т.д. На этом этапе также считается, что связь между независимыми показателями и результирующим показателем (зависимым) может существовать и характеризуется функцией Y=f(Xn).

Сбор статистических данных. Статистические данные набираются на основе первичных документов и отчетных данных. Некоторые показатели могут быть получены только после предварительной обработки полученной информации. При сборе данных необходимо определить количество выборочных наблюдений или выборочную совокупность, т.е. часть наблюдений, отобранных для дальнейшего исследования.

Объем выборочных наблюдений (Кв) определяется по формуле предельной ошибки случайной бесповторной выборки:

Кв=

где N – величина генеральной совокупности, т.е. величина всей совокупности наблюдений, отображаемых результативных признаков и факторов;

- дисперсия значений признака в генеральной совокупности;

- предельная ошибка случайной бесповторной выборки;

- коэффициент доверия.

Дисперсия является характеристикой рассеивания случайных величин, т.е. их отклонения от средней величины. Квадратный корень из дисперсии – среднее квадратическое отклонение определяется по формуле:

,

где R- есть разница между максимальным и минимальным значением признака (фактора). Она устанавливается на основе анализа данных.

Размеры предельной ошибки по абсолютной величине  задаются в зависимости от требований точности к полученным результатам. Например, если признак исчисляется в сотнях рублей, то предельная ошибка может быть установлена в рублях; если в днях, то в части дня (0,1дня).

Корреляционно-регрессионный анализ. После сбора данных осуществляется их регрессионный анализ, который включает три этапа:

1)определение вида функции (уравнения регрессии);

2)определение тесноты связи между переменными;

3)установление числового значения параметров уравнения регрессии.

На первом этапе определяется форма связи исследуемых показателей или уравнение регрессии. Функциональная зависимость определяется следующим образом: предположим, что линия регрессии переменной, которую мы обозначим , от переменной Х имеет вид: = а0 + а1Х+ - это простейший вид зависимости между двумя показателями – линейная зависимость. Здесь - результативный показатель, а0 и а1- постоянные коэффициенты, Х – фактор, - добавочный коэффициент, при учете которого никогда не может попасть на линию регрессии, т.е. Х.

Это уравнение можно использовать как предсказывающее уравнение, подстановка в него значения Х позволяет предсказать истинное среднее значение У для этого Х.

Проверка линейной зависимости может быть проведена путем сопоставления по собранным данным вариации результативного и факторного признаков. Любую форму зависимости можно проверить графическим путем, отмечая каждое наблюдение точкой в прямоугольной системе координат. По оси ординат откладываются значения У, а по оси абсцисс – значение Х.

Вторым этапом проверяется теснота связи выбранных показателей, т.е. насколько полно выбраны факторные признаки, как велико влияние неучтенных факторов. Поэтому оценка параметров регрессии обычно сопровождается расчетом такой дополнительной характеристики, как коэффициент корреляции, который представляет собой эмпирическую меру линейной зависимости между Х и Y:

ry,x= ( ,

где - среднеарифметическое значение результативных признаков; - среднеарифметическое значение факторов; n- количество выборочных наблюдений; - среднее квадратическое отклонение результирующего и факторного признаков.

Среднее квадратическое отклонение фактора рассчитывается по формуле:

.

Среднее квадратическое отклонение значений результирующего признака рассчитывается по формуле:

.

Величина коэффициента корреляции лежит между (-1;1). Чем выше значение коэффициента корреляции, тем теснее связь между переменными и тем точнее будет прогноз, произведенный на основе полученного уравнения регрессии. Если коэффициент корреляции равен +1, то связь между показателями выражается в прямой зависимости, т.е. при увеличении одного показателя увеличивается и второй и наоборот. Если же коэффициент корреляции равен –1, то связь между двумя показателями выражается в обратной зависимости, т.е. при увеличении одного показателя другой уменьшается, и наоборот.

Завершающим этапом является определение численных значений постоянных коэффициентов уравнения регрессии (а0 и а1). Эти коэффициенты находятся в результате решения системы уравнений. Систему можно получить с помощью метода наименьших квадратов. Метод наименьших квадратов позволяет из бесчисленного множества прямых линий на плоскости выбрать одну, наилучшим образом соответствующую исходным данным.

Этот метод обладает определенными свойствами: пусть мы имеем множество из n наблюдений (Х1,Y1), (Х2,Y2)…(Хn, Yn). Тогда уравнение = а0 + а1Х+ можно записать в виде:

i = а0 + а1Хi+ i, где i=1,2…n.

Следовательно, сумма квадратов отклонений фактических значений от расчетных равна:

S= i2= 2

Б удем подбирать значения оценок а0 и а1 так, чтобы их подстановка в уравнение давало наименьшее значение S, т.е. 2= S min

Определим а0 и а1 дифференцируя уравнение S= i2= 2, сначала по а0, затем по а1 и приравняем результаты к нулю. Тогда получим:

n a0 + a1

a0

Эти уравнения представляют собой систему нормальных уравнений. Отсюда находим коэффициенты регрессионной функции:

а1= =

Решение системы уравнений относительно а0: а0=Y-a1X. С помощью подстановки этого уравнения в уравнение i = а0 + а1Хi+ i получим оцениваемое уравнение регрессии Yi= Y+a1X.

Для практического использования регрессионных моделей важно установить, насколько точно могут быть рассчитаны значения исследуемого показателя по заданным значениям факторов. Для оценки точности уравнений регрессии на практике используют ряд показателей: коэффициент множественной корреляции (детерминации), критерий Фишера, остаточная дисперсия, критерий Стьюдента и др.7

Следует отметить, регрессионные приемы анализа и прогнозирования не вскрывают специфические причины изучаемых явлений, а только дают возможность определить количественную величину связей между ними. Причины могут быть вскрыты только при тщательном изучении технической, технологической и организационной сторон процесса производства и экономических отношений.

Рассмотрим пример прогноза валовой продукции в регионе на основе использования корреляционно-регрессионного анализа.

Известна динамика ВРП в регионе за 25 лет (с1976 г. по 2000 г.) в сопоставимых ценах. Максимальный объем ВРП за исследуемый период составляет 15 млрд руб., минимальный 6 млрд. руб. Тогда R =15-6=9 млрд руб. Величина предельной ошибки принимается равной 0,1 млрд руб., а коэффициент доверия равен 2. Определим объем выборочных наблюдений: Кв= = 24,5

Таким образом, для того чтобы получить результат выборки с точностью до 0,1 млрд руб. необходимо сделать 25 наблюдений.

Таблица 3.1

Динамика ВРП в регионе (в сопоставимых ценах, в млдр руб.)

Показатель/год

ВРП, млрд руб

1

10

2

12,5

3

12,8

4

12,9

5

13,2

6

13,5

7

13,8

8

13,8

9

13,9

10

14,1

11

14,5

12

14,6

13

15,0

14

14,9

15

14,8

16

11,6

17

10,2

18

9,3

19

8,0

20

8,6

21

7,1

22

6,3

23

6,0

24

8,8

25

9,1

Согласно таблице можно предположить, что зависимость между У (объем ВРП в регионе) и Х (год наблюдения) имеет линейный вид: = а0 + а1Х.

Для определения а0 и а1 воспользуемся методом наименьших квадратов. Решим систему уравнений:

n a0 + a1

a0

Пользуясь данными таблицы, найдем:

n=25; 325; = 13; =289,3; = 11,57

= 3406,4; 5525.

25а0+325а1=289,3

325а0+5525а1=3406,4

Решаем систему уравнений относительно а1, находим:

а1=-0,067, тогда Y=Y+a1(Xi-X)

Y=11,57-0,067(X-13)= 12,44-0,067X

Оценим тесноту связи между фактором (Х) и результирующим показателем (Y).

ry,x= ( =-0,69

Согласно полученному коэффициенту корреляции (-0,69) можно сделать вывод, что связь между исследуемыми показателями значимая и обратная, т.е. с увеличением показателя X происходит уменьшение показателя Y.

Прогноз валового выпуска продукции в регионе в следующем (26 году) составит Y= 12,44-0,067*26 =10,7 млрд руб.

Контрольные вопросы:

1. Для каких целей применяется корреляционно-регрессионный анализ в прогнозировании экономических процессов?

2. Какие задачи выполняет регрессионный анализ в прогнозировании?

3. Какие задачи выполняет корреляционный анализ в прогнозировании?

4. Опишите основные этапы построения корреляционно-регрессионной модели.

5. Что показывает коэффициент корреляции?