Решение типового варианта
При изучении зависимости издержек обращения Y (млн. руб.) от объема товарооборота X (млн. руб.) по 10 фирмам получены следующие данные (таблица 2).
Таблица 2
-
Фирмы
Объем товарооборота X, млн. руб.
Издержки обращения
Y, млн.руб.
1
60
2,9
2
90
7,1
3
150
11,8
4
80
6,3
5
110
7,2
6
120
8,4
7
70
4,8
8
130
11,20
9
100
6,7
10
140
10,6
V
50
1) Считая, что между признаками Y и X имеет место линейная корреляционная связь, определить уравнение парной линейной регрессии.
Парная
регрессия представляет собой зависимость
между двумя переменными – x
и y,
т.е. модель вида: y
= f(x),
которую будем называть «истинным»
уравнением регрессии. Необходимо по
данным наблюдениям (yi,xi),
i=1,…,n
подобрать функцию
,
«наилучшим» образом описывающую
«истинную» зависимость где у-
зависимая переменная (результативный
признак); x-
независимая,
или объясняющая переменная (признак -
фактор). Подобрать функцию – значит
определить вид функциональной зависимости
и значения параметров.
Наиболее
часто используется линейная
форма зависимости. Модель линейной
парной регрессии сводится к нахождению
уравнения вида:
,
(1)
где
и
-оценки
параметров a
и b.
Это уравнение позволяет по заданным
значениям фактора x
иметь теоретические значения
результативного признака y,
подставляя в него фактические значения
фактора x.
Построение линейной регрессии сводится к нахождению оценок ее параметров – a и b. Оценки параметров линейной регрессии могут быть найдены различными методами.
Классический
подход к оцениванию параметров линейной
регрессии основан на методе
наименьших квадратов (МНК),
позволяющий получить такие оценки a
и b,
при которых сумма квадратов отклонений
фактических значений результативного
признака y
от расчетных (теоретических) ŷ,
минимальна.
Значения yi и xi нам известны, это данные наблюдений. Используя необходимое условие существования экстремума функции R(a,b), получим следующую систему линейных уравнений относительно и :
здесь индексы суммирования у переменных и знака суммы опущены.
По
исходным данным рассчитаем
и
внесем в таблицу 3:
Таблица 3
№ |
X |
Y |
XY |
X2 |
Y2 |
1 |
60 |
2,9 |
174 |
3600 |
8,41 |
2 |
90 |
7,1 |
639 |
8100 |
50,41 |
3 |
150 |
11,8 |
1770 |
22500 |
139,24 |
4 |
80 |
6,3 |
504 |
6400 |
39,69 |
5 |
110 |
7,2 |
792 |
12100 |
51,84 |
6 |
120 |
8,4 |
1008 |
14400 |
70,56 |
7 |
70 |
4,8 |
336 |
4900 |
23,04 |
8 |
130 |
11,2 |
1456 |
16900 |
125,44 |
9 |
100 |
6,7 |
670 |
10000 |
44,89 |
10 |
140 |
10,6 |
1484 |
19600 |
112,36 |
Итого: |
1050 |
77 |
8833 |
118500 |
665,88 |
Средние значения |
105 |
7,7 |
883,3 |
11850 |
66,588 |
Среднее квадратическое отклонение |
28,72 |
2,7 |
- |
- |
- |
Подставим расчетные данные в систему линейных уравнений:
Решая систему уравнений либо методом определителей (метод Крамера), либо методом последовательного исключения неизвестных (метод Гаусса), найдем искомые параметры и . В нашем случае: = -1,82 и = 0,0907.
Получим уравнение линейной регрессии:
ŷ = - 1,82 + 0,0907·x. (2)
Величина параметра показывает среднее изменение результата с изменением фактора на одну единицу, т.е. при изменении объема товарооборота на 1 млн. рублей величина издержек обращения в среднем увеличивается на 0,0907 млн.руб.:
ŷ = - 1,82 + 0,0907·(x+1) = -1,82+0,0907·x+0,0907.
2) При изучении статистической зависимости двух случайных величин X и Y наглядную картину их взаимосвязи дает изображение точек выборки (x1,y1), (x2,y2),…, (xn,yn) на корреляционной плоскости. Это изображение называется корреляционным полем (диаграммой рассеивания). Построим диаграмму рассеивания и линию линейной регрессии (линию тренда):
3) Используя полученное уравнение регрессии, ожидаемая величина издержек обращения при объеме товарооборота V = 50 млн. рублей составит:
ŷ = –1,82+0,0907·50 =2,715 (млн. руб.)
4)
Уравнение регрессии всегда дополняется
показателем тесноты связи. Мерой
статистической связи двух случайных
величин является коэффициент
парной корреляции rxy
=
,
где
σx
,σy
- средние квадратические отклонения.
Существуют различные формулы для линейного коэффициента парной корреляции.
Рассчитаем выборочный линейный коэффициент парной корреляции rxy по формуле:
.
Коэффициент парной корреляции отражает взаимосвязь случайных величин и не зависит от того, какая из величин X или Y является причиной, а какая следствием.
Как известно, линейный коэффициент корреляции находится в пределах:
-1≤ rxy ≤1. Знак rxy характеризует направление, а абсолютная величина rxy- характер тесноты связи. Для качественной оценки тесноты корреляционной связи между X и Y можно воспользоваться таблицей Чеддока (таблица 4):
