Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
задания 1 и 2 с указаниями.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
509.95 Кб
Скачать

Решение типового варианта

При изучении зависимости издержек обращения Y (млн. руб.) от объема товарооборота X (млн. руб.) по 10 фирмам получены следующие данные (таблица 2).

Таблица 2

Фирмы

Объем товарооборота X, млн. руб.

Издержки обращения

Y, млн.руб.

1

60

2,9

2

90

7,1

3

150

11,8

4

80

6,3

5

110

7,2

6

120

8,4

7

70

4,8

8

130

11,20

9

100

6,7

10

140

10,6

V

50

1) Считая, что между признаками Y и X имеет место линейная корреляционная связь, определить уравнение парной линейной регрессии.

Парная регрессия представляет собой зависимость между двумя переменными – x и y, т.е. модель вида: y = f(x), которую будем называть «истинным» уравнением регрессии. Необходимо по данным наблюдениям (yi,xi), i=1,…,n подобрать функцию , «наилучшим» образом описывающую «истинную» зависимость где у- зависимая переменная (результативный признак); x- независимая, или объясняющая переменная (признак - фактор). Подобрать функцию – значит определить вид функциональной зависимости и значения параметров.

Наиболее часто используется линейная форма зависимости. Модель линейной парной регрессии сводится к нахождению уравнения вида: , (1)

где и -оценки параметров a и b. Это уравнение позволяет по заданным значениям фактора x иметь теоретические значения результативного признака y, подставляя в него фактические значения фактора x.

Построение линейной регрессии сводится к нахождению оценок ее параметров – a и b. Оценки параметров линейной регрессии могут быть найдены различными методами.

Классический подход к оцениванию параметров линейной регрессии основан на методе наименьших квадратов (МНК), позволяющий получить такие оценки a и b, при которых сумма квадратов отклонений фактических значений результативного признака y от расчетных (теоретических) ŷ, минимальна.

Значения yi и xi нам известны, это данные наблюдений. Используя необходимое условие существования экстремума функции R(a,b), получим следующую систему линейных уравнений относительно и :

здесь индексы суммирования у переменных и знака суммы опущены.

По исходным данным рассчитаем и внесем в таблицу 3:

Таблица 3

X

Y

XY

X2

Y2

1

60

2,9

174

3600

8,41

2

90

7,1

639

8100

50,41

3

150

11,8

1770

22500

139,24

4

80

6,3

504

6400

39,69

5

110

7,2

792

12100

51,84

6

120

8,4

1008

14400

70,56

7

70

4,8

336

4900

23,04

8

130

11,2

1456

16900

125,44

9

100

6,7

670

10000

44,89

10

140

10,6

1484

19600

112,36

Итого:

1050

77

8833

118500

665,88

Средние значения

105

7,7

883,3

11850

66,588

Среднее квадратическое отклонение

28,72

2,7

-

-

-

Подставим расчетные данные в систему линейных уравнений:

Решая систему уравнений либо методом определителей (метод Крамера), либо методом последовательного исключения неизвестных (метод Гаусса), найдем искомые параметры и . В нашем случае: = -1,82 и = 0,0907.

Получим уравнение линейной регрессии:

ŷ = - 1,82 + 0,0907·x. (2)

Величина параметра показывает среднее изменение результата с изменением фактора на одну единицу, т.е. при изменении объема товарооборота на 1 млн. рублей величина издержек обращения в среднем увеличивается на 0,0907 млн.руб.:

ŷ = - 1,82 + 0,0907·(x+1) = -1,82+0,0907·x+0,0907.

2) При изучении статистической зависимости двух случайных величин X и Y наглядную картину их взаимосвязи дает изображение точек выборки (x1,y1), (x2,y2),…, (xn,yn) на корреляционной плоскости. Это изображение называется корреляционным полем (диаграммой рассеивания). Построим диаграмму рассеивания и линию линейной регрессии (линию тренда):

3) Используя полученное уравнение регрессии, ожидаемая величина издержек обращения при объеме товарооборота V = 50 млн. рублей составит:

ŷ = –1,82+0,0907·50 =2,715 (млн. руб.)

4) Уравнение регрессии всегда дополняется показателем тесноты связи. Мерой статистической связи двух случайных величин является коэффициент парной корреляции rxy = , где σxy - средние квадратические отклонения.

Существуют различные формулы для линейного коэффициента парной корреляции.

Рассчитаем выборочный линейный коэффициент парной корреляции rxy по формуле:

.

Коэффициент парной корреляции отражает взаимосвязь случайных величин и не зависит от того, какая из величин X или Y является причиной, а какая следствием.

Как известно, линейный коэффициент корреляции находится в пределах:

-1≤ rxy ≤1. Знак rxy характеризует направление, а абсолютная величина rxy- характер тесноты связи. Для качественной оценки тесноты корреляционной связи между X и Y можно воспользоваться таблицей Чеддока (таблица 4):