Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методичка по летней практике программирование.docx
Скачиваний:
332
Добавлен:
20.03.2016
Размер:
305.91 Кб
Скачать

1.2 Определение параметров линейного однофакторного уравнения регрессии

Пусть у нас имеются данные о доходах ( ) и спросе на некоторый товар ( ) за ряд лет ( ):

Год i

Доход x

Спрос y

1

x 1

y 1

2

x 2

y 2

3

x 3

y 3

...

...

...

n

x n

y n

Предположим, что между x и y существует линейная взаимосвязь, т.е. y=a+bx.

Для того, чтобы найти уравнение регрессии, прежде всего нужно исследовать тесноту связи между случайными величинами x и y , т.е. корреляционную зависимость.

Пусть

x 1 , x 2 , ..., x n   совокупность значений независимого, факторного признака;

y 1 , y 2 , ..., y n   совокупность соответствующих значений зависимого, результативного признака;

n   количество наблюдений.

Для нахождения уравнения регрессии вычисляются следующие величины:

1. Средние значения

 для экзогенной переменной;

  для эндогенной переменной.

2. Отклонения от средних величин

3. Величины дисперсии и среднего квадратичного отклонения

=;

.

Величины дисперсии и среднего квадратичного отклонения характеризуют разброс наблюдаемых значений вокруг среднего значения. Чем больше дисперсия, тем больше разброс.

4. Вычисление корреляционного момента (коэффициента ковариации):

Корреляционный момент отражает характер взаимосвязи между x и y . Если K x, y  > 0, то взаимосвязь прямая. Если K x, y  < 0, то взаимосвязь обратная.

5. Коэффициент корреляции вычисляется по формуле

.

Доказано, что коэффициент корреляции находится в интервале от минус единицы до плюс единицы (- 1 >=   R x, y <=  1). Коэффициент корреляции в квадрате называется коэффициентом детерминации.

Если R x, y  >  |0,8|, то вычисления продолжаются.

6. Вычисления параметров регрессионного уравнения.

Коэффициент b находится по формуле

После чего можно легко найти параметр a :

Коэффициенты a и b находятся методом наименьших квадратов, основная идея которого состоит в том, что за меру суммарной погрешности принимается сумма квадратов разностей (остатков) между фактическими значениями результативного признака y i и его расчетными значениями y i  р , полученными при помощи уравнения регрессии

.

При этом величины остатков находятся по формуле

,

где y i   фактическое значение y ; y i σ   расчетное значение.

Пример 1: Линейная регрессия, нахождение уравнения регрессии.

Задание: С целью анализа взаимного влияния зарплаты и текучести рабочей силы на пяти однотипных фирмах с одинаковым числом работников проведены измерения уровня месячной зарплаты X и числа уволившихся за год рабочих Y, данные приведены в таблице 2:

Таблица 1- соотношение зарплаты и кол-ва уволившихся рабочих

X

100

150

200

250

300

Y

60

35

20

201

15

Найти линейную регрессию Y на X, выборочный коэффициент корреляции.

Решение: Сначала найдем характеристики случайных величин X и Y (выборочное среднее и выборочное среднее квадратичное отклонение).

Таблица 2 – вычисление выборочного среднего и выборочного среднего квадратичного отклонения для X

Сумма

100

150

200

250

300

1000

10000

2500

0

2500

10000

25000

Выборочная средняя

Выборочная дисперсия 25000=500

Выборочное квадратичное отклонение

Таблица 3 – вычисление выборочного среднего и выборочного среднего квадратичного отклонения для Y

Сумма

60

35

20

20

15

150

900

25

100

100

225

1350

Выборочная средняя

Выборочная дисперсия 1350=270

Выборочное квадратичное отклонение

Осталось подсчитать Подсчеты занесем в таблицу:

Таблица 4- вычисление произведений xiyi и их суммы

xi

100

150

200

250

300

yi

60

35

20

20

15

Сумма

xiyi

6000

5250

4000

5000

4500

24750

Коэффициент корреляции вычислим по формуле

Уравнение регрессии Y на X имеет вид:

Подставляем все величины:

Пример 2: Линейная регрессия по корреляционной таблице, построение графика.

Задание: Найти выборочное уравнение прямой регрессииY на X по заданной корреляционной таблицы.

Таблица 5- Корреляционная таблица

Y/X

10

15

20

25

30

35

ny

30

2

6

8

40

4

4

8

50

7

35

8

50

60

2

10

8

20

70

5

6

3

14

nx

2

10

13

50

22

3

N=100

Решение: Построим ряды распределений для Y и X, вычислим их характеристики (выборочное среднее и выборочное среднее квадратичное отклонение)

Таблица 6- Вычисление выборочного среднего и выборочного среднего квадратичного отклонения

10

2

20

417,605

15

10

150

893,025

20

13

260

257,4325

25

50

1250

15,125

30

22

660

677,655

35

3

105

333,9075

Сумма

100

2445

259,75

Выборочная средняя

Выборочная дисперсия

Выборочное квадратичное отклонение

30

8

240

4014,08

40

8

320

1230,08

50

50

2500

288

60

20

1200

1155,2

70

14

980

4336,64

Сумма

100

5240

11024

Выборочная средняя

Выборочная дисперсия

Выборочное квадратичное отклонение

Коэффициент корреляции вычислим по формуле:

Найдем сумму

Тогда Rx,y=

Уравнение регрессии Y на X имеет вид:

Подставляем все величины:

Построим корреляционное поле и линию регрессии:

Рисунок 2- уравнение регрессии

Задание для самостоятельного решения : написать программу на языке С++ для нахождения уравнение регрессии и построения графика, отображающего корреляционное поле и линию регрессии.

Имеются следующие данные разных стран об индексе розничных цен на продукты питания (х) и об индексе промышленного производства (у).

Таблица 7- сведения об индексе розничных цен на продукты питания (х) и об индексе промышленного производства (у).

i

x

y

1

100

70

2

105

79

3

108

85

4

113

84

5

118

85

6

118

85

7

110

96

8

115

99

9

119

100

10

118

98

11

120

99

12

124

102

13

129

105

14

132

112