Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
пособие_Матем ч4.doc
Скачиваний:
13
Добавлен:
01.03.2025
Размер:
5.37 Mб
Скачать

6.4. Упрошенный способ вычисления коэффициента корреляции

Выше в п.п. 6.2 и 6.3, при составлении уравнений прямых регрессии либо по данным корреляционной таблицы непосредственно вычислялись коэффициенты регрессии, либо по тем же данным предварительно вычислялся коэффициент корреляции. В обоих случаях вычисления были очень громоздкими (операции с многозначными числами).

Между тем при постоянных разностях для рассматриваемых в таблицах значений х и у (в табл. 1 и , а в табл. 6 и ) можно заметно упростить вычисления, используя линейное преобразование переменных по формулам: и

где и — произвольно выбираемые значения из заданных значений переменных х и у, а и и v новые переменные.

Так, для рассматриваемых значений х и у в табл. 1 можно провести преобразования

и ,

при которых соответствие между значениями х и и, а также между y и v отражено в табл. 8а и 8б.

Если же применяются преобразования

и ,

то получается другое соответствие (см. табл. 8в и 8г).

Таблица 8

а

б

в

г

х

и

y

v

x

u

y

v

25

35

45

55

65

75

85

95

105 115 125

0

1

2

3

4

5

6

7

8

9

10

13

18

23

28

33

38

43

48

53

58

63

68

0

1

2

3

4

5

6

7

8

9

10

11

25

35

45

55

65

75

85

95

105 115 125

-5

-4

-3

-2

-1

0

1

2

3

4

5

13

18

23

28

33

38

43

48

53

58

63

68

-5

-4

-3

-2

-1

0

1

2

3

4

5

6

Преобразования второй серии обеспечивают большее упрощение вычислений, так как в этом случае все операции ведутся с меньшими по абсолютной величине числами.

Для обоснования этих линейных преобразований

и

можно показать, что операции над переменными х и у, связанные с вычислением коэффициента корреляции и коэффициентов регрессии, сводятся при этих преобразованиях к аналогичным операциям над новыми переменными и и v.

Прежде всего следует заметить, что средним значениям х и у соответствуют средние значения переменных и и v:

Отсюда, при зависимости будет и

Таким же образом можно установить, что

, или .

Далее, разность а поэтому

Аналогично устанавливается, что .

Эти результаты показывают, что участвующие в вычислениях средние квадратические отклонения принимают вид и .

Наконец, преобразование разности дает

.

Таким образом, переход к новым переменным дает преобразованную форму коэффициента корреляции и коэффициентов регрессии:

Для составления уравнений регрессии с помощью новых переменных следует включать в корреляционную таблицу значения этих новых переменных, найденные по формулам:

и .

Удобней всего применять для этой цели исходную таблицу, помещая в ней значения и слева от соответственных значении х, а значения v — над соответственными значениями у. При этом вспомогательный характер значений и и v в таблице обычно оттеняется применением для них мелкого шрифта.

Для иллюстрации тех упрощений, которые достигаются введением новых переменных, используем этот способ на уже рассмотренном примере с распределением растений житняка. В виде значений и переменных х и у выгодней всего используются их средние или ближайшие к ним значения этих переменных. В примере с растениями житняка именно такую замену представляют данные второго преобразования. Поставленные во вторых столбцах табл. 8в и 8г числа получены таким образом: для значений переменной и преобразованием

,

а для значений переменной v преобразованием

.

Вся операция по отысканию параметров уравнений регрессии проводится по отдельным этапам.

  1. Корреляционная таблица 1 пополняется значениями и и v.

  2. Для отыскания коэффициента корреляции составляется вспомогательная таблица (см. табл. 10) с вычислением ее итоговых данных.

Таблица 9

v

-5

-4

-3

-2

-1

0

1

2

3

4

5

6

u

y

x

13

18

23

28

33

38

43

48

53

58

63

68

-5

25

3

2

5

-4

35

6

4

10

-3

45

1

13

5

19

-2

55

1

2

4

8

1

16

-1

65

1

4

4

2

11

0

75

2

6

6

2

16

1

85

1

5

6

2

95

1

4

1

6

3

105

2

4

1

1

8

4

115

1

1

2

5

125

1

1

3

10

20

9

14

11

9

8

6

6

1

3

100

  1. По данным подсчетов:

Следует заметить, что , а также что формулы преобразования и позволяют: по найденным средним значениям новых переменных

и

сразу получить средние значения старых переменных:

u

v

5

10 19 16 11

16

6

6

8

2

1

-5

-4

-3

-2

-1

0

1

2

3

4

5

-25

-40

-57

-32

-11

0

6

12

24

8

5

125 160 171

64

11

0

6

24

72

32

25

-5(-23) = 115

-4(-36) = 144

-3(-53) = 159

-2(-26) = 52

-l(-5) = 5

0

111 = 11

218 = 36

333 = 99

410 = 40

56 = 30

3

10

20

9

14

11

9

8

6

6

1

3

-5

-4

-3

-2

0

1

2

3

4

5

6

-15

-40

-60

-18

-14

0

9

16

18

24

5

18

75 160 180 36

14

0

9

32

54

96

25 108

N = = 10

N = 100

Совпадение с данными о значениях и , найденных непосредственным вычислением, подтверждает правильность проведения упрощенных вычислений.

4) Определив значения трех разностей:

можно записать, что и

Отсюда определяется коэффициент корреляции

Коэффициент регрессии у по х

Коэффициент регрессии х по у

Расхождения полученных коэффициентов с результатами непосредственных вычислений относятся к третьим десятичным знакам, что связано с приближенным характером вычислений.