Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Гмурман.doc
Скачиваний:
6
Добавлен:
01.03.2025
Размер:
4.92 Mб
Скачать

§ 5. Корреляционная таблица

При большом числе наблюдений одно и то же рачение х может встретиться пх раз, одно и то же зна­чение упу раз, одна и та же пара чисел (х, у) может аблюдаться пху раз. Поэтому данные наблюдений груп-ируют, т. е. подсчитывают частоты пх, пу, пху. Все РУппированные данные записывают в виде таблицы, ТоРУю называют корреляционной.

257

Поясним устройство корреляционной таблицы на пп мере табл. 13. Ри-

Таблица

Y

х ^-

10

20

30

40

пу

0,4

5

7

14

26

0,6

2

6

4

12

0,8

3

19

22

8

21

13

18

л = 60

В первой строке таблицы указаны наблюдаемые зна­чения (10; 20; 30; 40) признака X, а в первом столбце-. наблюдаемые значения (0,4; 0,6; 0,8) признака Y. На пе­ресечении строк и столбцов находятся частоты пху наблю­даемых пар значений признаков. Например, частота 5 указывает, что пара чисел (10; 0,4) наблюдалась 5 раз. Все частоты помещены в прямоугольнике, стороны кото­рого проведены жирными отрезками. Черточка означает, что соответственная пара чисел, например (20; 0,4), не наблюдалась.

В последнем столбце записаны суммы частот строк. Например, сумма частот первой строки «жирного» прямо­угольника равна пу = 5 + 7+14 = 26; это число указы­вает, что значение признака Y, равное 0,4 (в сочетаний с различными значениями признака К), наблюдалось 26 раз.

В последней строке записаны суммы частот столбцов. Например, число 8 указывает, что значение признака X, равное 10 (в сочетании с различными значениями при­знака Y), наблюдалось 8 раз.

В клетке, расположенной в нижнем правом таблицы, помещена сумма всех частот (общее число наблюдений п). Очевидно, ^пх = ^пу = п. В нашем прй' мере

= 60 и

258

§ в. Отыскание параметров выборочного уравнения прямой линии регрессии по сгруппированным данным

В § 4 для определения параметров уравнения

«ямой линии регрессии Y на X была получена система

уравнений

2 22 \

I

Предполагалось, что значения X и соответствующие и>1 значения Y наблюдались по одному разу. Теперь же допустим, что получено большое число данных (практи­чески для удовлетворительной оценки искомых парамет­ров должно быть хотя бы 50 наблюдений), среди них есть повторяющиеся, и они сгруппированы в виде корреля­ционной таблицы. Запишем систему (*) так, чтобы она отражала данные корреляционной таблицы. Восполь­зуемся тождествами:

^х = пх (следствие из ~х = 2х/п); ^у^пу (следствие из у = 2 х2 = пх2 (следствие из х2 =

УихУ =22ХУ чтен°. что пара чисел (х, у) наблюда­лась пху раз).

Подставив правые части тождеств в систему (*) и со­кратив обе части второго уравнения на п, получим

1 ^

(x)PyX+b=y.

Решив эту систему, найдем параметры рух иди, следо­вательно, искомое уравнение

Однако более целесообразно, введя новую величину — вЫборочный коэффициент корреляции, написать уравне-Ние регрессии в ином виде. Сделаем это. Найдем b из °рого уравнения (**•):

259

Подставив правую часть этого равенства в уравнение Ух — 9ух х + Ь, получим

Ух—У Рух (x—lc). (***)

Найдем *> из системы (*) коэффициент регрессии, учи-тывая, что ** — (x)* = al (см. гл. XVI, § 10):

У множим обе части равенства на. дробь оху\

рух-^= ~—=^= . (**##)

" Оу пахау '

Обозначим правую часть равенства через гв и назовем ее выборочным коэффициентом корреляции (см. замечание 3):

п ахоу Подставим re в (****):

Отсюда

Рух=аГв=--

Подставив правую часть этого равенства в (***), оконча­тельно получим выборочное уравнение прямой линии регрессии Y на X вида

вах

Замечание 1. Аналогично находят выборочное уравнение прямой линии регрессии X на Y вида

х~у—~х = г3а~(у— у), a

где

* > В этой- главе выборочное среднее квЦдратическое отклонение обозначено через а; например, ох — выборочное) среднее квадратиче-ское отклонение X.

260

Замечание 2. Уравнения выборочных прямых регрессии 0 записать в более симметричной форме:

Ух — У_ Х—Х Ху — Х у —у

*• — '"в """^ » — ''в — • оу ах ах оу

Замечание 3. Выборочный коэффициент корреляции является нКОй коэффициента корреляции

°" г= Vxv ==M(XY)-M(X).M(Y)

ОхОу ОхОу

Действительно, используя метод моментов (см. гл. XVI, § 21), е, заменив числовые характеристики их оценками, получим

_ [(]£ пхуху)/п\ — ху 2] пхуху пху охоу пахау