Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Гмурман.doc
Скачиваний:
9
Добавлен:
01.03.2025
Размер:
4.92 Mб
Скачать

§ 9. Пример на отыскание выборочного уравнения прямой линии регрессии

Теперь, когда известно, как вычисляют гв, уме­стно привести пример на отыскание уравнения прямой линии регрессии.

„ Поскольку при нахождении гв уже вычислены и, vt °«» ov, то целесообразно пользоваться формулами:

сохранены обозначения предыдущего параграфа. оменд>ем читателю самостоятельно вывести эти фор-мУлы.

267

Пример. Найти выборочное уравнение прямой линии регрессу У на X по данным корреляционной табл. 14 примера предыдуще3 параграфа.

Решение. Напишем искомое уравнение в общем виде:

Коэффициент корреляции уже вычислен в предыдущем параграф» Остается найти х, у, ох и оу

п = —0,425-10 + 40 = 35,75{ Н

= 0,09.10 + 35 = 35,9; Ъхак1= 1,106.10= 11,06; Ъу =ovh2= 1,209-10= 12,09. Подставив найденные величины в (*), получим искомое уравнение

12 04 ^-35,9 = 0.603 j£gg (*-35,75),

или окончательно

Рх = 0,659х+12,34.

Сравним условные средние, вычисленные: а) по этому уравнению; б) по данным корреляционной табл. 14. Например, при л: = 30:

а) Узо = 0,659-30+ 12,34 = 32,11;

б) Узо= (23-25 + 30-35+ 10-45)/63 = 32,94.

Как видим, согласование расчетного и наблюдаемого условных средних — удовлетворительное.

§ 10. Предварительные соображения к введению меры любой корреляционной связи

Выше рассматривалась оценка тесноты линейной корреляционной связи. Как оценить тесноту любой корреляционной связи?

Пусть данные наблюдений над количественными при­знаками X и Y сведены в корреляционную таблицу. Можно считать, что тем самым наблюдаемые значения У раз' биты на группы; каждая группа содержит те значения Y< которые соответствуют определенному значению X. На­пример, дана корреляционная табл. 17.

К первой группе относятся те 10 значений Y (4 раза наблюдалось #х = 3 и 6 раз t/2=j3k которые соответст­ вуют ^ = 8. ^^Л

Ко второй группе относятся те 20 значений Y (13 Ра наблюдалось уг = 3 и7 раз ул = 5), которые соответству10 х2 = 9.

268

Таблица 17

Y

X

3

9

3

4

13

5

6

7

10

20

Ух

4,2

3,7

Условные средние теперь можно назвать групповыми средними: групповая средняя первой группы % = = (4-3 + 6-5)/10 = 4,2; групповая средняя второй группы Р 75) 37

Р,( + )/ ,

Поскольку все значения признака У разбиты на груп­пы, можно представить общую дисперсию признака в виде суммы внутригрупповой и межгрупповой дисперсий (см. гл. XVI, § 12):

межгр-

Покажем справедливость следующих утверждений:

1) если У связан с X функциональной зависимостью,

то

ТО

2) если У связан с X корреляционной зависимостью,

Доказательство. 1) Если У связан с X функ­циональной зависимостью, то определенному зна­чению X соответствует одно значение У. В этом случае в каждой группе содержатся равные между собой значе­ния У *\ поэтому групповая дисперсия каждой группы Равна нулю. Следовательно, средняя арифметическая

* ' Например, если значению ^ = 3 соответствует «/1=7, причем 1 = 3 наблюдалось 5 раз, то в группе содержится 5значений у17.

269

)

общ 'межгр

Отсюда

групповых дисперсий (взвешенная по объемам групп), т. внутригрупповая дисперсия DBHrp = 0 и равенство (* имеет вид

Г) Г)

*^общ — '-'м

2) Если Y связан с X корреляционной зав и-симостью, то определенному значениюXсоответствуют вообще говоря, различные значения Y (образующие груц| пу). В этом случае групповая дисперсия каждой группы отлична от нуля. Следовательно, средняя арифметическая групповых дисперсий (взвешенная по объемам групп) Атгр*5^0- Тогда одно положительное слагаемое DKew меньше суммы двух положительных слагаемых D 2

+ D Г)

^межгр -^о

р *■>.

Отсюда

Уже из приведенных рассуждений видно, что чем связь между признаками ближе к функциональной, тем меньше Ашгр и» следовательно, тем больше приближается Д,ежп) к Dotm, а значит, отношение DMewv/Do6uiк единице. Отсюда ясно, что целесообразно рассматривать в качестве меры тесноты корреляционной зависимости отношение межгрупповой дисперсии к общей, или, что то же, отно­шение межгруппового среднего квадратического отклоне­ния к общему среднему квадратическому отклонению.