Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Задача 3.doc
Скачиваний:
927
Добавлен:
01.04.2015
Размер:
3.24 Mб
Скачать

§ 9. Пример на отыскание выборочного уравнения прямой линии регрессии

Теперь, когда известно, как вычисляют rв, уместно привести пример на отыскание уравнения прямой линии регрессии.

Поскольку при нахождении rв уже вычислены , ,,, то целесообразно пользоваться формулами:

=h1,=h2, =h1+c1, =h2+c2.

Здесь сохранены обозначения предыдущего параграфа. Рекомендуем читателю самостоятельно вывести эти формулы.

Пример. Найти выборочное уравнение прямой линии регрессии Y на Х по данным корреляционной табл. 14 примера предыдущего параграфа.

Решение. Напишем искомое уравнение в общем виде:

(*)

Коэффициент корреляции уже вычислен в предыдущем параграфе. Остается найти , , и:

=h1+c1 = —0,425·10+40==35,75; =h2+c2 = 0,09·10+35=35,9;

=h1== 1,106·10 = 1,106,=h2= 1,209·10=12,09. Подставив найденные величины в (*), получим искомое уравнение

,

или окончательно

= 0,659x + 12,34.

Сравним условные средние, вычисленные: а) по этому уравнению; б) по данным корреляционной табл. 14. Например, при х =30:

а) ==0,659·30+12,34 = 32,11;

б) = (23·25+30·35+10·45)/63 = 32,94.

Как видим, согласование расчетного и наблюдаемого условных средних—удовлетворительное.

§ 10. Предварительные соображения к введению меры любой корреляционной связи

Выше рассматривалась оценка тесноты линейной корреляционной связи. Как оценить тесноту любой корреляционной связи?

Пусть данные наблюдений над количественными признаками Х и Y сведены в корреляционную таблицу. Можно считать, что тем самым наблюдаемые значения Y разбиты на группы; каждая группа содержит те значения Y, которые соответствуют определенному значению X. Например, дана корреляционная табл. 17.

К первой группе относятся те 10 значений Y (4 раза наблюдалось y1=3 и 6 раз y2 = 5), которые соответствуют x1=8.

Ко второй группе относятся те 20 значений Y (13 раз наблюдалось у1 = 3 и 7 раз y2 = 5), которые соответствуют x2 = 9.

Таблица 17

Y

X

3

9

3

4

13

5

6

7

nx

10

20

4,2

3.7

Условные средние теперь можно назвать групповыми средними: групповая средняя первой группы = (4·3+6·5)/10==4,2; групповая средняя второй группы=(13·3+7·5)/20=3,7.

Поскольку все значения признака Y разбиты на группы, можно представить общую дисперсию признака в виде суммы внутригрупповой и межгрупповой дисперсий (см. гл. XVI, § 12):

Dобщ = Dвнгр + Dмежгр. (*)

Покажем справедливость следующих утверждений:

1) если Y связан с Х функциональной зависимостью, то

Dмежгр/Dобщ = 1;

2) если Y связан с X корреляционной зависимостью,

Dмежгр/Dобщ < 1.

Доказательство. 1) Если Y связан с Х функциональной зависимостью, то определенному значению Х соответствует одно значение Y. В этом случае в каждой группе содержатся равные между собой значения Y поэтому групповая дисперсия каждой группы равна нулю. Следовательно, средняя арифметическая групповых дисперсий (взвешенная по объемам групп), т. е. внутригрупповая дисперсия Dвнгр = 0 и равенство (*), имеет вид

Dобщ = Dмежгр.

Отсюда

Dмежгр /Dобщ= 1.

2) Если Y связан с Х корреляционной зависимостью, то определенному значению Х соответствуют, вообще говоря, различные значения Y (образующие группу). В этом случае групповая дисперсия каждой группы отлична от нуля. Следовательно, средняя арифметическая групповых дисперсий (взвешенная по объемам групп) Dвнгр ≠ 0. Тогда одно положительное слагаемое Dмежгр меньше суммы двух положительных слагаемых Dвнгр + Dмежгр = Dобщ.

Dмежгр < Dобщ

Отсюда

Dмежгр /Dобщ< 1

Уже из приведенных рассуждений видно, что чем связь между признаками ближе к функциональной, тем меньше Dвнгр и, следовательно, тем больше приближается Dмежгр к Dобщ, а значит, отношение Dмежгр /Dобщ — к единице. Отсюда ясно, что целесообразно рассматривать в качестве меры тесноты корреляционной зависимости отношение межгрупповой дисперсии к общей, или, что то же, отношение межгруппового среднего квадратического отклонения к общему среднему квадратическому отклонению.