- •83 Генеральная и выборочная совокупности. Статистическое распределение выборки. Эмпирическая функция распределения выборки. Полигон и гистограмма частот.
- •82 Независимые случайные величины. Коэффициент корреляции.
- •86. Корреляционная зависимость случайных величин. Уравнения линий регрессии.
- •87. Проверка статистических гипотез. Примеры гипотез.
86. Корреляционная зависимость случайных величин. Уравнения линий регрессии.
Между двумя признаками Х и У может сущ-вать 2 вида зависимости, т.е. изменение значения 1 величины ведут к изменениям в значении другой величины.
1)
Статистическая
зависимость
– изменение значений 1 величины ведут
к изменению статистического распределения
другой величины. 2)
Корреляционная зависимость
– зависимость, при которой изменения
значений 1 величины ведут к изменению
среднего значения другой величины
и
.
Будем рассматривать корреляционную зависимость между Х и У, когда изменение значений Х ведут к изменению среднего значения У, или наоборот.
Пример.
Х – кол-во внесенных удобрений. У –
урожайность с площади земли. Пусть на
участке земли одинаковой площади
вносится одинаковое кол-во удобрений.
При этом урожайность явл-ся различной.
На это могут повлиять случайные факторы
(влажность, температура, расположение
и т.д.), но практика показывает, что
урожайность одна и та же. Данный пример
показывает, что от зн-я 1 величины Х
зависит среднее зн-е случайной величины
У. След-но, корреляционная зависимость.
Любая корреляционная зависимость между
Х и У выраж-ся в виде ур-я линии регрессии.
Линией регрессией У на Х наз-ся ур-е
вида
(1), где
,в
= const.
(2) ур-е регрессии Х на У. Т.к. (1) и (2) должны
быть составлены с помощью экспериментальных
данных, то коэф-тыk
и в должны быть выбраны так, что (
;
)
были максимально приближены к (1) и (2).
Для каждого
на корреляционной пл-ти м-о указать
- экспериментальные и
-
найденное зн-е по ур-ю (1). Тогда необходимо,
чтобы
отсюда
следует по методу наименьших квадратов
необходимо выбрать коэффициентыk
и в так, чтобы
и
.
Последняя сумма зависит от коэф-товk
и в. След-но, ее м-о рассм-вать как ф-ю 2х
переменных
.
Тогда найдем частное произведение по
обеим переменным:
и
. Для того, чтобы найти критические
точки приравниваем частные производные
точки к 0.





(3) Из
(3) необх-о найти коэф-ты k
и в. Метод Крамера:
;
;
,
,
(4) Можно составить ур-е регрессии У на
Х для несгруппированных данных, когда
каждая пара (
;
),(
;
),…,(
;
)
встречается по одному разу
.
Пример. Найти выборочное уравнение линии регрессии У на Х по данным 5 наблюдениям.
|
Х: |
1,00 |
1,50 |
3,00 |
4,50 |
5,00 |
|
У: |
1,25 |
1,40 |
1,50 |
1,75 |
2,25 |
,
n=5.
Для использования формулы (4) рассмотрим
следующую вспомогательную таблицу
|
|
|
|
|
|
1,00 |
1,25 |
1 |
1,25 |
|
1,50 |
1,40 |
2,25 |
2,1 |
|
3,00 |
1,50 |
9 |
4,5 |
|
4,50 |
1,75 |
20,25 |
7,125 |
|
5,00 |
2,25 |
25 |
11,25 |
|
|
|
|
|


.
Для
того, чтобы проверить на сколько
согласуются вычислении ординаты У по
другую с экспериментальными ординатами
,
нужно определить
.
|
|
|
|
|
|
1,00 |
1,25 |
1,226 |
0,24 |
|
1,50 |
1,40 |
1,327 |
0,073 |
|
3,00 |
1,50 |
1,63 |
0,13 |
|
4,50 |
1,75 |
1,939 |
0,183 |
|
5,00 |
2,25 |
2,034 |
0,216 |
Разность
между
и
не всегда стремится к 0. Связано это с
тем, что выборка имеет маленький объем.
Если рассмотреть выборку с большим
объемом, то ур-е линии регрессии б-т
точнее и зн-я
будет намного ближе к экспериментальному
.
Уравнение линии регрессии в случае сгруппированных данных.
Рассмотрим два
генеральных признака Х и У, причем
значения
встречается
раз,
значение
встречается
раз, а каждая пара (
;
)
встречается
раз, т.е. все данные можно показать в
корреляционной таблице.
|
|
|
|
|
… |
|
|
|
|
… | |
|
|
|
|
… | |
|
… |
… |
… |
… | |
|
|
|
|
… | |
Необходимо получить
ур-е (1) в случае сгруппированных данных.
При рассмотрении несгруппированных
данных была получена система (3).
Преобразуем так, чтобы (
;
)
встречалось
раз:
.
Каждое ур-е системы разделим наn:



(2)
Из 2-го ур-я системы выразим в:
и подставим в ур-е линии регрессии:
,
(3) . Выраж-е для коэф-таk
найдем из (2) по методу Крамера.


(4) /*
;
(5). Если рассмотреть правую часть (5), то
она представляет собой формулу коэф-та
корреляции:
,
Отличие коэф-та
корреляции
только в том, что в (5) этот коэф-т нах-ся
по экспериментальным данным, поэтому
явл-ся выборочным коэф-том корреляции
и обозначается как
.
Тогда с учетом нового коэф-та рав-во
(5) примет вид:

.
Подставляяk
в ур-е (3) :
- ур-е линии регрессии сгруппированных
данных. Аналогично можно получить ур-е
линии регрессии Х на У при сгруппированных
данных:
.
Выборочный коэф-т
явл-ся точечной оценкой
,
поэтому обладает такими же св-вами что
и
.
Св-ва
:
1)
;
2) если
,
то признаки Х и У не зависимы; 3) если
,
то Х и У отрицательно коррелированны
(с увел-ем Х уменьш-ся среднее значение
У и наоборот); 4) если
,
то Х и У положительно коррелированны
(с увел-ем Х увеличив-ся среднее значение
У).
Пример. Составить уравнение линии регрессии У на Х.
|
х |
у |
10 |
20 |
30 |
40 | ||||
|
0,4 |
5 |
- |
7 |
14 | |||||
|
0,6 |
- |
2 |
6 |
4 | |||||
|
0,8 |
3 |
19 |
- |
- | |||||
,
,
,
,
,
,
,
,

,
,
.
Ответ:







15
8,15
57,5
26,975















