Рассчитаем следующие показатели. Средняя из внутригрупповых дисперсий:
|
|
|
|
2 = σ12 n1 +σ22 n2 = 42 5 + 213,2 5 |
=136,6 ; |
||||||||||||||||
σ |
|
|
|||||||||||||||||||
|
|
|
|
|
|
n1 + n2 |
|
10 |
|
|
|
|
|
|
|||||||
межгрупповая дисперсия: |
|
|
|
||||||||||||||||||
|
|
|
|
∑( |
|
j − |
|
)2 nj |
|
( |
|
1 − |
|
)n1 +( |
|
2 − |
|
|
|
||
|
|
|
|
x |
x |
|
|
|
|
|
)n2 |
|
|||||||||
δ |
2 |
= |
= |
x |
x |
x |
x |
; |
|||||||||||||
|
|
∑nj |
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
n1 + n2 |
|
|
|||||||||||||
δ |
2 = |
(95 −88)2 5 +(81−88)2 5 = 245 + 245 |
= 49,0. |
||||||||||||||||||
|
|
|
|
|
10 |
|
10 |
|
|
|
Проверимвыполнение правиласложения дисперсий:
δ2 +σ 2 = 49,0 +136,6 =185,6 =σ2 .
Находим эмпирическое корреляционное отношение:
η = |
|
49,0 |
= 0,514,т.е. связь между признаками умеренная. |
|
185,6 |
||||
|
|
Коэффициент детерминации η²= 0,264, т.е. фактор технического обучения, объясняет в данном примере 26,4% вариации производительности труда рабочих, а неучтенные факторы - 73,6 %.
Пример 8. Имеются следующие данные о времени простоя автомобиля под разгрузкой:
Таблица 8.1
№ пункта разгрузки |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
6 |
10 |
Число грузчиков |
3 |
4 |
4 |
3 |
3 |
4 |
4 |
4 |
3 |
4 |
Время простоя, мин |
12 |
10 |
8 |
15 |
19 |
12 |
8 |
10 |
18 |
8 |
Проверить закон сложения дисперсий.
Решение.
В этой задаче варьирующим признаком является время простоя автомобиля под разгрузкой. Общая дисперсия времени простоя под разгрузкой определяется по формуле:
σ2 = ∑(xi − x)2 fi
∑fi
Для расчета общей дисперсии составим дискретный ряд распределения, промежуточные расчеты поместим в таблицу 8.2.
Таблица 8.2 - Вспомогательная таблица для расчета общей дисперсии
Время простоя под |
Число выполненных |
x |
|
f |
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
2 |
|
i |
x |
|
− x |
|
(x |
|
|
|
(x |
|
− x |
|
f |
||||||||
разгрузкой, мин, |
|
|
i |
i |
|
i |
− x ) |
i |
0 |
) |
|||||||||||
разгрузок, fi |
|
|
|
|
0 |
|
|
0 |
|
|
|
|
|
i |
|||||||
xi |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
16 |
|
|
|
|
|
|
|
|
||
8 |
3 |
|
24 |
|
|
-4 |
|
|
|
|
|
|
|
48 |
|
|
|||||
10 |
2 |
|
20 |
|
|
-2 |
|
|
|
|
4 |
|
|
|
|
8 |
|
|
|||
12 |
2 |
|
24 |
|
|
0 |
|
|
|
|
0 |
|
|
|
|
0 |
|
|
|||
15 |
1 |
|
15 |
|
|
3 |
|
|
|
|
9 |
|
|
|
|
9 |
|
|
|||
18 |
1 |
|
18 |
|
|
6 |
|
|
|
|
36 |
|
|
|
36 |
|
|
||||
19 |
1 |
|
19 |
|
|
7 |
|
|
|
|
49 |
|
|
|
49 |
|
|
||||
Итого: |
10 |
120 |
|
|
- |
|
|
|
|
- |
|
|
|
|
150 |
|
|
29
x = ∑xi fi = 120 =12(мин.) – среднее время простоя;
∑fi 10
σ2 = ∑(xi − x )2 fi = 150 =15 - общая дисперсия.
∑fi 10
Величина этой дисперсии характеризует вариацию времени простоя под разгрузкойподвлияниемвсехусловий.
Различия в величине изучаемого признака прежде всего возникают под влиянием числа грузчиков, принимающих участие в процессе разгрузки. В связи с этим в совокупности выделяются две однородные группы по числу грузчиков: в первую группу включаются наблюдения при числе грузчиков 3; во вторую группу попадают наблюдения при числе грузчиков 4. Для каждой из выделенных групп определяется внутригрупповая дисперсия, возникающая под влиянием неучтенных факторов. Дляихрасчета используемвспомогательные таблицы 8.3 и 8.4.
Таблица 8.3 - Расчет внутригрупповой дисперсии по первой группе (число грузчиков, участвующих в группе – 3).
Время простоя под раз- |
Число выполненных раз- |
xi fi |
x |
|
− |
|
|
(x |
|
− |
|
)2 |
f |
i |
x |
i |
x |
||||||||||
грузкой, мин, xi |
грузок, fi |
|
|
1 |
|
1 |
i |
||||||
|
|
|
|
|
|
|
|
|
|
|
|
||
12 |
1 |
12 |
|
|
-4 |
|
|
|
|
16 |
|
|
|
15 |
1 |
15 |
|
|
-1 |
|
|
|
|
1 |
|
|
|
18 |
1 |
18 |
|
|
2 |
|
|
|
|
4 |
|
|
|
19 |
1 |
19 |
|
|
3 |
|
|
|
|
9 |
|
|
|
Итого: |
4 |
64 |
|
|
- |
|
|
|
|
30 |
|
|
x1 = 644 = 16(мин.) ; σ12 = 304 = 7,5.
Таблица 8.4 - Расчет внутригрупповой дисперсии по второй группе (число грузчиков, участвующих в группе – 4)
Время простоя под раз- |
Число выполненных раз- |
xi fi |
x |
|
− |
|
|
|
(x |
|
− |
|
|
)2 |
f |
|||||
i |
x |
2 |
i |
x |
2 |
|||||||||||||||
грузкой, мин, xi |
грузок, fi |
|
|
|
|
|
|
|
|
|
|
i |
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
8 |
|
3 |
|
24 |
|
-1,33 |
|
|
|
|
5,31 |
|
|||||
|
|
|
10 |
|
2 |
|
20 |
|
|
0,67 |
|
|
|
|
0,90 |
|
||||
|
|
|
12 |
|
1 |
|
12 |
|
|
2,67 |
|
|
|
|
7,13 |
|
||||
|
|
|
Итого: |
|
6 |
|
56 |
|
|
- |
|
|
|
|
|
13,34 |
|
|||
|
|
2 |
= 56 |
= 9,33(мин.); σ22 = 13,34 |
= 2,22. |
|
|
|
|
|
|
|
|
|
|
|
|
|
||
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
6 |
|
6 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Средняя из внутригрупповых дисперсий
σ2 = ∑σi 2 fi = 7,5 4 + 2,22 6 = 4,33 .
∑fi 10
Межгрупповая дисперсия, отражающая различия в величине признака под влиянием фактора, положенного в основу группировки, определяется по формуле:
δ2 = ∑(xi − x)2fi = (16 −12)2 4 +(9,33 −12)2 6 =10,68 .
∑fi 10
30
Общая дисперсия (σ2 ) равна сумме средней внутригрупповой дисперсии
и межгрупповой дисперсии, т.е. σ 2 = σ 2 +δ 2 , тогда σ2 = 4,3 +10,68 =14,98 , что и соответствует полученной ранее величине.
Пример 9. В результате выборочного наблюдения предполагаемой зависимости между прожиточным минимумом (признак X ) и заработной платой
(признакY ) получены следующие данные:
Таблица 9.1
X , ден. ед. |
0,49 |
0,46 |
0,52 |
0,38 |
0,33 |
Y , ден.ед. |
1,08 |
1,04 |
1,49 |
0,97 |
0,90 |
|
Полагая, что зависимость междуX и Y линейная, определить:
1) параметры регрессии; 2) оценить тесноту связи между признаками, используя линейный коэффициент корреляции; 3) оценить меру достоверно-
сти полученного уравнения. |
|
||||
Решение. |
|
|
|
= a x +a . Параметры регрессии определим методом |
|
1. Полагаем, |
что |
|
|
||
y |
x |
||||
|
|
|
1 |
0 |
|
наименьших квадратов (МНК) из системы уравнений |
|||||
a1∑xi 2 +a0 |
∑xi =∑xi yi , |
|
|||
|
|
|
|
|
|
a1∑xi +a0n = ∑yi ; |
|
Для удобства занесем расчеты в таблицу.
|
|
|
|
Таблица 9.2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
№ |
xi |
|
yi |
|
xi yi |
|
x 2 |
yi 2 |
(x |
|
− |
|
)2 |
(y |
|
− |
|
)2 |
|
|
|
(y |
|
− |
|
|
) |
||
|
|
|
|
y |
|
|
||||||||||||||||||||||||
i |
x |
i |
y |
|
x |
i |
y |
x |
||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
1 |
|
0,49 |
|
1,08 |
|
0,5292 |
|
0,2401 |
1,1664 |
0,0029 |
|
|
0,0003 |
|
|
1,2264 |
0,0214 |
|
|
|
||||||||||
2 |
|
0,46 |
|
1,04 |
|
0,4784 |
|
0,2116 |
1,0816 |
0,0006 |
|
|
0,0031 |
|
|
1,1556 |
0,0134 |
|
|
|
||||||||||
3 |
|
0,52 |
|
1,49 |
|
0,7748 |
|
0,2704 |
2,2201 |
0,0071 |
|
|
0,1552 |
|
|
1,2972 |
0,0265 |
|
|
|
||||||||||
4 |
|
0,38 |
|
0,97 |
|
0,3686 |
|
0,1444 |
0,9409 |
0,0031 |
|
|
0,0159 |
|
|
0,9668 |
0,00001 |
|
|
|||||||||||
5 |
|
0,33 |
|
0,90 |
|
0,2970 |
|
0,1089 |
0,8100 |
0,0112 |
|
|
0,0384 |
|
|
0,8488 |
0,0026 |
|
|
|
||||||||||
|
|
|
|
2,18 |
|
5,48 |
|
2,448 |
|
0,9754 |
6,2190 |
0,0249 |
|
|
0,2129 |
|
|
5,4948 |
0,0639 |
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
В нашем случае получим систему |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
0,9754a1 + 2,18a0 = 2,448, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
+5a0 = 5,48; |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
2,18a1 |
|
0,0114a1 = 0,0269, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
0,4474a1 +a0 =1,1229, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
=>a1 = 2,36, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
0,436a1 +a0 = |
1,096; |
|
a0 =1,096 −0,436 2,36 = 0,067 ≈ 0,07. |
|
|
|
|
|
|
|||||||||||||||||||||
|
|
|
= 2,36x + 0,07 |
|
|
|
|
|
|
|
||||||||||||||||||||
|
y |
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
a1 = 2,36 > 0 значит, связь между признаками прямая.
31
Полученное значение коэффициента регрессии показывает, что при увеличении прожиточного минимума на 1 ден. ед., заработная плата в среднем увеличивается на 2,36 ден. ед.
2. Оценим тесноту связи.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
∑ |
|
|
|
|
|
|
|
|
|
Рассчитаем линейный коэффициент корреляции: r |
= |
xi yi −nx |
y |
|
, |
|||||||||||||||||||||
|
|
|
|
nσxσy |
|
||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
∑(xi |
|
|
|
|
|
|
|
|||||
|
|
|
|
|
∑xi |
|
|
|
= ∑yi |
|
− |
|
)2 |
|
|
|
|
|
|
|
|
||||||||
где |
|
|
= |
; |
|
|
|
; σx = σx2 = |
x |
, |
|
|
|
|
|
|
|
||||||||||||
x |
y |
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||
|
|
|
|
|
|
n |
∑ |
|
|
n |
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
(yi − |
|
)2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
σ |
|
= σ |
2 = |
|
y |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
y |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
y |
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
= 0,436 ; |
|
=1,096 ; σx = |
0,005 = 0,071; |
σy = |
0,0426 = 0,206. |
|
|
|
|
|
|||||||||||||||||
x |
y |
|
|
|
|
|
|||||||||||||||||||||||
r |
= |
2,448 −5 0,436 1,096 |
= 0,803 ≈ 0,8 . |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
5 0,071 0,206 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
Можно также использовать связь между линейным коэффициентом кор- |
|||||||||||||||||||||||||
реляции и коэффициентом регрессии: r = a |
σx . В нашем случае |
|
|
||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
σ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
= 2,36 0,071 |
|
|
|
|
|
|
|
|
y |
|
|
|
|
|
|
|
|
|
|
|
|||||||
r |
= 0,813 ≈ 0,8 . |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||
|
|
|
|
|
|
0,206 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Т.к. r >0, то связь между признаками прямая, величина коэффициента корреляции говорит о тесной связи между признаками.
3.Оценим меру достоверности полученного уравнения, для этого рассчитаем среднюю квадратическую ошибку уравнения регрессии:
S = ∑ (yi − yx )2 ,
e |
n −m |
|
где yi - наблюдаемые значение признака y , yx -теоретические значения признака,
n – объем выборки, m – число параметров регрессии.
Например, y1 = 2,36 0,49 +0,07 =1,2264. Аналогично находим другие yx .
S = |
0,0639 = |
0,0213 = 0,146 . |
||||
|
|
e |
5 −2 |
|
||
|
|
|
|
|
|
|
Используем соотношение |
||||||
|
Se |
100% = 0,146 |
100% = 13,32% < 15% |
|||
|
|
|
|
|||
|
|
y |
1,096 |
|
Значит, уравнение yx = 2,36x + 0,07 достаточно хорошо отображает
взаимосвязь рассматриваемых признаков и может быть использовано в практической работе, т.е. при прогнозировании.
32