
Задание №7
Имеются следующие данные о работниках предприятия:
Уровень образования |
Уровень производительности труда |
|
|
высокий |
низкий |
Имеют образование по специальности |
117 a |
10 b |
Не имеют образования по специальности |
20 c |
53 d |
Для оценки тесноты связи между уровнем образования и уровнем производительности труда определите коэффициент ассоциации и сделайте выводы.
Решение
Коэффициент ассоциации определяет тесноту взаимосвязи пары признаков, измеренных по альтернативной номинальной шкале и подсчитывается по формуле:
,
(32)
a, b, c, d - значения признаков в клетках матрицы сопряженности <http://hist.ctl.cc.rsu.ru/KM/Lect/MesurIst/Matr2_2.htm> альтернативных признаков.
В таблице с данными расставим буквы как в матрице сопряженности.
=
6001 / 6401 = 0,937.
Если коэффициент имеет положительный знак (+), то связь положительная, и, наоборот, при отрицательном знаке (-) - связь отрицательная.
По абсолютному значению коэффициента (от 0 до 1) оцениваем количественную меру связи:
если
=
0 - корреляция отсутствует (данные факторы
между собой нейтральны);
если 0,09
0,19
- статистическая взаимосвязь очень
слабая;
если 0,2 0,49 - статистическая взаимосвязь слабая;
если 0,5 0,69 - статистическая взаимосвязь средняя;
если 0,70 0,99 - статистическая взаимосвязь сильная.
Т.о., на основании расчетного делается вывод о том, что между исследуемыми признаками существует слабая (средняя, сильная) положительная (отрицательная) связь.
Вывод: Получилось значение =0,937, следовательно, можно говорить, что между уровнем образования и уровнем производительности труда взаимосвязь сильная.
Задание №8
Рассчитайте парный коэффициент корреляции между объемом товарооборота и размером издержек обращения для магазинов №№ 5..10 и 20…29.
Таблица с данными
Номер магазина |
Товарооборот (млн.руб.) |
Издержки обращения (млн.руб.) |
5 |
235 |
24,8 |
6 |
80 |
9,2 |
7 |
113 |
10,9 |
8 |
300 |
30,1 |
9 |
142 |
16,7 |
10 |
280 |
46,8 |
20 |
352 |
40,1 |
21 |
101 |
13,6 |
22 |
148 |
21,6 |
23 |
74 |
9,2 |
24 |
135 |
20,2 |
25 |
320 |
40,0 |
26 |
155 |
22,4 |
27 |
262 |
29,1 |
28 |
138 |
20,6 |
29 |
216 |
28,4 |
Решение
Выразим линейную форму зависимости в виде уравнения регрессии:
(33)
Решить это уравнение
можно при условии, что параметры
и
примут
числовые значения. Их можно найти по
следующей системе нормальных уравнений:
(34)
где х - значения факторного признака, в нашем примере суммы товарооборота;
y - значения результативного признака - издержек обращения;
n
- число парных значений факторного и
результативного признаков = 16. Приступая
к расчетам
,
исходные данные предварительно ранжируем
(располагаем по возрастанию значений
факторного признака - издержек обращения).
Таблица 10. Данные для составления уравнения регрессии
Номер п/п Товарооборот,
млн.руб. (х) Издержки обращения, млн.руб.
(y)
|
|
|
|
|
||
5 |
235 |
24,8 |
55225 |
5828 |
29,117 |
615,04 |
6 |
80 |
9,2 |
6400 |
736 |
11,153 |
84,64 |
7 |
113 |
10,9 |
12769 |
1231,7 |
14,977 |
118,81 |
8 |
300 |
30,1 |
90000 |
9030 |
36,651 |
906,01 |
9 |
142 |
16,7 |
20164 |
2371,4 |
18,338 |
278,89 |
10 |
280 |
46,8 |
78400 |
13104 |
34,333 |
2190,24 |
20 |
352 |
40,1 |
123904 |
14115,2 |
42,677 |
1608,01 |
21 |
101 |
13,6 |
10201 |
1373,6 |
13,586 |
184,96 |
22 |
148 |
21,6 |
21904 |
3196,8 |
19,034 |
466,56 |
23 |
74 |
9,2 |
5476 |
680,8 |
10,457 |
84,64 |
24 |
135 |
20,2 |
18225 |
2727 |
17,527 |
408,04 |
25 |
320 |
40,0 |
102400 |
12800 |
38,969 |
1600 |
26 |
155 |
22,4 |
24025 |
3472 |
19,845 |
501,76 |
27 |
262 |
29,1 |
68644 |
7624,2 |
32,246 |
846,81 |
28 |
138 |
20,6 |
19044 |
2842,8 |
17,875 |
424,36 |
29 |
216 |
28,4 |
46656 |
6134,4 |
26,915 |
806,56 |
Итого |
3051 |
383,7 |
703437 |
87267,9 |
383,7 |
11125,33 |
Итоговые данные граф 2-5 подставляем в систему нормальных уравнений (2):
16
*190,6875
Каждый член первого уравнения умножаем на 190,6875, и из второго вычитаем первое:
,4375 = 14101,10625
Подставим значение в первое уравнение и найдем параметр :
Уравнение регрессии примет вид:
Подставляя в него
значения х, найдем выровненные значения
.
Так, при товарообороте 235 (
)
выровненное значение издержек обращения
составит:
И так далее подставляем все значения товарооборота.
Выровненные значения помещены в таблицу 1 в графу 6. Нужно, чтобы сумма выровненных значений была приблизительно равна сумме фактических значений результативного признака, в нашем случае так и есть.
Приступая ко второму этапу корреляционного анализа, определим коэффициент корреляции по формуле:
.
(35)
Ведя расчеты по ней, пользуемся данными итоговой строки таблицы 10 и определяем:
;
Средние квадратические отклонения по признакам х и y найдем по формулам:
(36)
где
и
-
средние значение по x
и y
мы уже нашли.
Среднюю величину из квадратов переменных х рассчитываем по формуле:
Также найдем среднюю величину из квадратов переменных y:
Следовательно, средние квадратические отклонения будут равны:
Коэффициент корреляции составит:
Для качественной оценки тесноты связи можно воспользоваться таблицей (по шкале Чеддока):
Значение коэффициента корреляции |
0,1 - 0,3 |
0,3 - 0,5 |
0,5 - 0,7 |
0,7 - 0,9 |
0,9 - 0,99 |
Характеристика тесноты связи |
слабая |
умеренная |
заметная |
высокая |
весьма высокая |
Как видно из расчетов, полученный нами коэффициент корреляции, равный 0,939, говорит о сильной связи между товарооборотом и издержками обращения. Следовательно, спрогнозировав товарооборот, можно будет получить и прогнозную сумму издержек обращения.
Ответ: полученный нами коэффициент корреляции, равный 0,939, говорит о сильной связи между товарооборотом и издержками обращения.