Вариант 3. (Множественная регрессия)
Изучается зависимость времени, затрачиваемого на обслуживание одного покупателя от стоимости покупок.
№ |
Время обслуживания, мин |
Количество покупок, шт |
Стоимость покупок, долл |
Разряд продавца |
1. |
3,0 |
5 |
36 |
5 |
2. |
1,3 |
2 |
13 |
5 |
3. |
7,4 |
8 |
81 |
6 |
4. |
5,9 |
7 |
78 |
3 |
5. |
8,4 |
10 |
103 |
4 |
6. |
5,0 |
8 |
64 |
5 |
7. |
8,1 |
15 |
67 |
6 |
8. |
1,9 |
5 |
25 |
3 |
9. |
6,2 |
14 |
55 |
5 |
10. |
3,8 |
8 |
45 |
5 |
11. |
4,7 |
10 |
54 |
4 |
12. |
5,2 |
6 |
58 |
6 |
13. |
6,3 |
7 |
72 |
3 |
14. |
6,0 |
7 |
70 |
3 |
15. |
4,2 |
12 |
51 |
6 |
16. |
3,6 |
7 |
40 |
6 |
1.Выберите признак-результат и признаки факторы. Выбор обоснуйте.
2.Проверьте признаки-факторы на коллинеарность.
3.Постройте модель только с информативными факторами и оцените ее параметры.
4.Рассчитайте показатели множественной корреляции и детерминации сделайте выводы.
5.Дайте сравнительную оценку силы связи факторов с результатом с помощью средних коэффициентов эластичности.
Решение:
-
В задаче выше рассматривалась парная линейная регрессия зависимости стоимости покупки от времени обслуживания. Продолжая аналогичные размышления предположим, что стоимость покупок (Y) зависит не только от времени обслуживания (X1), но и от количества покупок (X2) и от разряда продавца (X3).
Стоимость покупок, долл |
Время обслуживания, мин |
Количество покупок, шт |
Разряд продавца |
Y |
X1 |
X2 |
X3 |
36 |
3,0 |
5 |
5 |
13 |
1,3 |
2 |
5 |
81 |
7,4 |
8 |
6 |
78 |
5,9 |
7 |
3 |
103 |
8,4 |
10 |
4 |
64 |
5,0 |
8 |
5 |
67 |
8,1 |
15 |
6 |
25 |
1,9 |
5 |
3 |
55 |
6,2 |
14 |
5 |
45 |
3,8 |
8 |
5 |
54 |
4,7 |
10 |
4 |
58 |
5,2 |
6 |
6 |
72 |
6,3 |
7 |
3 |
70 |
6,0 |
7 |
3 |
51 |
4,2 |
12 |
6 |
40 |
3,6 |
7 |
6 |
2) Проверка наличия коллинеарности или мультиколлинеарности. Отбор неколлинеарных факторов. Построим корреляционную матрицу, используя функцию «Данные. Анализ данных. Корреляция» табличного процессора MS Excel.
|
Y |
X1 |
X2 |
X3 |
Y |
1 |
|
|
|
X1 |
0,928361 |
1 |
|
|
X2 |
0,448409 |
0,645281 |
1 |
|
X3 |
-0,16146 |
0,013915 |
0,280207 |
1 |
Из матрицы следует, что наблюдается коллинеарность между факторами х1 и х2 , так как rх1 х2 = 0,645. Для дальнейшего рассмотрения оставляем фактор х2, так как он меньше коррелирует с фактором х3 ( rх2 х3 = 0,280 > r х1 х3 = 0,0.139 ). Таким образом, далее будет строиться регрессия У на факторы х1 и х2.
3) Для построения уравнения линейной регрессии используем функцию «Данные. Анализ данных. Регрессия». Задав соответствующие диапазоны данных в окне, получим набор таблиц 1-3.
Результат:
Из табл. 3 следует, что уравнение регрессии имеет вид
у = 10,487 + 11,967*x1 – 1,719*x2.
С ростом времени обслуживания на 1 минуту стоимость покупок увеличивается в среднем на 11,967 долл. при устранении влияния всех прочих факторов.
С ростом количества покупок на 1 шт стоимость покупок уменьшается в среднем на 1,719 долл. при устранении влияния всех прочих факторов.
4) Коэффициент множественной корреляции определяется из табл. 1
R = 0,949. – связь тесная. Коэффициент множественной детерминации равен квадрату множественного коэффициента корреляции. R2=0,9, коэффициент детерминации показывает, что 90% вариации результата обусловлено вариацией включенных в модель факторов.
5)Коэффициенты эластичности:
(показывает, что с ростом времени обслуживания на 1 мин. и неизменном влиянии всех других факторов, стоимость покупок вырастет в среднем на 1,063%. )
(показывает, что с ростом количества покупок на 1 единицу и неизменном влиянии всех других факторов, прибыль уменьшается на 0,247%.
Фактор х1 сильнее влияет на результат чем фактор х2.