
Кратная регрессия
Команда |
Победы |
Забитые мячи |
Очки |
Зенит |
20 |
61 |
68 |
ЦСКА |
18 |
51 |
62 |
Рубин |
15 |
37 |
58 |
Спартак |
13 |
43 |
49 |
Локомотив |
13 |
34 |
48 |
Спартак-нальчик |
12 |
40 |
44 |
Динамо |
9 |
38 |
40 |
Томь |
10 |
35 |
37 |
Ростов |
10 |
27 |
34 |
Сатурн |
8 |
27 |
34 |
анжи |
9 |
29 |
33 |
терек |
8 |
28 |
33 |
Крылья Советов |
7 |
28 |
31 |
Амкар |
8 |
24 |
30 |
алания |
7 |
24 |
30 |
Сибирь |
4 |
34 |
20 |
Коэффициенты кратной регрессии
0,3 0,01 - 2,3
Z = 2,3 + 0,01*х- 0,3*у
StatGraph
Multiple Regression Analysis
-----------------------------------------------------------------------------
Dependent variable: Col_1
-----------------------------------------------------------------------------
Standard T
Parameter Estimate Error Statistic P-Value
-----------------------------------------------------------------------------
CONSTANT -2,37545 0,753731 -3,15158 0,0076
Col_2 0,0164223 0,0384726 0,426856 0,6765
Col_3 0,306929 0,0295782 10,3769 0,0000
-----------------------------------------------------------------------------
Analysis of Variance
-----------------------------------------------------------------------------
Source Sum of Squares Df Mean Square F-Ratio P-Value
-----------------------------------------------------------------------------
Model 262,898 2 131,449 200,11 0,0000
Residual 8,53937 13 0,656874
-----------------------------------------------------------------------------
Total (Corr.) 271,438 15
R-squared = 96,854 percent
R-squared (adjusted for d.f.) = 96,37 percent
Standard Error of Est. = 0,810478
Mean absolute error = 0,599225
The StatAdvisor
---------------
В выводе отображены результаты выбранной линейной модели для отношения между Col_2 и Col_1. Уравнение выбранной модели:
Col_1 = -2,37545 + 0,0164223*Col_2 + 0,306929*Col_3
R-Squared статистика показывает что линейная модель объясняет 96,854% данных в Col_1. Коэффициент корреляции равен 0,94 и показывает относительно сильную зависимость между величинами. Стандартная ошибка оценки демонстрирует, что стандартное отклонение остатков равно 17,34. Это значение может быть использовано для формирования предполагаемых интервалов новых наблюдений.
Наивысшее значение P-value – 0,6765 в колонке 2. Так как P-value больше чем 0,1 стоит подумать не убрать ли колонку 2 из модели.
Unusual Residuals
--------------------------------------------------------------
Predicted Studentized
Row Y Y Residual Residual
--------------------------------------------------------------
7 9,0 10,5258 -1,52575 -2,26
9 10,0 8,50354 1,49646 2,24
--------------------------------------------------------------
Таблица необычных остатков демонстрирует все наблюдения, у которых «стьюдентизированные» остатки превышают 2. «Стьюдентизированные» остатки показывают на сколько стандартных отклонений каждое значение колонки 1, отклоняется от выбранной модели, используя все данные кроме значения, приведённого выше. В данном случае 2 значения, лежащих в интервале от 2.0 до 3.0. Следует обратить внимание, не стоит ли убрать это значение из таблицы данных, т.к. подобные значения могут противоречить данным выборки.
Influential Points
------------------------------------------------
Mahalanobis
Row Leverage Distance DFITS
------------------------------------------------
1 0,503443 13,2608 0,877764
3 0,369488 7,27084 -1,32008
------------------------------------------------
Average leverage of single data point = 0,1875
The StatAdvisor
В данном случае 2 точки с необычно большим значением DFITS.
DFITS - это статистика, которая показывает как изменятся измеренные коэффициенты если убрать измерение из выборки.