Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
СПСС.docx
Скачиваний:
2
Добавлен:
01.03.2025
Размер:
374.18 Кб
Скачать

3 Табличка

В этой табличке мы видим Sig. – уровень значимости (по критерию Фишера), а это значит, что мы выдвигаем гипотезу. Она звучит так: Но: R2=0 (наша модель ничего не объясняет). Уровень значимости по критерию F (Фишера) меньше 0,05, а значит мы отвергаем гипотезу Н0 и принимаем альтернативную гипотезу Н1 – наша модель действительно что-то объясняет (собственно мы просто подтвердили, проверили данные из прошлой таблички). Если тут у вас уровень значимости больше 0,05 то лучше попробовать взять другие переменные, потому что на практике ваша модель ничего не объясняет.

Теперь чуть-чуть о начале таблички.

Regression – регрессионная модель.

Residual – остатки.

Total – сумма (что-то вроде дисперсии для цены машины).

Сумма раскладывается на то, что мы объясняем регрессионной моделью (или прямой, которую мы проводили на графике, если кто помнит) и на остатки (Residual). Из второго столбика таблицы (Sum of Squares) еще раз видно, но в неудобной форме, что больше половины (23415,552) мы объясняем регрессионной моделью и чуть меньшая половина (7897,364) – это остатки.

ANOVAa

Model

Sum of Squares

df

Mean Square

F

Sig.

1

Regression

23415,552

4

5853,888

108,222

,000b

Residual

7897,364

146

54,092

Total

31312,916

150

a. Dependent Variable: Цена

b. Predictors: (Constant), Колесная база, Мощность, Длина, Объем двигателя

4 Табличка

С помощью этой таблички мы можем построить уравнение, которое описывает нашу прямую. Общий вид формулы такой: f(x)=y=b0+b1*x1+b2*x2+bn*xn+u. (+u мы опускаем).

Нас интересует столбик нестандартизированных коэффициентов, а точнее столбик В.

Просьба всей нижеследующей странице не пугаться. Алгоритм простой: смотрите в столбик B, и в столбик Sig. Если уровень значимости по критерию t меньше 0,05, то эту переменную мы в формулу вносим. Для константы уровень значимости не важен.

И еще важный момент – все х идут с порядковым номером (справа внизу). Они не завязаны на конкретную переменную. То есть предположим что вы берете только вторую и четвертую переменную, тогда у первой переменной будет х1, а у второй х2.

Из такой простой, казалось бы, вещи можно много чего наговорить:

Constant – b0 – в данном случае оно принимает значение 13,703. Это можно понять так: если бы все х (объем двигателя, колесная база, мощность, длина) не влияли (были равны 0) на у (цену автомобиля), то его цена была бы равна 13,703 (в тысячах). На самом деле это не совсем так. Это скорее точка пересечения нашей прямой с осью ОУ.

Объем двигателя - b1 – в данном случае принимает значение -2,303. Эту величину можно понять так: на 8,560 тысяч долларов уменьшается цена автомобиля с каждым новым литром объема двигателя (простите за корявый русский).

Мощность – b2 – в данном случае принимает значение 0,265. Эту величину можно понять так: на 265 долларов увеличивается цена автомобиля с увеличением мощности на одну единицу измерения.

Длина – b3 – в данном случае принимает значение -0,238. Эту величину можно понять так: на 238 долларов уменьшается цена автомобиля с каждым новым сантиметром.

Колесная база – b4 – в данном случае принимает значение 0,151. Эту величину можно понять так: на 151 доллар увеличивается цена автомобиля с каждым новой единицей измерения.

Подводный камень тут в уровне значимости (Sig.) по критерию t.

Выдвигаем гипотезу Ho: b0=0. Уровень значимости по критерию t больше 0,05, а значит мы вынуждены принять гипотезу Ho, а значит b0=0.

По поводу последних двух строчек что-то я опять таки не очень уверена, но это логично как минимум.

Такую же гипотезу мы выдвигаем относительно b1. H0: b1=0. Тут уровень значимости по критерию t чуть больше 0,05. По идее мы должны принять Ho, но 0,052 это почти то же самое, что 0,05, поэтому смотрите сами. Можно как принять, так и отклонить Ho. Я приняла решение принять альтернативную гипотезу H1, а значит b1≠0, а значит, объем двигателя влияет на цену автомобиля.

Такую же гипотезу мы выдвигаем относительно b2. H0: b2=0. Тут уровень значимости по критерию t меньше 0,05, а значит мы принимаем альтернативную гипотезу H1, а значит b2≠0, а значит мощность влияет на цену автомобиля.

Такую же гипотезу мы выдвигаем относительно b3. H0: b3=0. Тут уровень значимости по критерию t меньше 0,05, а значит мы принимаем альтернативную гипотезу H1, а значит b3≠0, а значит длина машины влияет на цену автомобиля и все то, что написано сверху имеет смысл.

Такую же гипотезу мы выдвигаем относительно b4. H0: b4=0. Тут уровень значимости по критерию t значительно больше 0,05, а значит мы принимаем Ho, а значит b4=0, а значит колесная база не влияет на цену автомобиля.

В итоге формула принимает следующий вид: f(x)=y=13,703-2,303x1+0,265х2-0,238х3.

И дальше на самом деле мы можем даже строить прогнозы относительно цены автомобиля в зависимости от объема двигателя, его мощности и длины. Например, вместо х1 (а это у нас объем двигателя) мы можем подставить 1,8; вместо х2 (а это у нас мощность) мы можем подставить 200; вместо х3 (а это у нас длина) мы можем подставить 190. Мы можем подсчитать, что при таком объеме двигателя, мощности и длине машина будет стоить 16,633 тысячи долларов. Но тут уместно вспомнить о том, что у нас есть еще остатки (u), то есть какие-то еще факторы, которые влияют на стоимость автомобиля, поэтому с уверенностью сказать, что любая машина с двигателем 1,8 литров, мощностью 220 л.с. и длиной 190 см будет стоить 17,337 тысячи долларов, мы не можем.

Еще надо обратить внимание на 3 столбик – стандартизированный коэффициент Бета. Он принимает значения от -1 до 1 (может заезжать как в большую сторону, так и в меньшую). Он показывает, какая переменная оказывает большее влияние на зависимую переменную (то есть что больше влияет на цену автомобиля). Чем ближе к -1 или 1, тем сильнее влияние. В нашем случае мощность оказывает наибольшее влияние на цену машины, на втором месте идет длина и на 3 – объем двигателя. Колесную базу мы вообще не рассматриваем, так как она не прошла уровень значимости.

Coefficientsa

Model

Unstandardized Coefficients

Standardized Coefficients

t

Sig.

B

Std. Error

Beta

1

(Constant)

13,703

9,778

1,401

,163

Объем двигателя

-2,303

1,176

-,167

-1,958

,052

Мощность

,265

,020

1,042

13,362

,000

Длина

-,238

,086

-,222

-2,758

,007

Колесная база

,151

,146

,081

1,036

,302

a. Dependent Variable: Цена

Существует еще метод Stepwise (он строит несколько моделей, сначала с одной переменной (которая оказывает наибольшее влияние), потом с двумя переменными, потом с тремя и тд). Переменные, которые не влияют на зависимую переменную, (не проходят по уровню значимости по критерию t) не будут включены ни в одну модель.