- •Описательная статистика и подгонка распределений.
- •Классические критерии
- •Оценка значимости корреляции (линейной и монотонной). (Lab03).
- •Линейная модель, функция lm(), (Lab04, Lab05). Зависимая переменная y, независимый переменные скаляр x1 и фактор g1. Построить модель от переменных и их взаимодействий.
- •Дисперсионный анализ (Lab03, Lab04).
- •Развитие линейной модели (Lab05)
- •1.026586 2.009046 1.971255 2.073800 #Получили коэффициенты модели
Оценка значимости корреляции (линейной и монотонной). (Lab03).
Тест |
Корреляция |
p-value |
Отличие от нуля статистически: |
spearman |
0.030 |
0.767 |
не значимо |
kendall |
0.022 |
0.743 |
не значимо |
pearson |
0.010 |
0.920 |
не значимо |
Полученные коэффициенты статистически не отличаются от нуля, значит зависимости между x1 и x2 нет.
Линейная модель, функция lm(), (Lab04, Lab05). Зависимая переменная y, независимый переменные скаляр x1 и фактор g1. Построить модель от переменных и их взаимодействий.
Протокол построения линейной модели, выбор оптимальной модели, и оценки ее адекватности.
Модели:
p.lm0<-lm(y~1,data=p)
p.lm1<-lm(y~x1,data=p)
p.lm2<-lm(y~x1+g1,data=p)
p.lm3<-lm(y~x1*g1,data=p)
Для выбора модели рассчитаем критерий Акаика, и выполним сравнение вложенных моделей с помощью ANOVA.
Модель |
AIC |
RSS |
ANOVA p-value |
p.lm0 |
562.1 |
1554.23 |
|
p.lm1 |
414.2 |
347.13 |
< 0.001 |
p.lm2 |
314.6 |
125.68 |
< 0.001 |
p.lm3 |
286.5 |
92.96 |
< 0.001 |
drop1(p.lm3,test="F")
Single term deletions
Model:
y ~ x1 * g1
Df Sum of Sq RSS AIC F value Pr(>F)
<none> 92.958 0.6977
x1:g1 1 32.722 125.680 28.8569 33.793 7.999e-08 ***
Коэффициенты регрессии значимы. Т.о выбираем модель lm3.
Процедуры диагностики моделей множественной регрессии (для выбранной lm3):
а)остатки против модели б) распределение остатков в сравнении с нормальным
в) равномерность дисперсии остатков
Т.о
остатки распределены нормально:
1.распределение остатков вдоль нуля
(т.еE(res)=0),
2.
Эксперементальные квантили хорошо
соотносятся с теоретическими,
3.Дисперсии
остатков(σ(res)=1)
лежат вокруг 1.
Отсутствие зависимости остатков от переменных Pавномерность дисперсии остатков
Наблюдается небольшая нелинейность зависимости остатков от переменных, дисперсии равномерны относительно фактора, что в целом соответствует предположению.
В результате модель Lm3 считаем адекватной (остатки распределены нормально, и не зависят от предикторов модели, выраженные нелинейные зависимости отсуствуют).
Дисперсионный анализ (Lab03, Lab04).
М
етод
Краскела-Уоллиса.
Kruskal-Wallis rank sum test
data: x by group
Kruskal-Wallis chi-squared = 4.8982,
df = 3,
p-value = 0.1794
Сравниваемые группы статистически значимо не различаются.
Метод Тьюки.
Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = x ~ as.factor(group), data = p)
$`as.factor(group)`
diff lwr upr p adj
2-1 0.847990013 -3.350721 5.046701 0.9530666 #разницы нет
3-1 0.843687200 -3.355024 5.042398 0.9537294 #разницы нет
4-1 -0.547096239 -4.745807 3.651615 0.9866124 #разницы нет
3-2 -0.004302813 -4.203014 4.194408 1.0000000 #разницы нет
4-2 -1.395086252 -5.593797 2.803625 0.8239427 #разницы нет
4-3 -1.390783439 -5.589495 2.807928 0.8252805 #разницы нет
Видно, что во всех случаях разницы между парами нет p adj>0.05
Дисперсионный анализ в рамках линейной модели, выбираем aov()+summary() или lm()+anova().
а)Дисперсионный анализ (ANOVA)
H0: μ1 = μ2 = μ3
anova(lm(x~ as.factor(group), data = p))
Pr(>F)= 0.9876 фактор group не оказали существенного влияния на x.
Видно, что разброс групповых средних в целом меньше, чем разброс значений в экспериментальных группах . Фактор group не оказали существенного влияния на x.
б)M<- aov(x~ as.factor(group), data = p)
summary(M)
Pr(>F)= 0.988– полученное значение многим превышает 5%-ный уровень значимости и, на этом основании, мы заключаем, что нулевая гипотеза верна, и фактор group не оказали существенного влияния на x.
