Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
data_2016-saa.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
246.56 Кб
Скачать
  1. Оценка значимости корреляции (линейной и монотонной). (Lab03).

Тест

Корреляция

p-value

Отличие от нуля статистически:

spearman

0.030

0.767

не значимо

kendall

0.022

0.743

не значимо

pearson

0.010

0.920

не значимо

Полученные коэффициенты статистически не отличаются от нуля, значит зависимости между x1 и x2 нет.

  1. Линейная модель, функция lm(), (Lab04, Lab05). Зависимая переменная y, независимый переменные скаляр x1 и фактор g1. Построить модель от переменных и их взаимодействий.

    1. Протокол построения линейной модели, выбор оптимальной модели, и оценки ее адекватности.

Модели:

p.lm0<-lm(y~1,data=p)

p.lm1<-lm(y~x1,data=p)

p.lm2<-lm(y~x1+g1,data=p)

p.lm3<-lm(y~x1*g1,data=p)

Для выбора модели рассчитаем критерий Акаика, и выполним сравнение вложенных моделей с помощью ANOVA.

Модель

AIC

RSS

ANOVA

p-value

p.lm0

562.1

1554.23

p.lm1

414.2

347.13

< 0.001

p.lm2

314.6

125.68

< 0.001

p.lm3

286.5

92.96

< 0.001

drop1(p.lm3,test="F")

Single term deletions

Model:

y ~ x1 * g1

Df Sum of Sq RSS AIC F value Pr(>F)

<none> 92.958 0.6977

x1:g1 1 32.722 125.680 28.8569 33.793 7.999e-08 ***

Коэффициенты регрессии значимы. Т.о выбираем модель lm3.

Процедуры диагностики моделей множественной регрессии (для выбранной lm3):

а)остатки против модели б) распределение остатков в сравнении с нормальным

в) равномерность дисперсии остатков

Т.о остатки распределены нормально: 1.распределение остатков вдоль нуля (т.еE(res)=0),

2. Эксперементальные квантили хорошо соотносятся с теоретическими,

3.Дисперсии остатков(σ(res)=1) лежат вокруг 1.

Отсутствие зависимости остатков от переменных Pавномерность дисперсии остатков

Наблюдается небольшая нелинейность зависимости остатков от переменных, дисперсии равномерны относительно фактора, что в целом соответствует предположению.

В результате модель Lm3 считаем адекватной (остатки распределены нормально, и не зависят от предикторов модели, выраженные нелинейные зависимости отсуствуют).

  1. Дисперсионный анализ (Lab03, Lab04).

    1. М етод Краскела-Уоллиса.

Kruskal-Wallis rank sum test

data: x by group

Kruskal-Wallis chi-squared = 4.8982,

df = 3,

p-value = 0.1794

Сравниваемые группы статистически значимо не различаются.

    1. Метод Тьюки.

Tukey multiple comparisons of means

95% family-wise confidence level

Fit: aov(formula = x ~ as.factor(group), data = p)

$`as.factor(group)`

diff lwr upr p adj

2-1 0.847990013 -3.350721 5.046701 0.9530666 #разницы нет

3-1 0.843687200 -3.355024 5.042398 0.9537294 #разницы нет

4-1 -0.547096239 -4.745807 3.651615 0.9866124 #разницы нет

3-2 -0.004302813 -4.203014 4.194408 1.0000000 #разницы нет

4-2 -1.395086252 -5.593797 2.803625 0.8239427 #разницы нет

4-3 -1.390783439 -5.589495 2.807928 0.8252805 #разницы нет

Видно, что во всех случаях разницы между парами нет p adj>0.05

    1. Дисперсионный анализ в рамках линейной модели, выбираем aov()+summary() или lm()+anova().

а)Дисперсионный анализ (ANOVA)

H0: μ1 = μ2 = μ3

anova(lm(x~ as.factor(group), data = p))

Pr(>F)= 0.9876 фактор group не оказали существенного влияния на x.

Видно, что разброс групповых средних в целом меньше, чем разброс значений в экспериментальных группах . Фактор group не оказали существенного влияния на x.

б)M<- aov(x~ as.factor(group), data = p)

summary(M)

Pr(>F)= 0.988– полученное значение многим превышает 5%-ный уровень значимости и, на этом основании, мы заключаем, что нулевая гипотеза верна, и фактор group не оказали существенного влияния на x.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]