- •Описательная статистика и подгонка распределений.
- •Классические критерии
- •Оценка значимости корреляции (линейной и монотонной). (Lab03).
- •Линейная модель, функция lm(), (Lab04, Lab05). Зависимая переменная y, независимый переменные скаляр x1 и фактор g1. Построить модель от переменных и их взаимодействий.
- •Дисперсионный анализ (Lab03, Lab04).
- •Развитие линейной модели (Lab05)
- •1.026586 2.009046 1.971255 2.073800 #Получили коэффициенты модели
Компьютерные технологии.
Описательная статистика и подгонка распределений.
Для выборки посчитать статистики (макс/мин, квартили, медиану, среднее, СКО, дисперсию, асимметрию, эксцесс), представить в виде таблички (любой из двух вариантов оформления).
|
Mean |
Median |
Var |
Sd |
Min |
Max |
Kurtosis |
Skewness |
IQR. |
V1 |
19.286 |
18.142 |
125.823 |
11.217 |
3.082 |
38.213 |
1.654 |
0.181 |
20.252 |
V2 |
21.558 |
15.502 |
231.438 |
15.213 |
4.958 |
67.385 |
5.068 |
1.470 |
19.937 |
V3 |
18.745 |
14.234 |
207.152 |
14.393 |
1.578 |
55.551 |
3.575 |
1.160 |
15.353 |
V4 |
18.745 |
14.349 |
114.859 |
10.717 |
1.888 |
44.273 |
3.660 |
0.928 |
13.751 |
V5 |
19.535 |
15.801 |
240.269 |
15.501 |
1.432 |
65.057 |
4.916 |
1.398 |
14.668 |
Mean Median Var Sd Min Max Kurtosis Skewness IQR.
V1 19.286 18.142 125.823 11.217 3.082 38.213 1.654 0.181 20.252
V2 21.558 15.502 231.438 15.213 4.958 67.385 5.068 1.470 19.937
V3 18.745 14.234 207.152 14.393 1.578 55.551 3.575 1.160 15.353
V4 18.745 14.349 114.859 10.717 1.888 44.273 3.660 0.928 13.751
V5 19.535 15.801 240.269 15.501 1.432 65.057 4.916 1.398 14.668
Определить по выборке параметры распределения известного вида, доверительный интервал, наличие данных, выходящих за доверительный интервал(квантили)
Распределение: лог-нормальное dlnorm (x, meanlog = 0, sdlog = 1, log = FALSE)
Аналогично нормальному (вычисляется среднее и дисперсия логарифма). Область определения – положительные числа.
Начальные значения для лог-нормального распределения вычисляем как mean(log(x)),sd(log(x)).
Параметр |
Начальные значения |
Оценка параметров распределения с помощью optim |
Оценка параметров распределения с помощью fitdistr |
meanlog |
2.497 |
2.497 |
2.497 |
sdlog |
5.709 |
5.637 |
5.637 |
Тест соответствия распределения данным показал адекватность параметров (p-value > 0.05)
One-sample Kolmogorov-Smirnov test
data: x
D = 0.069272, p-value = 0.9836
alternative hypothesis: two-sided
Квантили
qlnorm(c(0.025,0.975), ep1,ep2)
[1] 1.932985e-04 7.632626e+05
Потенциальные выбросы (за пределами интервала)
ind<-(x < x.q95[1] | x > x.q95[2])
x[ind]
[1] 1.251784e-04 6.582054e+06
