
- •Задание.
- •План работы.
- •О реализации.
- •Общие данные.
- •Анализ глубины просмотра по каждой категории и в целом.
- •Гипотеза нормальности. Модифицированный критерий χ2.
- •Гипотеза экспоненциальности. Критерий Колмогорова-Смирнова.
- •Гипотеза симметричности. Быстрый критерий Кенуя.
- •Результат выполнения программы на Python:
- •Результат анализа данных в пакете Statgraphics.
- •Сводная таблица по разделам:
- •Выводы:
- •Регрессионные модели.
- •Сводный результат выполнения программы на Python.
- •Категория 14.
- •Линейная модель.
- •Мультипликативная модель.
- •Обратная по X модель.
- •Выводы:
- •Анализ связи между категориями. Корреляционный анализ.
- •Пример.
- •Приложение. Исходный код.
Категория 14.
Гистограмма:
Глубина |
Количество |
Относительная |
|
Глубина |
Количество |
Относительная |
|
пользователей |
частота |
|
|
пользователей |
частота |
1 |
47075 |
0.39513 |
|
49 |
3 |
0.000025 |
2 |
23201 |
0.194741 |
|
52 |
3 |
0.000025 |
3 |
14759 |
0.123882 |
|
53 |
1 |
0.000008 |
4 |
9294 |
0.07801 |
|
54 |
2 |
0.000017 |
5 |
6478 |
0.054374 |
|
55 |
2 |
0.000017 |
6 |
4424 |
0.037133 |
|
56 |
4 |
0.000034 |
7 |
3272 |
0.027464 |
|
57 |
1 |
0.000008 |
8 |
2395 |
0.020103 |
|
58 |
1 |
0.000008 |
9 |
1789 |
0.015016 |
|
59 |
2 |
0.000017 |
10 |
1426 |
0.011969 |
|
60 |
1 |
0.000008 |
11 |
973 |
0.008167 |
|
62 |
4 |
0.000034 |
12 |
784 |
0.006581 |
|
63 |
2 |
0.000017 |
13 |
601 |
0.005045 |
|
64 |
2 |
0.000017 |
14 |
489 |
0.004104 |
|
66 |
2 |
0.000017 |
15 |
348 |
0.002921 |
|
67 |
3 |
0.000025 |
16 |
317 |
0.002661 |
|
68 |
4 |
0.000034 |
17 |
230 |
0.001931 |
|
69 |
1 |
0.000008 |
18 |
196 |
0.001645 |
|
71 |
1 |
0.000008 |
19 |
171 |
0.001435 |
|
73 |
1 |
0.000008 |
20 |
153 |
0.001284 |
|
79 |
1 |
0.000008 |
21 |
125 |
0.001049 |
|
83 |
1 |
0.000008 |
22 |
91 |
0.000764 |
|
91 |
1 |
0.000008 |
23 |
62 |
0.00052 |
|
92 |
1 |
0.000008 |
24 |
57 |
0.000478 |
|
93 |
1 |
0.000008 |
25 |
51 |
0.000428 |
|
96 |
2 |
0.000017 |
26 |
43 |
0.000361 |
|
101 |
1 |
0.000008 |
27 |
43 |
0.000361 |
|
106 |
1 |
0.000008 |
28 |
34 |
0.000285 |
|
115 |
1 |
0.000008 |
29 |
24 |
0.000201 |
|
121 |
1 |
0.000008 |
30 |
29 |
0.000243 |
|
136 |
1 |
0.000008 |
31 |
16 |
0.000134 |
|
152 |
1 |
0.000008 |
32 |
24 |
0.000201 |
|
158 |
1 |
0.000008 |
33 |
8 |
0.000067 |
|
163 |
2 |
0.000017 |
34 |
5 |
0.000042 |
|
172 |
1 |
0.000008 |
35 |
12 |
0.000101 |
|
207 |
1 |
0.000008 |
36 |
14 |
0.000118 |
|
290 |
1 |
0.000008 |
37 |
9 |
0.000076 |
|
325 |
1 |
0.000008 |
38 |
8 |
0.000067 |
|
326 |
1 |
0.000008 |
39 |
4 |
0.000034 |
|
338 |
1 |
0.000008 |
40 |
6 |
0.00005 |
|
345 |
1 |
0.000008 |
41 |
4 |
0.000034 |
|
351 |
1 |
0.000008 |
42 |
4 |
0.000034 |
|
353 |
1 |
0.000008 |
43 |
6 |
0.00005 |
|
420 |
1 |
0.000008 |
44 |
2 |
0.000017 |
|
431 |
1 |
0.000008 |
45 |
2 |
0.000017 |
|
1357 |
1 |
0.000008 |
46 |
4 |
0.000034 |
|
1429 |
1 |
0.000008 |
47 |
2 |
0.000017 |
|
1796 |
1 |
0.000008 |
48 |
4 |
0.000034 |
|
|
|
|
|
|
|
|
|
|
|
Линейная регрессия.
n = 95
sum(x) = 12058.000
sum(y) = 119138.000
sum(x*x)= 8620174.000
sum(x*y)= 395880.000
b = -2.077
a = 1517.720
Уравнение регрессии:
Y = 1517.720334 - 2.077080*X
Нелинейная регрессия. Мультипликативная модель.
Линеаризирующее преобразование:
y = axb
Переходим к новым переменным:
a* = ln a
b* = b
y* = ln y
x* = ln x
sum(x*) = 369.637
sum(y*) = 229.650
sum(x**x*) = 1604.539
sum(x**y*)= 577.341
b* = -1.901
a* = 9.815
y* = 9.815 - 1.901 x*
Y = 18306.664600 / X1.901263
Нелинейная регрессия. Обратная по X модель.
Линеаризирующее преобразование:
y = a + b/x
Переходим к новым переменным:
a* = a
b* = b
y* = y
x* = ln x
sum(x*) = 4.944
sum(y*) = 119138.000
sum(x**x*) = 1.631
sum(x**y*)= 69406.850
b* = 46009.779
a* = -1140.286
y* = -1140.286 + 46009.779 x*
Y = -1140.286430 + 46009.779288 / X
Проверим в статистическом пакете Statgraphics.
Comparison of Alternative Models
Model |
Correlation |
R-Squared |
Reciprocal-X |
0.9854 |
97.10% |
Square root-Y reciprocal-X |
0.9617 |
92.48% |
Squared-Y reciprocal-X |
0.9134 |
83.43% |
Multiplicative |
-0.8671 |
75.18% |
S-curve model |
0.6877 |
47.29% |
… |
… |
… |
Linear |
-0.1011 |
1.02% |