- •Содержание
- •Введение
- •§ 1. Математическая статистика. Выборочная совокупность. Точечные оценки параметров генеральной совокупности
- •§ 2. Интервальные оценки. Доверительная вероятность
- •§ 3. Проверка статистических гипотез. Проверка гипотез о значении математического ожидания
- •§ 4. Проверка статистических гипотез. Проверка гипотез о значении дисперсии
- •§ 5. Критерии согласия для корреляционных показателей. Критерии согласия относительно долей
- •Расчет коэффициента корреляции Пирсона производится по следующей формуле:
- •Пример 4.1
- •§ 6. Критерий согласия Пирсона . Критерий Вилкоксона однородности выборок
- •§ 7. Дисперсионный анализ. Однофакторный и двухфакторный дисперсионный анализ Однофакторный и двухфакторный дисперсионный анализ
- •7. 1. Однофакторный дисперсионный анализ
- •7. 2. Двухфакторный дисперсионный анализ
- •§ 8. Корреляционный и регрессионный анализ. Элементы теории корреляции
- •§ 9. Метод наименьших квадратов
- •§ 10. Множественная линейная регрессия
- •§ 11. Дискриминантный анализ
- •§ 12. Методы кластерного анализа
- •§ 13. Факторный анализ и анализ главных компонент
- •§ 13. Векторный анализ и теория поля. Основные понятия теории поля. Скалярное поле. Векторное поле. Оператор Гамильтона
- •§ 14. Функции комплексного переменного. Основные понятия. Аналитическая функция. Конформное отображение. Интегрирование функции комплексного переменного. Ряд Лорана
- •Литература
Пример 4.1
Целью исследования явилось выявление, определение тесноты и статистической значимости корреляционной связи между двумя количественными показателями: уровнем тестостерона в крови (X) и процентом мышечной массы в теле (Y). Исходные данные для выборки, состоящей из 5 исследуемых (n = 5), сведены в таблице:
N |
1 |
2 |
3 |
4 |
5 |
X |
951 |
874 |
957 |
1084 |
903 |
Y |
83 |
76 |
84 |
89 |
79 |
Вычислим суммы анализируемых значений X и Y:
Σ(X) = 951 + 874 + 957 + 1084 + 903 = 4769
Σ(Y) = 83 + 76 + 84 + 89 + 79 = 441
Найдем средние арифметические для X и Y:
Mx = Σ(X) / n = 4769 / 5 = 953.8
My = Σ(Y) / n = 441 / 5 = 82.2
Определим значения суммы квадратов отклонений Σ(dx2) и Σ(dy2):
Σ(dx2) = 25918.8
Σ(dy2) = 98.8
Найдем значение суммы произведений отклонений Σ(dx x dy):
Σ(dx x dy) = 1546.2
Рассчитаем значение коэффициента корреляции Пирсона rxy по приведенной выше формуле:
Найдем значение t-критерия для оценки статистической значимости корреляционной связи:
Критическое значение t-критерия найдем по таблице, где при числе степеней свободы f = n-2 = 3 и уровне значимости p = 0.01 значение tкрит = 5.84. Рассчитанное значение tr (7.0) больше tкрит (5.84), следовательно связь является статистически значимой.
Сделаем статистический вывод:
Значение коэффициента корреляции Пирсона составило 0.97, что соответствует весьма высокой тесноте связи между уровнем тестостерона в крови и процентом мышечной массы. Данная корреляционная связь является статистически значимой (p<0.01).
Занятие 5 |
Критерии согласия. Критерии однородности выборок |
§ 6. Критерий согласия Пирсона . Критерий Вилкоксона однородности выборок
Критерии согласия. Проверка гипотезы о виде распределения: критерий Пирсона. Проверка гипотезы об однородности выборок: критерий Вилкоксона.
Пример5.1. Дано статистическое распределение выборки: в первой строке указаны выборочные варианты хi , а во второй строке – соответственные частоты ni количественного признака Х). Требуется, пользуясь критерием Пирсона, при уровне значимости =0,05, установить, согласуется ли гипотеза о нормальном распределении генеральной совокупности с данными выборки объема n=100.
хi |
260 |
270 |
280 |
290 |
300 |
310 |
320 |
ni |
5 |
15 |
40 |
25 |
8 |
4 |
3 |
Решение: Для применения критерия Пирсона составим таблицу:
xi |
zi= = |
(zi) |
n |
ni |
n ni |
|
260 |
-1,90 |
0,0656 |
5,19 |
5 |
0,19 |
0,01 |
270 |
-1,11 |
0,2155 |
17,06 |
15 |
2,06 |
0,25 |
280 |
-0,32 |
0,3790 |
29,96 |
40 |
-10,04 |
3,36 |
290 |
0,47 |
0,3572 |
28,24 |
25 |
3,24 |
0,37 |
300 |
1,26 |
0,1804 |
14,26 |
8 |
6,26 |
2,75 |
310 |
2,06 |
0,0478 |
3,78 |
4 |
-0,22 |
0,01 |
320 |
2,85 |
0,0069 |
0,55 |
3 |
-2,45 |
10,91 |
|
|
|
|
|
|
|
Здесь:
=284,
В
= =12,65 вычислены в примере 33; n=100
по условию; h=270-260=10
– шаг выборки; n
=
=
=79,05(zi).
Таким
образом, получаем, что
=17,66.
По
таблице критических точек распределения
приложения 4 при заданном =0,05
и k
= s
– 3 = 7 – 3 = 4 (s
– число групп выборки) находим
(;
k)=
(0,05;
4)=9,5.
Т.к. > (17,66 > 9,5), то гипотеза о нормальном распределении генеральной совокупности не согласуется с данными выборки.
Ответ: гипотеза не согласуется с данными выборки.
Задачи для самостоятельного решения:
1. Дано статистическое распределение выборки: в первой строке указаны выборочные варианты хi , а во второй строке – соответственные частоты ni количественного признака Х). Требуется, пользуясь критерием Пирсона, при уровне значимости =0,05, установить, согласуется ли гипотеза о нормальном распределении генеральной совокупности с данными выборки объема n=100.
1.1)
хi |
102 |
112 |
122 |
132 |
142 |
152 |
162 |
ni |
4 |
6 |
10 |
40 |
20 |
12 |
8 |
1.2)
хi |
10,6 |
15,6 |
20,6 |
25,6 |
30,6 |
35,6 |
40,6 |
ni |
8 |
10 |
60 |
12 |
5 |
3 |
2 |
1.3)
хi |
26 |
32 |
38 |
44 |
50 |
56 |
62 |
ni |
5 |
15 |
40 |
25 |
8 |
4 |
3 |
1.4)
хi |
12,4 |
16,4 |
20,4 |
24,4 |
28,4 |
32,4 |
36,4 |
ni |
5 |
15 |
40 |
25 |
8 |
4 |
3 |
1.5)
хi |
110 |
115 |
120 |
125 |
130 |
135 |
140 |
ni |
5 |
10 |
30 |
25 |
15 |
10 |
5 |
1.6)
хi |
45 |
50 |
55 |
60 |
65 |
70 |
75 |
ni |
4 |
6 |
10 |
40 |
20 |
12 |
8 |
1.7)
хi |
10,2 |
10,9 |
11,6 |
12,3 |
13 |
13,7 |
14,4 |
ni |
8 |
10 |
60 |
12 |
5 |
3 |
2 |
1.8)
хi |
11,5 |
12 |
12,5 |
13 |
13,5 |
14 |
14,5 |
ni |
5 |
15 |
40 |
25 |
8 |
4 |
3 |
1.9)
хi |
104 |
109 |
114 |
119 |
124 |
129 |
134 |
ni |
4 |
6 |
10 |
40 |
20 |
12 |
8 |
1.10)
хi |
105 |
110 |
115 |
120 |
125 |
130 |
135 |
ni |
4 |
6 |
10 |
40 |
20 |
12 |
8 |
Пример 5.2. Критерий Вилкоксона
Допустим мы сравниваем между собой уровень тревожности студентов до и после тренинга уверенности в себе.
Шаг 1. Запишем значения в таблицу.
Шаг 2. Рассчитаем разность значений. Для данного случае типичным сдвигом будет считаться сдвиг в отрицательную сторону (7 значений, красный цвет заливки), а нетипичным в положительную сторону (3 значения, зеленый цвет заливки)
Шаг 3. Найдем значения шага 2 по модулю
Шаг 4. Проранжируем значения по модулю.
Шаг 5. Найдем T эмпирическое вычислив сумму рангов в НЕтипичном направлении (зеленый цвет заливки).
Все четыре шага приведены в таблице.
№ |
Уровень тревожности (до тренинга) |
Уровень тревожности (после тренинга) |
Шаг 2: Разность (после-до) |
Шаг 3: Значение разности по модулю |
Шаг 4: Ранг разности |
1 |
15 |
14 |
-1 |
1 |
3 |
2 |
14 |
11 |
-3 |
3 |
8 |
3 |
16 |
17 |
1 |
1 |
3 |
4 |
18 |
19 |
1 |
1 |
3 |
5 |
21 |
20 |
-1 |
1 |
3 |
6 |
21 |
18 |
-3 |
3 |
8 |
7 |
20 |
15 |
-5 |
5 |
10 |
8 |
15 |
17 |
2 |
2 |
6 |
9 |
17 |
14 |
-3 |
3 |
8 |
10 |
13 |
12 |
-1 |
1 |
3 |
Шаг 6. Используя таблицу критических значений T-критерия Вилкоксона определяем T-критическое
6.1. Находим количество человек в выборке. n=10
6.2. Определяем T-критическое справа от значения количества человек в выборке. для p<0,05 T=10; для p<0,01 T=5
Шаг 7. Сравниваем T-критическо и T-эмпирическое.
Шаг 8 Делаем выводы.
Задачи для самостоятельного решения:
2. Проверить однородность двух выборок по критерию Вилкоксона
21.1)
хi |
11,5 |
12 |
12,5 |
13 |
13,5 |
14 |
14,5 |
ni |
5 |
15 |
40 |
25 |
8 |
4 |
3 |
хi |
11,5 |
12 |
12,5 |
13 |
13,5 |
14 |
ni |
6 |
15 |
45 |
22 |
8 |
4 |
2.2)
хi |
26 |
32 |
38 |
44 |
50 |
56 |
62 |
ni |
5 |
15 |
40 |
25 |
8 |
4 |
3 |
хi |
26 |
32 |
38 |
44 |
50 |
56 |
ni |
6 |
13 |
41 |
27 |
10 |
3 |
2.3)
хi |
12,4 |
16,4 |
20,4 |
24,4 |
28,4 |
32,4 |
36,4 |
ni |
5 |
15 |
40 |
25 |
8 |
4 |
3 |
хi |
12,4 |
16,4 |
20,4 |
24,4 |
28,4 |
32,4 |
ni |
3 |
17 |
46 |
24 |
7 |
3 |
2.4)
хi |
110 |
115 |
120 |
125 |
130 |
135 |
140 |
ni |
5 |
10 |
30 |
25 |
15 |
10 |
5 |
хi |
110 |
115 |
120 |
125 |
130 |
135 |
ni |
4 |
12 |
38 |
24 |
17 |
5 |
2.5)
хi |
45 |
50 |
55 |
60 |
65 |
70 |
75 |
ni |
4 |
6 |
10 |
40 |
20 |
12 |
8 |
хi |
45 |
50 |
55 |
60 |
65 |
70 |
ni |
4 |
7 |
21 |
44 |
20 |
4 |
Занятие 6 |
Дисперсионный анализ. Однофакторный и двухфакторный дисперсионный анализ. |
