- •Глава 2. Проверка гипотез о векторе наблюдений, векторе средних и ковариационной матрице
- •Проверка гипотез о векторе наблюдений
- •Проверка гипотез о равенстве векторов средних в двух совокупностях
- •Проверка гипотезы об однородности нескольких векторов средних
- •На основе компонентов qb и qw могут быть получены две дисперсии
- •Вторая дисперсия может также быть найдена усреднением в виде
- •Аналогичная формула для внедиагональных элементов матрицы b имеет вид
- •В тех случаях, когда векторы средних различаются случайным образом, величина
- •Проверка гипотезы о равенстве нескольких ковариационных матриц
Аналогичная формула для внедиагональных элементов матрицы b имеет вид
k 1 k k
bfh = NiMfiMhi - NiMfi NiMhi .
i = 1 N i = 1 i = 1
Элементы матрицы B опираются на суммы NiMfi NiMfi2 и NiMfiMhi и находятся достаточно просто.
2.7 В одномерном случае после получения межгрупповой и внутригрупповой дисперсий осуществлялось сравнение их значений. В многомерной ситуации также производится сопоставление величины двух этих компонентов вариации. Однако, здесь в этом сравнении участвуют не ковариационные матрицы SB и SW - многомерные аналоги дисперсий, а матрицы сумм - B и W, на которых основываются SB и SW . Сравнение B и W, описывающих межгрупповую и внутригрупповую изменчивость, осуществляется с применением лямбда-критерия Уилкса
W
= , (2.21)
B + W
в который входят определители W и B + W . Этот критерий < 1 и очевидно, что его величина будет тем меньше, чем большую роль в суммарной изменчивости, описываемой матрицей B + W , будет играть B , измеряющая межгрупповую вариацию. Иными словами, критерий Уилкса будет тем меньше, чем больше оказывается межвыборочная изменчивость.
Осуществить проверку статистической гипотезы по критерию Уилкса можно двумя способами. Первый из них предложил М.Бартлетт. Здесь в дополнение к ве-
- 26 -
личине находится также поправка на соотношение суммарного числа наблюдений, количества признаков m и выборок k
k 1
p = Ni - 1 - (m + k) . (2.22)
i = 1 2
В тех случаях, когда векторы средних различаются случайным образом, величина
2 = -2.3026 p lg (2.23)
имеет распределение 2 с числом степеней свободы n = m(k - 1). Поэтому, на заключительном этапе анализа однородности векторов средних следует для конкретного числа степеней свободы и уровня вероятности ошибки 1-го рода (0.05, 0.01 и 0.001) по таблицам распределения 2 найти критическое значение 2o. При 2 > 2o можно считать, что предположение об однородности k векторов средних плохо согласуется с эмпирическими материалами, и в исследуемых данных присутствует неслучайная межвыборочная изменчивость. При 2 < 2o наличие достоверной межгрупповой изменчивости остается недоказанным.
Второй способ определения значимости величины критерия Уилкса был разработан С.Рао. В соответствие с ним вычисляются дополнительные значения
m2(k
- 1)
2
- 4 1/2
s
= ,
(2.24)
m2 + (k - 1) 2 - 5
m(k - 1)
r = , (2.25)
2
m(k - 1) - 2
q = , (2.26)
4
а также - по формуле (2.22) находится поправка p. Затем с их использованием вычисляется величина F-критерия
ps – 2q 1 - 1/ s
F = . (2.27)
2r 1/ s -
В ситуации, когда нулевая гипотеза верна, этот критерий имеет F-распределение Фишера с числами степеней свободы 1 = 2r и 2 = (ps - 2q). На заключительном этапе анализа однородности векторов средних для конкретных чисел степеней свободы 1 и 2 и уровня вероятности ошибки 1-го рода (0.05, 0.01 и 0.001) по таблицам F-распределения Фишера следует найти критическое значение Fo. При F > Fo можно считать, что предположение об однородности векторов средних не согласуется с эмпирическими данными. Если F < Fo предположение об отсутствии неслучайных различий векторов средних можно сохранить.
Следует заметить, что поправка p, находимая по формуле (2.22), зависит от соотношения общего количества наблюдений во всех сравниваемых выборках N и суммы числа выборок и признаков (m + k). Очевидно, что если N не слишком значительно будет превышать сумму m + k, величина поправки p и значение крите-
- 27 -
рия 2 могут уменьшиться только из-за этого обстоятельства. Аналогичным образом уменьшится величина F-критерия и число его степеней свободы 2 . Отсюда следует, что при работе с выборками, имеющими небольшие количества наблюдений, следует избегать рассмотрения слишком больших наборов признаков.
Во многих пакетах компьютерных программ одновременно с нахождением значения критерия Уилкса и величин 2 или F находится P - вероятность ошибки 1-го рода, которая соответствует им. Тогда при P < (0.05, 0.01 и 0.001) можно сделать вывод о неслучайном характере межгрупповой изменчивости.
Пример 2.3 Проведем проверку однородности векторов средних для трех краниологических серий, относящихся к средневековым восточным славянам-вятичам. Первая из них характеризует группы вятичей, расселенные в верхнем течении р.Москвы и ее притока - Истры, вторая - относится к вятичам среднего течения этой реки, третья - характеризует племена нижнего течения Москвы и бассейн р.Пахры. В связи с относительно небольшими численностями этих краниологических серий, рассматривался небольшой набор 8 признаков (табл.2.3). Для проведения анализа использовались только черепа, на которых можно было измерить все эти признаки. Материалы по индивидуальным измерения были взяты из сводки Т.И.Алексеевой (Aleksiejewa, 1966).
Векторы средних для трех серий вятичей приведены в таблице 2.3. Одномерные дисперсионные анализы, проведенные по каждому из краниологических признаков (табл.2.4) продемонстрировали наличие неслучайных различий только по одному признаку - скуловой ширине, которая уменьшается вдоль течения р.Москвы. Для вятичей низовий р.Москвы также можно отметить уменьшение угла выступания носа и увеличение углов горизонтальной профилировки. Однако, неслучайность этих различий остается недоказанной. При проведении проверки многомерной однородности трех векторов средних была найдена величина крите-рия Уилкса = 0.464, чему в соответствии с методом С.Рао соответствует значе-
Таблица 2.3. Значения векторов средних 8 краниометрических признаков в трех сериях вятичей
Признаки |
Верхнее течение Москвы N = 13 |
Среднее течение Москвы N = 9 |
Нижнее течение Москвы N = 24 |
1 Продольный диаметр черепа |
184.5 |
179.0 |
180.5 |
8 Поперечный диаметр черепа |
134.2 |
137.6 |
136.5 |
45 Скуловой диаметр |
130.5 |
129.3 |
126.0 |
48 Верхняя высота лица |
66.4 |
66.2 |
67.5 |
54 Ширина грушевидного отверст. |
25.8 |
24.4 |
24.7 |
751 Угол выступания носа |
28.8 |
32.2 |
27.3 |
77 Назомалярный угол |
138.3 |
138.1 |
140.7 |
ZM Зигомаксиллярный угол |
126.3 |
126.9 |
128.0 |
- 28 -
Таблица 2.4. Результаты однофакторных дисперсионных анализов отдельных признаков в трех сериях вятичей
No При-зна- ка |
Компоненты изменчивости
|
Сте- пени сво- боды |
Диспер- сии
|
F-кри- терий
|
Вероят- ность ошибки
|
1
|
Межгрупповая |
2 |
96.439 |
1.568
|
0.220
|
Внутригрупповая |
43 |
61.517 |
|||
8
|
Межгрупповая |
2 |
35.553 |
1.847
|
0.170
|
Внутригрупповая |
43 |
19.253 |
|||
45
|
Межгрупповая |
2 |
97.134 |
4.151
|
0.022 *
|
Внутригрупповая |
43 |
23.400 |
|||
48
|
Межгрупповая |
2 |
8.661 |
0.453
|
0.639
|
Внутригрупповая |
43 |
19.130 |
|||
54
|
Межгрупповая |
2 |
6.212 |
2.354
|
0.107
|
Внутригрупповая |
43 |
2.639 |
|||
751
|
Межгрупповая |
2 |
81.180 |
2.414
|
0.101
|
Внутригрупповая |
43 |
33.622 |
|||
77
|
Межгрупповая |
2 |
35.431 |
1.214
|
0.307
|
Внутригрупповая |
43 |
29.177 |
|||
ZM
|
Межгрупповая |
2 |
13.041 |
0.507
|
0.606
|
Внутригрупповая |
43 |
25.713 |
ние F-критерия - 2.106. Для чисел степеней свободы 1 = 16, 2 = 72 вероятность ошибки 1-го рода P = 0.017 и оказывается меньшей по сравнению с критическим уровнем = 0.05. Поэтому, многомерная неоднородность векторов средних для трех краниологических серий может считаться доказанной.
