
книги / Статистика и анализ геологических данных
..pdf
|
|
|
|
|
|
Т а б л и ц а 7.23 |
||
Собственные значения и собственные векторы (главные |
||||||||
|
компоненты) ковариационной матрицы, указанной |
|||||||
|
|
|
в табл. |
7.22 |
|
|
|
|
В е к т о р |
С о б с т в е н н о е |
В к л а д В д и с п ер |
С у м м а р н а я |
|
||||
1 |
з н а ч е н и е |
с и ю , % |
|
д и с п е р с и я |
|
|||
659,7759 |
64,18 |
|
64,19 |
|
||||
II |
318,4384 |
30,98 |
|
95,17 |
|
|||
III |
35,1959 |
3,42 |
|
98,59 |
|
|||
IV |
|
6,7528 |
0,66 |
|
99,25 |
|
||
V |
|
3,8193 |
0,37 |
|
99,62 |
|
||
VI |
|
2,3763 |
0,23 |
|
|
99,85 |
|
|
VII |
|
1,5540 |
0,15 |
|
|
100,00 |
|
|
П ере |
|
|
С о б с т в е н н ы й в е к т о р |
|
|
|||
I |
II |
III |
IV |
V |
VI |
VII |
||
м е н н а я |
||||||||
X, |
-0 ,0 0 1 9 |
0,0039 |
- 0 ,0 6 8 9 - 0 ,5 8 2 9 |
0,7554 |
0,2793 |
0,0818 |
||
X, |
0,7710 |
-0 ,4 7 7 7 |
0,3194 |
0,1885 |
0,1169 |
0,1581 |
0,0326 |
|
Хз |
0,4167 |
0,8647 |
0,0531 |
0,2116 |
0,1123 |
0,1294 |
0,0421 |
|
Х4 |
-0 ,3 9 0 7 |
0,0761 |
0,8844 |
0,0704 |
0,0490 |
0,2280 |
0,0028 |
|
Х5 |
- 0 ,1 8 9 5 |
-0 ,0 7 9 4 |
- 0 ,0 7 7 5 |
0,6308 |
0,6255 |
—0,3240 |
- -0,2401 |
|
Хв |
- 0 ,1 6 1 8 |
- 0 ,0 8 1 3 |
- 0 ,1 6 2 9 |
0,3330 |
0,0526 |
0,2570 |
0,8723 |
|
Х7 |
- 0 ,1 3 0 8 |
- 0 ,0 7 3 5 |
- 0 ,2 7 5 0 |
0,2570 ■-0 ,0 8 1 5 |
0,8107 |
- -0,4146 |
||
Х ,= |
1 -2 ф, Х2 = 2-Зф , Х3 ==3-4ф, Х4 = 4-5ф, Ха = 5-6ф, Хв= 6 -7 ф. X, = 7-8ф. |
осадками можно почти полностью описать только с помощью двух переменных.
Мы можем проверить результаты нашего анализа путем построения проекций наблюдений на первые две главные компо ненты, что также осуществляется программой 7.10 (МГК). На фиг. 7.25 изображено распределение проекций для первых двух главных компонент; пять различных типов осадочных по род представлены различными символами. Сравните различие между типами осадочных пород на этой диаграмме и диаграмме на фиг. 7.26, на которой изображена зависимость медианы раз меров зерен от коэффициента сортированности (квартиль откло нения). Вероятно, что еще больший интерес представляет фиг. 7.27, где изображено отношение процентного содержания мелкой и очень мелкой песчаных фракций. Все эти диаграммы имеют приблизительно одинаковую эффективность с точки зре ния разделения пяти типов осадков, хотя для построения диа граммы, изображенной на фиг. 7.27, требуется больше экспери ментальных данных, чем для диаграммы на фиг. 7.26. Таким образом, для разделения образцов на семь разных классов по размеру достаточно только двух операций просеивания. Кроме того, результаты анализа с использованием МГК показывают, что осадки в бассейне можно рассматривать как смесь двух


20
|
О |
|
|
|
|
|
|
|
|
||
10 “ |
о |
|
|
|
|
|
|
|
|
||
о |
|
|
|
\ |
|
|
|
|
|||
|
|
®о |
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
||
о |
~~ |
о |
|
|
|
|
|
|
♦ |
|
|
|
|
|
|
|
|
|
|
||||
о 1 |
|
|
|
|
|
|
|
|
|
* |
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
f |
^ |
|
-20 |
— |
|
|
|
|
|
▲ |
▲ |
|
|
|
п |
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
\ |
|
|
||
-30 |
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
• |
|
|
||
|
|
|
0 |
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
||
-40 |
|
|
|
|
|
|
|
|
О |
1 |
|
|
|
|
|
|
|
|
|
|
|||
-50 |
— |
|
|
|
|
|
|
|
■ |
2 |
|
|
|
|
|
|
|
|
• |
3 |
|||
|
|
|
|
|
|
|
|
|
|||
-60 |
|
|
|
|
|
|
|
|
А |
4 |
|
|
|
|
|
|
О |
|
|
|
|
5 |
|
-70 |
______ I______ I______ 1______ 1 |
1 |
1 |
1 |
1 |
||||||
+10 +20 |
|||||||||||
- 70 |
- 60 |
- 50 |
- 40 |
- 30 |
- 20 |
-10 |
|
0 |
I
Фиг. 7.25. Проекции анализов осадков залива Баратария на плоскость двух главных компонент.
Различные символы соответствуют пяти различным типам осадочных пород [15]: 1 — пля жевые и прибрежные пески, 2 — алевритистые русловые пески; 3 — алевритистые берего вые пески; 4 — органический донный алеврит, органические илы.
соответствующий из критериев ANOVA, указанных в гл. 3, опре делите, которая из трех переменных является наиболее эффек тивной.
Возможны и другие методы исследования, которые подтверж дают пользу набора статистик и квазистатистик, используемых для характеристики осадочных отложений. Вычислив эти статис тики, можно использовать их в качестве переменных в МГК, а также выбрать из них те комбинации, интерпретация которых позволит получить эффективную характеристику осадков. Опре деления различных статистик, используемых при изучении раз меров зерен, приведены во многих справочных изданиях по оса дочной петрологии. Напишите короткую программу вычисления некоторых из них и примените ее к необработанным данным табл. 7.21. Используйте статистики в качестве новых перемен ных в программе главных компонент (программа 7.10) и про думайте полученные результаты. (Аналогичные исследования приводят Гриффитс и Ондрик [8].)
называется фактором специфичности. Факторная модель выра жается в виде
X j = 2 /jrfr+ e j , |
(7.34) |
Г = I |
|
где fr — r-й общий фактор, р — заранее заданное число факторов и ej — случайная компонента, присущая исходной переменной Xj. Так как имеется ш исходных переменных X], то существует и ш случайных переменных ej; рассматриваемые вместе, они состав ляют вектор факторов специфичности. Коэффициент 1$ называ ется нагрузкой j -й переменной на г-й фактор. В компонентном анализе этому понятию соответствуют нагрузки или веса на главные компоненты.
Предположим, что переменные Xj имеют многомерное нор мальное распределение. Дисперсии и ковариации образуют мат
рицу порядка m X m . Из |
формулы (7.34) |
вытекает, что диаго |
нальные элементы этой |
матрицы — дисперсии ш переменных — |
|
можно выразить формулой |
|
|
s n = 2 / j r + v a r e j , |
( 7 . 3 5 ) |
Г= 1
анедиагональные элементы, или ковариации, имеют вид
covjk= 2 V k r - |
(7.36) |
Г = 1 |
|
Основную гипотезу факторного анализа в матричной форме можно сформулировать следующим образом. Наблюдаемая ко вариационная матрица, которую мы обозначим через [s2], явля ется произведением матрицы порядка ш Х р факторных нагрузок (которую мы обозначим [L]) и ее транспозиции плюс диаго нальная матрица порядка гпХш дисперсий факторов специфич ности [varej]:
[s2] = [L] [L]'-f-[vare^. |
(7.37) |
В результате умножения матрицы порядка т Х р на ее транс понированную получим матрицу порядка m X m , которая, однако, будет иметь только р положительных собственных значений и соответствующих им собственных векторов. Если р = гп, то мат рица [var ejk] оказывается тождественной и наша задача в точ ности эквивалентна МГК. В тех случаях, когда р < т , мы дол жны оценить матрицу параметров [L], т. е. матрицу факторных нагрузок, и дисперсии факторов специфичности, т. е. матрицу [var ej]. Отметим, что в факторном анализе предполагается, что число факторов р известно до анализа, так как исследователь на основании некоторых предварительных рассмотрений в со-