Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Статистический анализ данных в геологии. Кн. 2

.pdf
Скачиваний:
0
Добавлен:
12.11.2023
Размер:
19.38 Mб
Скачать

и

н

к

Рис. 6.47. Представление нагрузок R-

и Q-методов на первые две оси соот­

ветствия для данных по блокам в порядке возрастания их объемов.

Ц и ф р ы в к р у ж к а х — н агрузк и

Я - м е т о д а

(см. т а б л . 6 .40. З н а ч е н и я 15, 18 и 21 —

вне

о б л а с т и

д и агр ам м ы )

столь же эффективными, как оси, вычисленные из табл. 6.39, изображение нагрузок на оси соответствия показывает картину столь же значимую, как и та, которая была получена по метри­ ческим данным. Рис. 6.47 показывает R- и Q-нагрузки на две первых оси. Сравните эти результаты с результатами, получен­ ными по метрическим данным (рис. 6.46), имея в виду, что ин­ формация, содержащаяся в исходных данных, значительно меньше.

СОВМЕСТНЫЙ R- И Q-ФАКТОРНЫИ АНАЛИЗ

Хотя теорема Эккарта — Юнга утверждает, что R- и Q-ме- 1оды дают эквивалентные решения, на практике это не всегда так. Достаточно взглянуть на рис. 6.38 и 6.39, чтобы убедиться

Рис. 6.46. Представление нагрузок R- и Q-методов анализа соответствия на

первые две оси для данных по блокам

343

в том, что факторные метки ^-метода выглядят иначе, чем фак­ торные нагрузки Q-метода. Напомним, что решение /^-метода получается из симметричной матрицы-произведения [Й7]/[И^]> имеющей меньший порядок, в то время как решение Q-метода получается из произведения матриц [№][№]', имеющего боль­ ший порядок. К сожалению, шкалирование, используемое для получения матрицы [W\ из матрицы необработанных данных [X], не одинаково в этих двух методах. Например, глазные ком­ поненты содержат преобразование каждого элемента матрицы [X], состоящее в делении на стандартное отклонение сплбцов, что приводит к шкалированной матрице данных [W], Q-метод факторного анализа использует стандартизацию, состоящую в делении каждого элемента [X] на квадратный корень из суммы квадратов строк, что приводит к шкалированной матрице [W], Однако матрица [W] в анализе главных компонент не идентич­ на матрице [W], полученной на первом шаге Q-метода фактор­ ного анализа. Различие в шкалировании ухудшает решение в одном методе по отношению к другому.

Имеется несколько подходов к этой задаче. Очевидно, если

не проводится никакого шкалирования, то собственные векторы и собственные значения для [Х]'[Х] такие же, как и для [Л'][хг,

исключая лишь то различие, что одна из этих матриц имеет дополнительные нулевые собственные значения. Факторныемет­ ки /^-метода будут пропорциональны нагрузкам Q-метода, и на­ оборот. Кроме того, R- и Q-факторные нагрузки располагаются в том же пространстве, что и факторные оси, поэтому их можно нанести на одну и ту же диаграмму, как это представтено на рис. 6.48.

К сожалению, использование необработанной матрицы по­ парных произведений имеет большие неудобства. Так как при этом не проводится никакого шкалирования, то результаты анализа очень чувствительны к выбору единиц измерения и мо­ гут просто отражать средние величины переменных, а не свой­ ства дисперсий и 'ковариаций. Хотя, по-видимому, такой метод — наиболее простой способ получения факторов R- и Q-методов, он почти никогда не используется на практике.

Второй подход состоит в шкалировании матрицы [X] так, чтобы строки и столбцы можно было трактовать одинаковым образом. В анализе соответствия это делается путем деления каждого элемента на произведение квадратных корней из сумм по строкам и столбцам. Хотя этот метод очень чувствителен, его недостатки менее заметны, если мы имеем дело с условны­ ми таблицами и если применяем его « результатам измерений.

Третий подход — это поиск способа такого шкалирования строк, который дал бы содержательную меру взаимных связей между строками матрицы [Щ, И в то же время получалась бы содержательная мера взаимосвязей между столбцами. Эта за-

344

5

о

Р и .. 0.48.

П р ед ст а в л ен и е

н а гр у зо к R -

и

Q -м е т о д о в

на

д в е первы е ф ак тор н ы е

оси

д л я д а н н ы х п о бл ок ам ,

вы численны х д л я матрицы

н е о б р а б о т а н н ы х

сум м

 

 

к в а д р а т о в

и п оп ар н ы х

п р о и зв ед ен и й [ХЦ.Х].

 

 

ь .ю м ! п р едс тав л ен ы как

объ ек ты , х а р а к т е р и зу е м ы е

н агр узк ам и

Q - м ет од а; пе-

l’i

ен ны е — как векторы,

о п р ед е л ен н ы е

н агр у зк а м и

/? -м ет од а .

К о н е ц оси

о б ход и т ся

за п р е д е л а м и

д и а г р а м м ы

в

н ап равлен и и

оси Х 2: к он ец оси

Хъ

 

 

з а п р ед е л а м и д и а г р а м м ы

в н ап равлен и и

оси

 

 

дача оказывается не столь сложной, как кажется на первый взгляд, и это является базисом по меньшей мере двух практи­ ческих методов одновременного нахождения факторов R- и Q-методов.

Элементы матрицы [X] стандартизуются с помощью вычита­ ния средних столбца (переменной) и деления на квадратный корень пз п числа наблюдений, т. е.

Wij = (Xu Xj) /У«.

(6.93)

Тогда меньшая матрица-произведение

будет содержать

дисперсии и ковариации переменных. В то же время большая матрица-произведение [W][W]' эквивалентна матрице главных

координат Q, когда сходство между объектами

определяется

евклидовым расстоянием, т. е.

 

Qij — dij-j-d..— [di-+ d.j)

(6.94)

и di,•— элемент матрицы расстояний [D]:

 

т

 

(*;* - x Jb) / V J .

(6-96)

J=i

 

С другой стороны, можно стандартизовать элементы матрицы [X], вычитая среднее по столбцу (переменной) и выполняя де­ ление на произведение стандартных отклонений и квадратного корня из п:

xik —x.k

(b.')oj

sk "t

п

 

Меньшая матрица-произведение

 

будет теперь содер­

жать дисперсии и ковариации переменных в стандартизованной форме, которые есть не что иное как коэффициенты корреляции между переменными.

Снова большая матрица-произведение [И7] [W]' эквивалент на одной пз версий матрицы главных координат [Q]. Теперь, одна­

ко, матрица расстояний

[D]

содержит

 

евклидовы расстояния

между наблюдениями,

как

определено стандартизованными

переменными, или

 

 

 

 

 

 

 

 

(Xl;, — Xjtl

 

(

S/

(6.97)

 

I

Sk

!

I

 

 

 

к=1

 

 

 

 

 

Чтобы осуществить совместный R- и Q-факторнып анализ, мы сначала вычислим меньшую матрицу-произведение после шкалирования по формулам (6.93) или (6.96). Затем вы­

числим собственные векторы и собственные значения, а также /^-факторные нагрузки, умножая каждый элемент собственного

346

аектора на соответствующее сингулярное значение или квадрат­ ный корень из его собственного значения. Если матрицу собст-

П'. иных векторов обозначить через [£/],

то будем

иметь

[Л*] = [1/][Л],

 

(6.98)

где .нова Л — диагональная матрица

сингулярных значений

[ 1Г! '{W ]. Далее вычислим Q-факторные

нагрузки,которые нахо­

дятся как произведение шкалированной

матрицы

данных на

матрицы собственных векторов:

 

 

[Л<г] = [Г |[£ /].

 

(6.99)

Конечно, можно также найти факторныеметки, /^-факторные четки находятся умножением шкалированной матрицы данных та матрицу /^-факторных нагрузок:

[S*] = [1F]|;A*].

(6.100)

Q- гакторные нагрузки находятся по формуле

 

[Sc] = [r]'[i4C] = [1F]'[№ ][£/].

(6.101)

Так как /^-факторные нагрузки [Л*] дают координаты пере- •к-икых как точки факторного пространства и Q-факторные на­ грузки [,4е] дают координаты объектов как точки того же фак­ торного пространства, то обе совокупности факторных нагрузок можно нанести на одни и те же факторные диаграммы. Пере­ менные, которые нанесены близко друг к другу, очень похожи. Теорема Эккарта — Юнга дает соотношение между переменны­ ми и объектами. Уравнение (6.40) может быть переписано в заде

[Д<?][Л] 2[Д*]' = [иг].

(6.102)

Ч:емент матрицы \W\, таким образом, равен

171

ц -

(6.103)

'/„I» £ лаг*

'к к=1

'>\) к;ен;;е wtj, которое является шкалированным значением перегмнноп /, наблюдаемой на объекте i, можно рассматривать

.. | произведение вектора нагрузок объекта (а,-'3] и вектора па-

! р\ ■г>к

переменной fafRJ, умноженного на

1/у?.-. Величина век-

-фопаводе:;!:-’, как указывалось

в гл. 5 (см. гл. 5),

обратным образом связана с расстоянием между концами двух '■•попов. Таким образом, сила связи между объектом и пере­ менной в факторной диаграмме прямо выражается как расстоя­ ние между точкой объекта и переменной точкой.

Хотя между факторными метками существуют эквивалент­ ные соотношения, все же они не очень хорошо выражаются в

34 7

терминах сходства. Наилучший способ изображения результа­ тов одновременного ft- и Q-факторного анализа — это представ­ ление двух множеств факторных нагрузок в проекции на фак­ торные оси. Это сделано для данных по случайным блокам на рис. 6.49. Как для ft-метода, так и для метода главных компо­ нент, критические матрицы будут одинаковыми (см.табл.6.21).

Двойственность между анализом главных компонент и ана­ лизом главных координат, основанном на использовании евкли­ дова расстояния, была впервые указана Говером [20]. Однако эта двойственность до недавнего времени не использовалась, хотя множество программ факторного анализа использует син­ гулярное разложение матриц, которое является следствием теоремы Эккарта — Юнга. Математическое обоснование одно­ временного ft- и Q-факторного анализа дано Зу, Чангом и Де­ висом [66], которые также приводят большое число примеров ело использования в геологии.

В табл. 6.41 содержатся измерения, сделанные по профилю

через

небольшой высокорадиоактивный кварц-моицокит-цзый

и л у г о н ,

иитруднрованныц в хлорит-актиколитовый сланец вбли­

зи Береа, штат Виргиния. По этому профилю анализировались содержанте радиоактивных урана, тория и калия 22 образ­ на из буровых скважин. В тех же местах вдоль профиля были

с к/чаны воздушные радиометрические измерения. Цель посленз.анпя, первоначально проведенного Шерманом, Банкером к Вашем [57], состояла в установлении связи между содержания­ ми радиоактивных элементов и радиометрическими измере­ ниями.

Данные были проанализированы Зу, Чангом и Девисом [66] с использованием шкалирования по формуле (6.96). В табл. 6.42 приведены матрица коэффициентов корреляции, собственные значения, ft- и Q-факторные нагрузки. На рис. 6.50 представле­ ны ft- и Q-факторные нагрузки на первые две оси в факторном пространстве. Очевидно различие между пробами, взятыми из ллутона, и пробами, собранными а сланцах материнской поро­ ды п аллювиального покрытия.

М Н О Г О Г Р У П П О В Ы Е Д И С К Р И М И Н А Н Т Н Ы Е Ф У Н К Ц И И

Многогрупповой дискриминантный анализ вобрал в себя наи­ более ценные черты дисперсионного анализа и связанные с ни­ ми вычислительные процедуры факторного анализа. Эта задача

Рис.

6.49. П р ед ст а в л ен и е н а гр у зо к

R - и

Q -м етоД ов

на п ервы е д в е

ф ак тор н ы е

оси

д л я д а н н ы х п о

бл ок ам , вы численны х

из м атри цы ди с п ер си й

и

к овари аци й

 

 

 

\'[Щ.

 

 

 

 

Б лок и п р едстав л ен ы

как объ ек ты ,

со о т в е т с т в у ю щ и е

н а гр у зк а м

Q - м е т о д а .

П е ­

рем ен н ы е п р едс тав л ен ы в ек т ор ам и ,

х а р а к т е р и зу ю щ и м и с я н агр у зк а м и ^ - м е

т о д а

349

Т а б л и ц а 6.41

Содержания урана, тория и калия и интенсивность результатов воздушной радиометрической разведки (ВР), проведенной вдоль разреза интрузии кварцевых монцоиитов вблизи Берея, штат Виргиния [57]

Номер

ВР*

U, г/т

Th,

г/т

К, %

1

240

0 ,6 3

2 ,0 5

0 ,1 3

2

360

2 ,1 8

5,31

0,31

3

420

2 ,2 6

5,61

0 ,3 4

4

500

1 ,71

6

,4 4

0 ,7 0

с.

580

2 ,3 8

7

,9 9

1,73

р

700

3 ,8 3

8

,3 2

4 ,2 6

-/7

600

3 ,7 9

9 . 4 6

1,53

8

650

4 ,0 9

14,71

3,11

9

770

4,21

12.00

1,90

,0

930

•'-,72

12,78

2 ,9 2

,1

1020

6,24

16,31

2 . 2 9

,0

1000

5,24

14,51

1,88

.3

1000

4 ,7 3

15,79

4 ,6 4

4

1040

4 ,6 7

10,30

4 ,1 7

.5

И 50

5 ,0 8

13,11

3 ,9 7

6

1000

5 ,2 7

13,40

4 ,3 6

.7

960

5,61

10,31

2 , 0 5

.8

420

2 ,3 3

6

,8 3

0 ,4 7

.9

370

2 ,6 4

9 ,8 8

0 ,5 8

20

400

2 ,2 9

6,02

0 ,3 4

21

480

2 ,3 2

6

,1 4

0 ,3 2

А2

730

3 ,9 4

12,86

Г о г

В( pajricricT pir.' n ;:i; измерения в расчете на I с.

являете;; обобщением уже рассмотренной процедуры днекрими-

к « т него анализа,

связанной с

разбиением на две группы.

В качестве примера

рассмотрим

задачу из палеонтологии, свя­

занную с изучением полового диморфизма гастропод по образ­

цам, взятым пз нес сольких

различных мест. По

мягкой

части

их тел исследователь легко

отличит самку от

самца.

Особи

можно классифицировать как самцы из совокупности А, самки из совокупности А, самцы из совокупности В и т. д. Многомер­ ные измерения, сделанные на раковинах, используются в дис­ криминантном анализе для нахождения комбинаций измерений, которые позволяют различить как их пол, так и совокупности, из которых они взяты. К счастью, различия пола оказываются более ярко выраженными, чем различия между совокупностя­ ми. Этот метод дает возможность выделить характеристики раковин гастропод и классифицировать ископаемые останки раковин в соответствии с их полом.

Аналогия с дисперсионным анализом состоит в том, как дис­ персии и ковариации разделяются на категории или группы. Вспомним, как в гл. 2 в одномерном дисперсионном анализе

Т а б л и ц а 6.42

Матрица коэффициентов корреляции, собственные значения, R- и Q-факторные нагрузки по данным состава и радиометрическим данным из Береа,

 

 

ш тат

Виргиния

 

 

 

М а т р и ц а

к о э ф ф и ц и е н т о в

к о р р е л я ц и и

п о р я д к а

4 x 4

 

 

ВР

 

и

Th

 

К

В Р

 

1 ,0 0

 

 

 

 

 

и

 

0 , 8 9

 

1 ,0 0

1 ,0 0

 

 

Th

 

0 , 8 2

 

0 , 8 9

1 ,0 0

К

 

0 , 8 2

 

0 , 6 7

0 , 6 9

 

С о б с т в е н н ы е з н а ч е н и я

 

 

 

 

 

 

 

Факторы

 

 

 

 

I

 

И

III

 

IV

X

 

3 , 3 9

 

0 , 3 9

0 , 1 5

 

0 , 0 6

%

 

8 4 ,8 1

 

9 , 7 6

3 , 8 7

 

1 ,5 5

2 , %

 

8 4 ,8 1

 

9 4 , 5 7

9 8 , 4 5

1 0 0 ,0 0

 

 

Н а г р у з к и

Q - м е т о д а

 

 

 

 

 

 

 

Факторы

 

 

 

 

I

 

и

Ш

 

IV

В Р

 

0 , 9 6

 

0 , 0 5

— 0 , 2 2

— 0 , 1 0

и

 

0 , 9 4

 

— 0 , 2 7

— 0 , 1 3

 

0 . 1 7

Th

 

0 , 9 2

 

— 0 ,2 5

0 , г-8

— 0 ,0 7

к

 

0 , 8 6

 

0 ,5 1

0 , 0 9

 

0 ,0 7

 

 

Н а г р у з к и

Q - м е т о д а

 

 

 

 

 

 

 

<.*«s-егерь;

 

 

 

 

I

 

П

Ш

 

IV

1

— 0 , 7 5

 

0 , 12

— 0 ,0 3

— 0 . 0 1

2

— 0 , 4 9

— 0 , 0 2

— 0 ,0 2

0 , 0 3

3

— 0 , 4 5

— 0 , 0 2

- 0 , 0 4

 

0 , 0 0

4

— 0 ,4 1

 

0 ,0 4

— 0 , 0 0

— 0 , 0 8

5

— 0 ,2 2

 

0 , 0 9

0 , 0 3

— 0 , 0 5

6

0, 11

 

0 , 2 9

— 0 , 0 0

0 , 1 2

7

— 0 , 0 8

— 0 , 0 5

0 , 0 0

0 , 0 4

8

0 ,2 1

 

0 , 0 0

0 . 2 3

0 , 0 3

9

0 , 1 2

— 0 , 0 8

0 , 0 2

— 0 , 0 3

10

0 , 3 1

 

0 , ^ 0

— 0 ,0 1

 

— 0 , 03

11

0 ,5 1

— 0 , 2 3

о , с о

— 0 ,0 1

12

0 , 3 5

— 0 , 1 8

— с , 03

— о .г Х

13

0 , 5 3

 

0 , 1 4

0 . 1 4

__ j К'\

14

0 , 3 6

 

0 ,2 1

- 0, 1 1

 

— о ’о о

15

0 , 5 0

 

0, 11

— 0 , 0 8

— 0 , 0 7

16

0 , 4 9

 

0 , 1 3

0, 0 1

 

0 , 0 3

17

0 , 2 6

— 0 , 0 9

— 0 , 1 9

0 , 0 4

18

- 0 , 4 0

— 0 ,0 4

0, 01

 

— 0

00

19

— 0, 3 1

— 0, 11

0 , 1 5

о ’о :

20

— 0 , 4 4

— 0 , 0 3

- 0 , 0 1

 

0 ,0 1

21

— 0 ,4 1

- 0 , 0 3

— 0 , 0 5

 

— 0 , 0 3

22

0, 2 1

— 0 ,2 6

— 0 . 0 3

 

0 , 1 2

351