Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
1033.pdf
Скачиваний:
32
Добавлен:
15.11.2022
Размер:
8.08 Mб
Скачать

3.10.Метод главных компонент

Сувеличением размерности признакового пространства воз­ растают трудности изучения геологических объектов и возникает проблема замены многочисленных наблюдаемых признаков мень­ шим их числом без существенной потери полезной информации. Одним из наиболее распространенных методов решения этой зада­ чи является метод главных компонент.

Основой метода главных компонент является линейное преоб­ разование т исходных переменных (признаков) в т новых пере­ менных, где каждая новая переменная представляет собой линейное сочетание исходных. В процессе преобразования векторы наблю­ даемых переменных заменяются новыми векторами (главными компонентами), которые вносят резко различные вклады в суммар­ ную дисперсию многомерных признаков. Сокращение пространства признаков достигается путем отбора нескольких наиболее инфор­ мативных компонент, обеспечивающих основную долю суммарной дисперсии, что приводит к заметному уменьшению их общего чис­ ла за счет наименее информативных компонент, отражающих ма­ лые доли суммарной дисперсии.

Главные компоненты - это собственные векторы ковариацион­ ных матриц исходных признаков. Число собственных векторов ко­ вариационной матрицы определяется числом изучаемых признаков, то есть равно числу ее столбцов (или строк). Каждый собственный вектор (главная компонента) характеризуется собственным значе­ нием и координатами.

Собственные значения ковариационной матрицы (Я.у) - это

длины ее собственных векторов, то есть их дисперсии. Суммы соб­ ственных значений ковариационной матрицы равны ее следу, то есть сумме ее диагональных элементов.

Координаты собственного вектора ковариационной матрицы (ооу ) - это числовые коэффициенты, характеризующие его положе­ ние в ш-мерном признаковом пространстве. Число точечных коор­ динат каждого собственного вектора (соу)ш, ,оэ2,...,со„, определяется размерностью пространства, а их численные значения - это коэф­ фициенты линейных уравнений данного собственного вектора.

Собственные значения ковариационной матрицы находятся как характеристические корни полиномиальных уравнений путем их решения. Однако осуществить это для больших значений т очень сложно. Поэтому в вычислительной практике их определяют мето­ дами матричных преобразований (путем последовательных при­ ближений к собственным значениям), которые могут быть реализо­ ваны только с помощью ЭВМ. Методы отыскания координат собст­ венных векторов симметричных матриц также сложны и требуют применения ЭВМ.

Поскольку ковариационные матрицы исходных признаков симметричны, их собственные векторы всегда ортогональны, а со­ ставляющие их переменные взаимонезависимы, то есть не коррели­ руют друг с другом.

В методе главных компонент координаты собственных векто­ ров рассматриваются как нагрузки соответствующих переменных на тот или иной фактор. Они используются для расчета матриц нового множества совокупностей путем проектирования векторов исход­ ных данных (признаков х\, хг, .... хт) на оси собственных векторов (Yl,Y2v>Ym) :

т

Ys =

>1

где соу(- - нагрузки у'-й компоненты в /-й переменной признака. Ис­

ходная матрица наблюдаемых признаков размерности п х т пере­ считывается в матрицу новых переменных (той же размерности), учитывающих собственные значения каждой из компонент. Если статистические (корреляционные) связи между наблюдаемыми при­ знаками многомерного пространства проявляются достаточно от­ четливо, то разложение исходной матрицы наблюдений на т новых компонент приводит к заметному возрастанию контрастности рас­ пределения дисперсий по новым компонентам по сравнению с ис­ ходными векторами. Как правило, дисперсия одной из главных компонент достигает половины и более от суммарной дисперсии признаков, а в совокупности с дисперсиями еще одной-двух после­ дующих компонент их общий вклад в суммарную дисперсию пре­ вышает 90 %.

Таким образом, без существенной потери информации об из­ менчивости наблюдаемых признаков можно заметно сократить раз­ мерность пространства этих признаков (р< т ), ограничившись данными по двум-трем наиболее информативным главным компо­ нентам. Это позволяет считать, что вместо исходной матрицы раз­ мерностью п х т для целей геологического анализа может исполь­ зоваться матрица главных компонент размерностью п х р , где р , как правило, не превышает 2-3. Поскольку новые переменные в этой матрице представлены некоррелированными величинами, метод главных компонент может рассматриваться как мощное средство определения истинного числа линейно независимых векторов, со­ держащихся в исходной матрице.

Реализация метода главных компонент сводится к проведению следующих вычислительных процедур.

1. По исходной матрице наблюдений [X] размерностью п х формируется ее ковариационная матрица [С] размерностью тхт.

С этой целью матрица [X] умножается слева на ее транспонирован­ ный аналог [АГ|Г-

2. Для ковариационной матрицы [С] вычисляются ее собствен­ ные значения и собственные векторы. В результате получается мат­ ричное уравнение [С] = [W]T [Л] [W], где [И^-матрица нагрузок, то есть координат собственных векторов со^ ковариационной матрицы

[С] размерностью т х п\ [Л]-диагональная матрица размерностью т х т главная диагональ которой представлена собственными зна­ чениями ковариационной матрицы (Х; ). В этой матрице столбцы

значений Xj упорядочены (ранжированы) по убыванию собствен­

ных значений векторов.

3.По суммарной величине вкладов первых главных компонент,

сучетом целей и задач исследования, решается вопрос о минимиза­ ции пространства признаков и составляется матрица главных ком­ понент [F] размерностью п х р , где р < т (в большинстве случаев принимается равным 2 , реже 3).

Рассмотрим пример использования метода главных компонент

при интерпретации геохимических данных. На одном из месторож­ дений редкометалльных пегматитов было установлено, что первич­

ные ореолы рассеяния многих элементов отличаются сложным строением и нечеткими границами.

Результаты изучения корреляционных связей дают возмож­ ность предполагать значительное влияние фактора удаленности от рудного тела на содержание всех указанных химических элементов в пробах вмещающих пород. Компонентный анализ позволил вы­ явить пять главных компонент, из которых существенной является только первая. Ее дисперсия составляет 67 % от суммарной диспер­ сии. Первая главная компонента отрицательно связана с удаленно­ стью. Эта компонента отражает общий характер размещения эле­ ментов-индикаторов редкометалльного оруденения в первичных ореолах рассеяния и может быть с успехом использована для их вы­ деления.

Метод главных компонент используется в качестве основы факторного анализа многомерных совокупностей. В практике ис­ пользуются два метода факторного анализа: /?- и <3«метод. Сущ­ ность Л-метода, основанного на использовании не ковариационной, а корреляционной матрицы, близка к задаче метода главных компо­ нент, но в отличие от него факторный анализ считается статистиче­ ским методом. Обычное допущение состоит в том, что связи между т переменными ставятся в зависимость от корреляционных связей каждой из переменных с р взаимно некоррелированными фактора­ ми при р < т. Поэтому дисперсия для т переменных вычисляется как сумма дисперсии р , так называемых «общих факторов» и неза­ висимой от них суммарной добавки от т случайных переменных - «фактора специфичности».

Вычисление нормализованных собственных значений и собст­ венных векторов корреляционной матрицы имеет свои специфиче­ ские особенности. Процедура стандартизации позволяет считать собственные векторы корреляционной матрицы факторами, а их нагрузки, полученные умножением каждой компоненты нормализо­ ванного собственного вектора на квадратный корень из соответст­ вующего собственного значения, факторными нагрузками. Суммы квадратов факторных нагрузок по одному фактору равны их собст­ венным значениям. Суммы квадратов факторных нагрузок по каж­ дой переменной (признаки) называются «общностями», которые обеспечивают одинаковые суммы вкладов переменных в факторы.

Поскольку значения общностей зависят от числа сохраненных фак­ торов /?, этот вопрос приобретает в факторном анализе принципи­ альное значение (хотя и не имеет строгого однозначного решения).

Для более содержательной интерпретации результаты фактор­ ного анализа подвергаются процедуре «вращения» вокруг центра координат для выявления наиболее контрастных сочетаний фактор­ ных нагрузок.

Использование метода главных компонент для целей фактор­ ного анализа рассмотрим на примере Нерюндинского железорудно­ го месторождения - крупнейшего месторождения Ангаро-Катского района Иркутской области. В его геологическом строении прини­ мают туфогенные отложения корвучанской свиты, песчано-аргил­ литовые породы буркуглинской свиты и аргиллиты катской свиты. На месторождении широко развиты интрузии траппов. В структуре месторождения главную роль играет крупный разлом широтного простирания, пересекающий вулканические трубки, картируемые по наличию витро- и литокластических туфов, прослеживающихся до глубины 800 м. Рудные тела месторождения, представленные метасоматическими залежами брекчиевидно-вкрапленных руд и магнетитовыми жилами, залегают в породах, существенно изме­ ненных пневмогидротермальными растворами и преобразованных в скарны и скарноподобные или скарнированные породы.

Значительная часть руд месторождения подвергнута окисле­ нию, что осложняет изучение качества руд. Качество руд месторо­ ждения в значительной степени определяется многочисленными природными факторами: конкретной геолого-структурной позицией месторождения, интенсивностью развития дорудных и пострудных метасоматических процессов, геохимической обстановкой и др.). Чтобы установить, какие факторы сыграли решающую роль в фор­ мировании железорудного месторождения, мы обратились к методу главных компонент, позволяющему разложить ковариационную или корреляционную матрицу и сопоставить эти составляющие с реальной обстановкой и существующими генетическими пред­ ставлениями.

Исходным материалом для решения поставленной задачи яви­ лись результаты химических анализов групповых проб, проведен­ ных на 12 элементах и оксидах.

По общепринятой схеме факторного анализа были получены парные корреляционные коэффициенты, главные компоненты, фак­ торные нагрузки, дисперсии и значения главных компонент во всех точках наблюдений.

Первая компонента, учитывающая 42 % от суммарного воздей­ ствия на изученные признаки всей совокупности, определяет общий характер оруденения. Положительные значимые факторные нагруз­ ки, являющиеся коэффициентами корреляции между параметрами и главной компонентой, характеризуют привнос железа и марганца. В то же время отрицательные значения факторных нагрузок свиде­ тельствуют о выносе ряда оксидов.

Вторая и третья компоненты раскрывают роль кальциево­ магниевого и калиевого метасоматоза, предшествующего рудообразованию.

Построенная на разрезе тренд-поверхность первой главной компоненты отражает особенности размещения железного орудене­ ния.

g -метод факторного анализа предназначен для исследования соотношений не между переменными, а между наблюдениями. Его цели сводятся к размещению последовательностей наблюдений

вразумном порядке, то есть к установлению связей между ними. Таким образом, цель g -метода факторного анализа, по существу, совпадает с целью кластер-анализа, однако для его выполнения тре­ буется значительно больше машинного времени.

Сущность R- и g -методов факторного анализа изложена в ра­ боте Дж. Дэвиса, а с методикой их проведения можно ознакомиться

вработах У. Крамбейна и Ф. Грейбилла, Д. А. Родионова.

3.11. Область применения многомерных

статистических моделей в геологии

Возможности применения многомерных статистических моде­ лей для изучения взаимозависимостей комплексов самых различ­ ных геологических признаков практически не ограничены для лю­ бой отрасли геологии. В палеонтологии они используются для ста­ тистического описания морфологических признаков ископаемых форм организмов и сопоставления их групп с литолого-фаци-

альными разрезами осадочных пород с целью оценки достоверности их стратиграфического положения (или установления групп руко­ водящих ископаемых). Корреляционные методы парагенетического анализа химических элементов и минералов находят широкое при­ менение в геохимии и минералогии. Различные методы многомер­ ного описания самых различных физических свойств, химического и минерального состава осадочных и магматических пород исполь­ зуются в литологии и петрографии для разделения их по фациаль­ ным или формационным признакам или для оценок их перспектив на выявление самых различных полезных ископаемых. С каждым годом все шире применяются методы «распознавания образов» ру­ доносных территорий или месторождений полезных ископаемых, которые основаны на статистических описаниях сочетаний благо­ приятных элементов геологического строения, влияющих на кон­ центрации полезных ископаемых. В настоящее время алгоритмы «распознавания образов», использующие самые различные стати­ стические, логические и эвристические многомерные модели, реа­ лизуются в человекомашинных информационно-прогнозирующих системах, нашедших широкое применение в геологоразведочной отрасли.

Многомерные статистические описания связей геологических переменных с последующими оценками степени их взаимозависи­ мости, используются в геологической практике с целью идентифи­ кации (отождествления), дискриминации (разделения), классифика­ ции (группирования) изучаемых объектов или в поисках наиболее информативных комбинаций признаков для решения прогнозных задач.

Задачи идентификации геологических объектов, например оценка коллекторских свойств или газоносности пород по совокуп­ ности скважинно-геофизических характеристик, обычно выполня­ ются с помощью моделей множественной регрессии. В целях дис­ криминации геологических объектов на два заранее заданных клас­ са, например, разделение кимберлитовых пород на алмазоносный и неалмазоносный типы по данным их силикатных анализов, может быть использована модель линейной дискриминантной функции. Классификация геологических объектов, например иерархическое группирование парагенетических ассоциаций элементов метасома­

тически измененных пород или руд по данным их полных химиче­ ских анализов, производится с помощью кластер-анализа, других методов многомерного корреляционного анализа или 0 -метода факторного анализа.

Конечной целью большинства многомерных статистических методов является предсказание (прогнозирование) тех или иных свойств изучаемых геологических объектов.

Прогнозирование свойств геологических объектов, чаще всего выявление перспектив их рудоносности или оценка вероятных масштабов оруденения, проводится с помощью алгоритмов «распо­ знавания образов».

В зависимости от характера исходных данных и целей геологи­ ческих исследований для составления этих алгоритмов используют­ ся самые различные многомерные модели. При этом, как правило, возникает проблема поиска наиболее информативных сочетаний признаков и сокращения размерности их пространства, что достига­ ется с помощью метода главных компонент, /?-метода факторного анализа или других логических и эвристических методов.

Возможности использования многомерных статистических мо­ делей для целей решения геологических задач изучены в настоящее время далеко не полностью и, несомненно, имеют большое буду­ щее.

Контрольные вопросы

1.Какие геологические условия благоприятствуют применению многомерных статистических моделей?

2.В чем разница между парным и частным коэффициентами корреляции?

3.Какие зависимости можно оценить с помощью множествен­ ного коэффициента корреляции?

4.Какие статистические методы могут использоваться для вы­ деления взаимосвязанных ассоциаций химических элементов?

5.В чем преимущество и недостатки методики графов?

6 . Каковы принципы и области применения кластер-анализа? 7. Для решения каких геологических задач эффективно исполь­

зование множественных регрессионных моделей?

8 . На чем основаны «методы распознавания образов» и каковы возможности их использования для решения геологических задач?

9. Какие многомерные статистические модели применяются для оценки параметров рудоносности территорий?

10.В чем заключаются основные сложности оценки информа­ тивности геологических признаков?

11.Для решения каких геологических задач могут быть ис­ пользованы модели линейных дискриминантных функций?

12.В чем смысл использования метода главных компонент?

13.Какие виды факторного анализа основаны на положениях метода главных компонент?

14.Какие геологические задачи решаются с применением фак­ торного анализа?

15.К чему сводятся задачи идентификации, дискриминации

иклассификации изучаемых геологических объектов и какие мате­ матические модели пригодны для их решения?

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]