Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Математические методы моделирования в геологии..pdf
Скачиваний:
45
Добавлен:
15.11.2022
Размер:
8.08 Mб
Скачать

2.9.Однофакторный и двухфакторный дисперсионный анализ

вгеологии

Свойства геологических объектов, как и любой другой сложной природной системы, обычно зависят от ряда факторов, обусловли­ вающих их изменчивость. Выявление этих факторов и оценка сте­ пени их влияния на изменчивость (неоднородность) свойств изу­ чаемых объектов осуществляется с помощью дисперсионного ана­ лиза.

Этот статистический метод основан на следующем принципе: если на случайную величину действуют взаимонезависимые факто­ ры А, В, ..., Д то общую дисперсию этой случайной величины а 2 можно рассматривать как сумму дисперсий а 2 = а 2 + а 2в +

По количеству оцениваемых факторов дисперсионный анализ подразделяется на одно-, двух- и многофакторный.

Каждый фактор представляет собой переменную дискретную или непрерывную величину, которая разделяется на определенное количество постоянных интервалов (уровней). Если количество за­ меров изучаемой случайной величины на всех уровнях по всем фак­ торам одинаковое, дисперсионный анализ принято называть равно­ мерным, а если разное - неравномерным.

Суждение о влиянии определенного фактора или комбинации факторов на изменчивость изучаемой случайной величины основа­ но на группировке ее замеров по факторам и их уровням и проверке гипотезы о равенстве дисперсий, обусловленных данными факто­ рами, с остаточной (случайной) дисперсией, вызванной неучтенны­ ми факторами. Если гипотеза отвергается, то делается вывод о том, что данный фактор или взаимодействие факторов оказывают суще­ ственное влияние на изменение изучаемого свойства геологическо­ го объекта.

С помощью дисперсионного анализа решается широкий круг геологических задач:

-проверяются гипотезы о влиянии литологических, петрофи­ зических, геохимических, структурных и других факторов на лока­ лизацию оруденения;

-выявляются элементы зональности различных геологических

объектов;

-определяется влияние способа отбора проб на их достовер­ ность и представительность;

-оценивается влияние ландшафтных условий на интенсив­ ность проявления различных поисковых признаков;

-решается вопрос о влиянии гипергенных процессов на каче­

ство руд; - выявляются факторы, определяющие прочностные свойства

грунтов и пород и т. д.

При равномерном однофакторном дисперсионном анализе слу­ чайной величины х относительно фактора А, имеющего к уровней при количестве замеров на каждом уровне, равном л, результаты наблюдений обозначаются как x,j, где i - номер наблюдения (i = 1, 2 ,

..., л), a j - номер уровня фактора (/' = 1, 2 , ..., к),

и записываются

в виде табл. 4.

 

 

Таблица 4

 

 

 

Однофакторный дисперсионный анализ

Номер изменения

 

Уровень фактора

 

Ах

А г

A k

1

*11

*12

*1*

2

*21

*22

*2*

п

*л1

*п2

Хпк

Групповые средние

*\

 

**

По этим данным рассчитываются следующие статистики:

1) общая сумма квадратов отклонений наблюдаемых значений признака от общей средней:

с обШ= £ Х ( * о = *)1’

j =I <=i

2 ) факторная сумма квадратов отклонений групповых средних от общей средней, характеризующая рассеяние между группами:

к

СфЛКГ= п ^ ( х ( - х ) 2;

У = 1

3 )

остаточная сумма квадратов отклонений наблюдаемых зн

чений от своей групповой средней, характеризующая рассеяние

внутри групп:

 

 

 

 

И

П

п

~ Хк)>

 

Сост = £ (* ,,-* > )

■*"

С*/2 *2 ) •••

 

/=1

/=1

/=1

 

4)

общая, факторная и остаточная дисперсии:

 

 

 

V2

=- •"общ

 

 

 

о6щ

к ( п - \ ) ’

 

 

 

пт2

с

 

 

 

_ __факт_.

 

 

 

факт~ ( * - 1) ’

 

 

 

о 2 _

^ о ст

 

 

 

ост

* (и - 1) ’

 

5)

значение критерия Фишера:

 

F =

Значение критерия Фишера сравнивается с критическим значе­ нием для заданного уровня значимости а и числа степеней свободы

(к - 1) и к ( п - 1).

При неравномерном однофакторном дисперсионном анализе, когда количество наблюдений на уровне А\ равно п\, на уровне Л2 -

 

 

к

п2, ..., на уровне Ак - и*, а общее их число N= У я , факторная и

 

 

/=1

остаточная дисперсии находятся по формулам

 

_ 82,35

1,92;

 

х =-------

 

43

 

V2 - 6,70 + 3,61 + 4,26

14,57

°о6щ -

42

= 0,347 ;

 

42

с 2 15(1,51 - 1,92)2 +14(1,99 -1,92)2 +14(2,27 -1,92)2

факт -

«

 

2,52 + 0,07 + 1,72 4,31 = 2,155

4040

£k = i L 5 i = 8 ,45.

S l 0.255

При (,= £ -1 = 2, ( 2= N —k = 40 и а = 0,05 FKp = 3,24, а при а = 0,01 Ftp = 5,18.

Остальные операции выполняются так же, как при равномер­ ном анализе.

Пример. При изучении гидротермального свинцово-цинкового месторождения в гранитах высказано предположение, что на ин­ тенсивность процесса рудоотложения влияла степень предрудного метасоматического изменения пород. Для проверки этой гипотезы результаты опробования на свинец по 43 разведочным пересечени­ ям были разделены на три группы: в слабо измененных (уровень Ai), в средне измененных (уровень Аг) и сильно измененных (уровень AjJ гранитах.

Таким образом, с достаточно высокой доверительной вероят­ ностью гипотеза об отсутствии влияния степени метасоматиче­ ского изменения гранитов на содержание свинца в руде отвергает­ ся, и предрудный метасоматоз должен рассматриваться как один из ведущих рудоконтролирующих факторов.

Вычислительные операции при однофакторном дисперсионном анализе можно упростить, используя равенство Сост = СобщСфакт.

При двухфакторном дисперсионном анализе сумма квадратов отклонений от общего среднего разделяется на компоненты, отве­ чающие двум предполагаемым факторам изменчивости - А и В. Ес­ ли по фактору А выделяется р уровней, а по фактору В - q уровней, то общее количество групп будет равно т =pq, а исходные данные можно записать в виде табл. 5.

 

 

 

 

 

Таблица 5

 

Двухфакторный дисперсионный анализ

 

 

Уровень фактора В

Среднее

Номер изменения

В2

... В/

... в ч

 

Вх

 

А,

*11

*12

ХУ

*2V

 

А г

*21

*22

ХУ

*2q

*2

А,

*/1 */2

x p j

* /< 7

Ар

*р1

*р2

x p j

x p q

* P

Среднее

*1

*2

* j

 

X

 

 

 

 

 

Если для каждого сочетания факторов A,Bj произведено по и наблюдений (двухфакторный дисперсионный анализ с повторени­ ем), то в каждую клетку табл. 23 помещается п значений, а единич­ ное наблюдение обозначается как xjjk, где к - 1, 2, ..., п. Оценки средних значений по группам (ху), по факторам (х ,... и Ху) и об­ щее среднее ( х ) в этом случае рассчитываются по формулам

х

 

 

1

Ч П

1 Ч

f<-=—

у=1 к=1

Ч j=\

Чп

1 Р п

1 Р

* . j . =--ZZxv*— Ь г

Рп м м

Р м

Проверка гипотезы о влиянии на изменчивость изучаемого свойства каждого фактора в отдельности и их совместного влияния производится по критерию Фишера:

Ч2 S2

s;

Полученные значения F-критерия сравниваются с критическим для заданного уровня значимости и числа степеней свободы.

При расчете F-критерия в данном случае в знаменателе всегда берется остаточная дисперсия. Поэтому его значение иногда может получаться меньше 1.

Приведенные схемы дисперсионного анализа основаны на свойствах нормального закона распределения и предположении о равенстве дисперсий на разных уровнях одного и того же фактора. Однако F-критерий по выборкам достаточно большого объема ус­ тойчив и для совокупностей, умеренно отклоняющихся от нормаль­ ных. Умеренное различие в дисперсиях также не является препятст­ вием для его применения при условии приблизительного равенства объемов выборок по группам. Если возможность применения F-критерия все же вызывает сомнения, можно воспользоваться непараметричскими критериями.

Однофакторный непараметрический дисперсионный анализ

с применением критерия Краскала-Уоллиса включает следующие операции:

- ранжирование всех наблюдений по возрастанию от 1 до N,

к

где У = - объем всей выборки;

7=1

-нахождение сумм рангов Ru R2, .... F* для каждого уровня анализируемого фактора;

-вычисление критерия Краскала-Уоллиса по формуле

12

D2

(— +... + — ) - 3(N +1);

Н =-

N(N + 1)

п,

- сравнение полученного значения Н с его критическим значе­ нием (Нк) для принятого уровня значимости а.

При достаточно большом объеме выборки, когда количество наблюдений по каждому уровню превышает 5, значение Нк опреде­

ляется по таблицам распределения %2 для числа степеней свободы

/ = k —l , где к - количество уровней исследуемого фактора.

Если рассчитанное значение критерия Н превышает НК, то ги­ потеза об отсутствии влияния анализируемого фактора на изменчи­ вость изучаемого свойства отвергается.

При двухфакторном непараметрическом анализе Фридмана

исходные данные записываются в виде табл. 6 .

Таблица 6

Схема вычисления дисперсий при двухкратном дисперсионном анализе

Вид дисперсии

Сумма квадратов отклонений

Факторная

С, = n q j t ( x L - х ) 2

 

по фактору А

 

 

 

1=1

 

 

Факторная

С2 = пр i j ( X j - x j

 

по фактору В

 

 

 

 

 

 

Смешанная

Съ = п Z

Z

 

x L - X j

 

по факторам

-

+ x f

АВ

 

 

 

 

 

Остаточная

c = 4 ,

1,

 

 

 

 

 

 

 

Общая

P

4

n

/

\ 2

c = £

5

 

 

 

 

 

 

 

Число

степеней

свободы

P- 1

<7-1

(р- D (</-D

p q ( n - l)

npq—l

Дисперсия

s i - c '

1P-1

=Cz

2<7-1

3 (p -l)(9 -l)

p2

C4

4

P<7(« -1)

2

C

s 2

= --------

 

iipq -1

Для проверки влияния фактора А значения в строках таблицы ранжируются, то есть заменяются цифрами от 1 до q. По каждому

столбцу вычисляется сумма рангов Rj ( j =

р),

рассчитывается

статистика S = (Я,2+ . . . + + . . . + /? ,) 2 /<7

и

критериальная

статистика %2R= 1 2 S / pq(q + 1).

 

 

Для количества уровней по факторам А или В больше 4, крити­

ческое значение статистики определяется по таблицам критерия

X2 . Для количества степеней свободы { = q -1, а при малом количе­ стве уровней используются специальные таблицы .

Для проверки гипотезы о влиянии фактора В строки и столбцы в табл. 6 меняются местами.

Использованный в данной главе математический аппарат опи­ сан в специальных пособиях по теории вероятностей и математиче­ ской статистике. Приемы первичного анализа результатов массовых наблюдений подробно рассмотрены в монографии Дж. Тьюки. Много полезных рекомендаций по вычислительным методам стати­ стики можно почерпнуть из справочника Дж. Полларда.

Применению статистических методов при геохимических ис­ следованиях посвящены работы В. Н. Бондаренко, Д. А. Родионова. Многочисленные примеры использования одномерных статистиче­ ских моделей в различных областях геологии приведены в моно­ графиях Р. Миллера и Дж. Кана, У. Крамбейна и Ф. Грейбилла, Дж. Дэвиса.

Статистическому анализу угловых величин посвящена моно­ графия К. Мардиа.

Контрольные вопросы

1.Почему при изучении свойств геологических объектов мож­ но применять методы математической статистики?

2.Какие требования предъявляются к выборочной геологиче­ ской совокупности при статистическом моделировании?

3.Какие свойства геологических объектов можно описать не­ прерывными случайными величинами, а какие - дискретными?

4.Какие геологические задачи можно решать с помощью гис­

тограмм и кумулят?

5.Какие статистические законы распределения используются

вгеологии?

6. Как проверяются гипотезы о типе статистического распреде­

ления?

7. Для чего рассчитываются точечные и интервальные оценки свойств геологических объектов?

8 . Как строятся доверительные интервалы оценок средних зна­ чений в условиях нормального, логнормального, биномиального закона и распределений Пуассона и Мизеса?

9. Какие типы геологических гипотез можно проверять стати­ стическими методами?

10.Чем отличаются параметрические критерии согласия от не­ параметрических?

11.Чем различаются ошибки первого и второго рода при стати­ стической проверке гипотез?

12.Какие геологические задачи решаются путем проверки ги­ потез о равенстве средних?

13.Для чего используются критерии Стьюдента, Ван-дер- Вардена, Родионова, Вилкоксона, Ватеона-Вильямса, Вилера- Ватсона-Ходжеса?

14.Какие геологические задачи решаются путем проверки ги­ потез о равенстве дисперсий?

15.Для чего используются критерии Фишера, Сиджела-

Тьюки?

16.Какие геологические задачи решаются с помощью критери­ ев Смирнова и Фергюссона?

17.Какие геологические задачи решаются с помощью однофак­ торного и двухфакторного дисперсионного анализа?