Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Статистика и анализ геологических данных

..pdf
Скачиваний:
2
Добавлен:
12.11.2023
Размер:
21.12 Mб
Скачать

последовательностями, с помощью машины будет проведена геологическая корреляция. Однако особенности стратиграфиче­ ских данных накладывают серьезные ограничения на автокор­ реляцию. В теории временных рядов предполагается, что интер­ вал между наблюдениями остается постоянным для всей по­ следовательности. Это означает, что, сравнивая два различных ряда, мы можем предполагать, что расстояния между наблю­ дениями в них одинаковы. Эти условия в стратиграфических последовательностях часто нарушаются. Неизбежно один раз­ рез вытягивается по отношению к другому, а нередко одни части разреза растягиваются, а другие сжимаются. По этой причине невозможно приводить в соответствие с одним и тем же лагом все эквивалентные части двух рядов. Еще отчетли­ вее, чем пики с высокой корреляцией, коррелограмма укажет нам границы областей со слабой положительной корреляцией. Последние редко являются значащими в статистическом смысле (критерии значимости, по-видимому, теряют силу, так как из-за неравномерности временной шкалы нарушаются фундаменталь­ ные допущения о природе временных рядов), и коррелограмма мало что дает для исследования корреляции в геологическом смысле.

В некоторых случаях картина не столь мрачна, и взаимная корреляция (так называют иногда сравнение двух временных рядов) позволяет получить ценную геологическую информацию. На американском континенте на больших площадях развиты однородные палеозойские отложения. Последовательность изме­ нения известняков и сланцев трудно коррелируема от скважины к скважине, в особенности на площадях с редким опробова­ нием, так как трудно сделать выбор между многими вариан­ тами пар сопоставляемых разрезов. Взаимная корреляция мо­ жет помочь при решении такого рода корреляционных геоло­ гических задач, но использовать ее надо осторожно. В табл. 5.18 приведены данные электрокаротажа скважины, пробуренной в пенсильванских отложениях (северо-восточный Канзас). Попытки скоррелировать эту скважину со скважиной в штате Айова, значения сопротивления пород которой приведены в табл. 5.16, по данным электрокаротажа оказались безуспеш­ ными из-за того, что обнаружилось много участков сравнивае­ мых разрезов с возможной корреляцией. Мы попытаемся объяс­ нить ситуацию с помощью метода взаимной корреляции.

Однако, для того чтобы провести взаимный корреляционный анализ, нужно несколько видоизменить метод, сдвинув после­ довательности так, чтобы одна шла вслед за другой. Обе после­ довательности не обязательно имеют одну и ту же длину, и это влияет на число п в формуле корреляции. Следовательно, для того чтобы получить всевозможные сравнения временного ряда

с самим собой, достаточно вычислить значения автокорреляци­ онной функции только для положительных значений лага от О до +п . Однако в случае если сравниваются различные ряды, то необходимо вычислить также взаимные корреляции для от­ рицательных значений лага. Причина этого поясняется на фиг. 5.20. Вся длина одной цепи должна быть сдвинута вдоль второй, если требуется провести их полное сравнение. В случае если две цепи идентичны, т. е. автокорреляционно связаны, то это отражается в коррелограмме, которая является зеркаль­ ным отражением относительно нулевого лага. В анализе взаим­ ной корреляции это не так, потому что мы не знаем положения полной эквивалентности или теоретического нуля лага. Выпол­ няя анализ взаимной корреляции, мы попытались определить этот теоретический нуль. Так как одна последовательность сдвигается на всю длину другой, а не на какой-либо лаг по отношению к взаимному начальному расположению, мы прово­ дим последовательное сравнение парных позиций, а не просто отрезков, полученных один из другого сдвигом на некоторый лаг.

Определение коэффициента взаимной корреляции такое же, как и определение обычного коэффициента корреляции, и лишь

Т а б л и ц а 5.18

Результаты измерений электрического сопротивления

в нефтяной скважине в северо-восточном Канзасе

(Верх разреза)

50,0

26,7

36,5

27,9

 

50.0

25,8

41,6

29,9

 

49.6

25,6

49,3

28,6

 

48.9

26,3

49,1

28,1

 

48.1

25,8

48,4

26,8

 

46.9

25,4

48,5

21,9

 

43.3

25,6

48,4

19,6

 

43.4

25,0

47,7

19,5

 

41.9

25,0

45,9

22,1

 

37.6

35,0

21,1

29,1

 

37.5

44,7

17,0

42,3

 

37.4

45,2

16,6

41,6

 

36.9

45,0

18,1

38,4

 

28,0

42,8

23,7

30,2

 

20.4

42,2

22,1

26,1

 

19.3

41,3

21,8

22,8

 

18.9

40,5

20,6

21,9

 

19,0

37,2

17,7

23,9

 

20.4

32,9

18,7

24,8

 

21.4

28,3

18,6

23,9

 

22.4

18,4

17,1

24,8

 

24.4

18,8

16,3

23,9

 

24.9

18,2

25,1

25,1

 

24,3

18,4

29,3

24,3

 

24,2

18,2

28,9

25,8

39,0

17,8

30,9

34.3

45,9

24,1

38,8

34.4

47,6

30,0

40,5

34.6

47,4

32,8

43,0

38.0

47,2

33,1

49,4

48.6

46,7

32,3

49,5

49.3

46,8

30,1

48,3

50.7

47,4

26,1

49,1

51.2

47,0

19,8

48,4

51.7

46,0

20,3

46,7

52.4

43,0

19,4

42,7

52.8

41,0

17,2

38,3

52.6

39,6

15,4

37,9

52.9

45,1

15,8

31,3

54.3

47,0

18,2

42,5

54.4

46,9

23,8

39,0

54.6

46,7

38.4

38,4

54.6

46,3

38.5

41,4

54,2

43,9

34.4

42,7

53.9

41,4

47,0

41,8

50.4

40,8

47,0

37,3

48.1

39,9

46,1

28,3

(Основание разреза)

немного отличается от коэффициента автокорреляции. Если мы введем обозначения Yu и Y21 для двух рядов и определим п* как число перекрывающихся позиций в двух цепях, то взаимная корреляционная функция для m сходных позиций вычисляется по формуле

_______n*SY!Y2-

SYi XY2______

(5.46)

V [n * SYJ - (S Y ,)2]

[n ’ S Y j - (SY2) 2]

 

или

 

 

 

Гщ

COVi,2

(5.47)

Si • s2 •

 

 

где COVi>2 — ковариация перекрывающихся участков двух по­ следовательностей и Si и s2 — стандартные отклонения пере­ крывающихся отрезков последовательностей 1 и 2. Заметим, что суммирования происходят только по таким отрезкам двух последовательностей, которые перекрываются в спаренной по­ зиции.

Так как суммирования распространяются только на перекры­ тый отрезок, то вычисление коэффициента взаимной корреля­ ции основывается на дисперсии, вычисленной по общим точ­ кам. Наоборот, коэффициент автокорреляции вычисляется с по­ мощью дисперсии, вычисленной по всей цепи. Дисперсия используется в знаменателе определяющего автокорреляцион­ ного уравнения и считается постоянной для всех значений лага. Дисперсия, вычисленная для целой последовательности, более

Парная позиция

Фиг. 5.21. Взаимная корреляция двух данных последовательностей А и В.

Последовательность А изображена в нескольких сравниваемых положениях. Взаимная корреляция указывает на сходство двух последовательностей во всех парных позициях.

устойчива, чем оценка, полученная для более короткого отрезка этого ряда, и поэтому является более предпочтительной. Однако при вычислении коэффициентов взаимной корреляции не сле­ дует ожидать, что дисперсии будут постоянными на протяжении обеих цепей, в особенности в том случае, когда одна из цепей является более короткой по сравнению с другой.

В формулах (5.46) и (5.47) вторые индексы переменных Yi и Y2 опущены, так как их выражение сложно для неравных длин цепей. При этом подразумевается, что коэффициент ко­

вариации (числитель) и стандартные

отклонения двух цепей

(в знаменателе) вычисляются только

по перекрытому отрезку.

В перекрытии содержится п* пар наблюдений. Первые позиции нумеруются последовательно, как это указано на фиг. 5.21, и взаимная корреллограмма является графиком парных положе­ ний по отношению к взаимной корреляции.

Значимость коэффициента взаимной корреляции можно уста­ новить с помощью приближенного критерия

(5.48)

С

С

С

С

С

C

C

С

C

C

C

C

C

С

С

С

C

C

C

C

C

C

о о о о

PROGRAM

5 . 9

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

R O U T I N E

CROSCR

 

 

 

 

 

 

 

 

 

 

 

 

 

 

PROGRAM Т О

PERFORM

C R O S S C O R R E L A T IO N BETWEEN TWO

SEQUENC ES O F DATA

X I N I

C O N T A I N S

TH E F I R S T

DATA SEQUENCE

O F N I N 1

E L E M E N T S .

 

X I N2

I S

T H E SECOND DATA

SEQUENC E

O F LEN G T H

N I N 2 .

 

 

 

T H E

C O R R E L A T I O N

C O E F F I C I E N T S C A L C U L A T E D A T

EACH

MATCH

P O S I T I O N

ARE

STO RED

I N

A R R AY

X O U T .

T H E

NUMBER O F

C O R R E L A T IO N

C O E F F I C I E N T S

I N

XOUT

I S

NOT

=

N I N I + N I N 2 - 5

 

 

 

 

 

 

 

 

 

 

I B I

=

F I R S T

TERM

OF

X I N I

I N

T H E O V E R L A P P E D

SEGMENT

 

 

I E l

=

L A S T

TERM

O F

X I N I

 

I N

T H E

O V E R L A P P E D

SEGMENT

 

 

I B 2

=

F I R S T

TERM

OF

X I N 2

I N

T H E O V E R L A P P E D

SEGMENT

 

 

I E 2

=

L A S T

TERM

O F

X I N2

I N

T H E O V E R L A P P E D

SEGMENT

 

 

L E N I

=

NUMBER

OF

TERMS

O F

X I N I

I N

TH E

O V E R L A P P E D

SEGMENT

 

L E N 2

=

NUMBER

O F

TE RMS

OF

X I N 2

I N

TH E

O V E R L A P P E D

SEGMENT

 

T H E

S U B R O U T IN E S R E Q U I R E D

ARE R E A D M . P R I N T M ,

AND

T S P L O T .

 

 

TH E

M AXIM U M

LEN G T H OF EACH

I N P U T

DATA

SEQ UENC E

I S 5 0 0

E L E M E N T S .

 

D I M E N S I O N X I N I ( 5 0 0 ) , X I N 2 ( 5 0 0 ) , X O U T ( I 0 0 0 )

 

 

 

 

 

READ I N TH E TWO

DA TA SEQUENC ES T O BE C R O S S C O R R E L A T E D ,

P R I N T

 

THEM O U T ,

AND

P LO T

THEM

ON

T H E

L I N E

P R I N T E R .

 

 

 

 

C A L L R E A D M ( X I N I , M I N I , M N , 5 0 0 , I )

 

 

 

 

 

 

 

 

C A L L P R I N T M ( X I N I , N I N I , M N , 5 0 0 , I )

 

 

 

 

 

 

 

W R IT E ( 6 , 2 0 0 2 )

 

 

 

 

 

 

 

 

 

 

 

 

 

C A L L T S P L O T ( X I N I , N I N I , 2 )

 

 

 

 

 

 

 

 

 

 

W R IT E ( 6 , 2 0 0 4 )

 

 

 

 

 

 

 

 

 

 

 

 

 

C A L L R E A D M ( X I N 2 , N 1 N 2 , M N , 5 0 0 , I )

 

 

 

 

 

 

 

 

C A L L P R I N T M ( X I N 2 , N I N 2 , M N , 5 0 0 , 1 )

 

 

 

 

 

 

 

W R IT E ( 6 , 2 0 0 3 )

 

 

 

 

 

 

 

 

 

 

 

 

 

C A L L T S P L O T ( X I N 2 , N I N 2 , 2 )

 

 

 

 

 

 

 

 

 

 

W R IT E ( 6 , 2 0 0 5 )

 

 

 

 

 

 

 

 

 

 

 

 

 

W R IT E ( 6 , 2 0 0 0 )

 

 

 

 

 

 

 

 

 

 

 

 

 

N O T = N I N I + N I N 2 - 5

 

 

 

 

 

 

 

 

 

 

 

 

 

I В I = 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

I E l = 3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

I B 2 = N I N 2 - 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

I E 2 = N I N 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

L E N I = 3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

DO

I 0 0 1 = 1 , NOT

 

 

 

 

 

 

 

 

 

 

 

 

 

S X = 0 . 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S Y = 0 . 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S X Y = 0 . 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S X X = 0 . 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S Y Y = 0 . 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

DO

101 J = I , L E N I

 

 

 

 

 

 

 

 

 

 

 

 

 

J I = I B 1 + J - 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

J 2 = I B 2 + J - I

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S X = S X + X I N I ( J 1 )

 

 

 

 

 

 

 

 

 

 

 

 

 

S Y = S Y + X I N 2 ( J 2 )

 

 

 

 

 

 

 

 

 

 

 

 

 

SX Y = S X Y + X I N 1 ( J l ) * X I N 2 ( J 2 )

 

 

 

 

 

 

 

 

 

S X X = S X X + X I N I ( J I ) * * 2

 

 

 

 

 

 

 

 

 

 

 

S Y Y = S Y Y + X I N 2 ( J 2 ) * * 2

 

 

 

 

 

 

 

 

 

 

 

101 C O N T IN U E

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

A N = L E N I

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

R = ( A N * S X Y - S X * S Y ) / S Q R T ( ( A N * S X X - S X * S X ) * ( A N * S Y Y - S Y * S Y > '

 

 

T = R * S Q R T ( ( A N - 2 . 0 ) / ( I . 0 - R * R ) )

 

 

 

 

 

 

 

 

X O U T ( I ) = R

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

W R IT E ( 6 , 2 0 0 1 ) I , I B I , I E I , I B 2 , I E 2 , L E N I , R , T

 

 

 

 

 

I E

I = I E I +

I

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

I F

( I E I - N I N I ) 2 , 2 , 1

 

 

 

 

I B 1 = I B 1 + |

 

 

 

 

 

 

 

I E l = N I N I

 

 

 

 

 

 

2

I B 2 = I B 2 - I

3 , 3 , 4

 

 

 

 

 

 

I F

( I B 2 )

 

 

 

 

 

3

I B 2 = 1

 

 

 

 

 

 

 

 

I E 2 = I E 2 - 1

 

 

 

 

 

 

4 L E N 1 = I E I - I B I +1

 

 

 

 

 

 

L E N 2 = I E 2 - I B 2 + 1

 

 

 

 

 

5

I F ( L E N I - L E N 2 ) 5 , I 0 0 , 6

 

 

 

 

I B

1= 1

 

 

 

 

 

 

 

 

IE2=IE2-I

 

 

 

 

 

 

 

GO

TO

4

 

 

 

 

 

 

6

I B I = I B I + I

 

 

 

 

 

 

 

I E 2 = N I N 2

 

 

 

 

 

 

I 0 0

CO

TO

4

 

 

 

 

 

 

C O N T IN U E

 

 

 

 

 

 

 

C A L L T S P L O T ( X O U T , N O T , I )

 

 

 

 

W R I T E ( 6 , 2 0 0 6 )

 

 

 

 

 

 

C A L L

E X I T

 

 

 

 

 

 

2 0 0 0

F O R M A T ! I H I , I 4 X , ' T E R M S

WHICH

ARE M A T C H E D ' , 7 X , ' N U M B E R ' /

 

I 4 X , ' M A T C H ' , 8 X , ' F I R S T ' , 9 X , ' S E C O N D ' , 6 X , ' O F T E R M S ' ,

 

2 3 X , ' C O R R E L A T I O N ' , 7 X , ' T ' / 3 X , ' P O S I T I O N ' , 4 X , ' D A T A S E T ' , 6 X ,

 

3 2 X , ' D A T A S E T ' , 6 X ' M A T C H E D ' , 2 X , ' C O E F F I C I E N T ' , 5 X , ' V A L U E ' / )

2 0 0 1 F O R M A T ! I X , 6 1 8 , 2 F 1 4 . 6 )

DATA

SEQUENCE

-

X I N 1 ' ) .

2 0 0 2

F O R M A T ! / '

F I R S T

I N P U T

2 0 0 3

F O R M A T ! / '

SECOND

I N P U T

DA TA

SEQUENCE

-

X I N 2 ' )

2 0 0 4 F O R M A T ! / ' P LO T OF X I N 1 ' )

 

 

 

2 0 0 5

F O R M A T ! / ' P LO T OF X I N 2 ' )

2 0 0 6

F O R M A T ! / ' P LO T OF C R O SS C O R R E L AT IO N C O E F F I C I E N T S ' )

 

END

 

Программа 5.9. CROSCR

имеющего n* — 2 степеней свободы. Этот критерий выводится из критерия значимости коэффициента корреляции между двумя выборками, взятыми из нормальной совокупности. Нулевая ги­ потеза заключается в том, что коэффициент корреляции равен нулю.

Учитывая различие между лагом и попарным сопоставле­ нием, мы составили программу CROSCR (программа 5.9), пред­ назначенную для вычисления коэффициентов взаимной корреля­ ции между двумя временными рядами. Программа использует два ряда, вводимых в нее с помощью подпрограммы READM (программа 4.1). Используя приращения в цикле DO, программа сдвигает одну цепь относительно другой и вычисляет коэф­ фициент корреляции. Последовательные значения rm печатаются вместе со значениями статистики t, вычисляемой по формуле (5.48). Необходимо отметить, что программа не вычисляет коэффициентов корреляции в том случае, когда перекрытый отрезок имеет длину п*, меньшую трех, так как в этих случаях нет никаких степеней свободы. Главная программа может со­ держать предложение CALL, которое передает результаты, полученные по программе CROSCR, в программу TSPLOT (программа 5.7) для построения графика коэффициентов взаим­ ной корреляции.

Используя программу CROSCR, найдите наилучшие пары значений сопротивления пород, приведенных в табл. 5.16 и 5.18.

Данный способ автоматического вычисления коэффициентов корреляции используется в том случае, когда эквивалентные интервалы имеют приблизительно равную длину, а другие вы­ числительные корреляционные процедуры приводят к столь же двусмысленным результатам. Взаимная корреляция может ока­ заться бесполезной, но вреда причинить не может.

В некоторых случаях применение фильтрации для обработки данных может помочь в более четком выражении интересующих нас характеристик, а также в вычислении коэффициентов взаим­ ной корреляции. Однако напомним, что фильтрация увеличи­ вает зависимость наблюдений в заданных точках и снижает число степеней свободы на неопределенную величину. Интер­ претацию критериев значимости для сглаженных данных надо проводить с большой осторожностью'.

Т а б л и ц а 5.19

Мощность слоев в небольшом разрезе нефтеносных сланцев, мм

(В е р х

10,8

15,6

9,0

 

р азр еза)

11,7

15,0

9,2

 

 

11

,0

13,4

10,7

 

 

9

,9

14,6

10,8

 

 

9

,8

13,0

8,9

 

 

9

,9

10,3

9,4

 

 

10

,0

9,4

10,6

 

 

10,0

9,0

12,6

 

 

10,2

10,1

14,2

 

 

10,8

10,3

12,3

 

 

11

,3

9,2

11,1

 

 

12

,0

9,1

11,0

(Основание

 

13,5

 

 

р азр еза)

Теперь рассмотрим задачу, в которой некоторые методы автоматической корреляции пока лишь подают надежду на успех. В табл. 5.19 приведены 37 измерений мощности слоев той же последовательности разреза эоценовых озерных отло­ жений, из которой взяты данные табл. 5.17. Эти измерения характеризуют разрез, расположенный почти в десяти милях от первого. Предполагается, что данная последовательность эквивалентна некоторому участку первого разреза, но скорре­ лировать их почти невозможно из-за отсутствия маркирующих горизонтов. В монотонно изменяющейся последовательности нет ничего характерного, и поэтому мы должны основывать наши выводы о корреляции на наилучшем сопоставлении мощностей индивидуальных слоев в обоих разрезах. Совсем необязательно предполагать, что данные обоих последовательностей стацио­ нарны. Если два разреза характеризуются одинаковым трен­ дом, то они могут существенно помочь установить положение

наилучшего сопоставления. Используя программу 5.9, вычислите корреллограмму и определите положение наилучшей корреляции разрезов. Как вы объясните другие положения с меньшим, но значащим сопоставлением?

Взаимосвязи

Рассмотренные выше методы предназначены для сравнения двух последовательностей, образованных значениями некото­ рых измеряемых переменных. К сожалению, многие стратигра­ фические исследования приводят к последовательностям, кото­ рые содержат только номинальные данные, и не позволяют применить методы взаимной корреляции. Задача состоит в том, чтобы найти меру сходства, которая в отличие от коэффици­ ента корреляции не основывалась бы на результатах измерения изучаемых переменных. Одним из наиболее часто используемых геологами методов является метод взаимной связи. Исходные данные представляют собой ряд состояний, например, таких, как литологический тип породы (т. е. известняк, песчаник, сланец и т. д.), наблюдаемых в стратиграфическом разрезе. Эти состоя­ ния взаимно исключают друг друга и не могут быть ранжиро­ ваны никаким осмысленным образом. В методе взаимосвязей две такие последовательности передвигаются одна относи­ тельно другой, и для перекрывающихся отрезков оценивается степень соответствия. Для каждого положения подсчитывается

общее число сравнений и количество совпадающих

состояний,

а затем вычисляется отношение числа совпадений

к общему

числу сравнений. Это отношение можно использовать в качестве коэффициента сходства двух цепей в положении перекрытия.

Предположим, что мы при изучении разреза закодировали литологические типы пород по схеме: песчаник— 1, сланец — 2, известняк — 3, уголь — 4, алевролит — 5. Ясно, что способ ко­ дирования совершенно произволен. Таким образом, два страти­ графических разреза можно представить следующим образом:

а) 5 1 2 1 2 5 2 3 2 4 2 5 б) 3 2 1 5 2 5 1 2 1 2 3 2

Сдвинем второй разрез относительно первого и в каждом слу­ чае подсчитаем число совпадений:

Первое положение

 

 

 

 

 

 

 

2

1

2

5

2

3

2

4

2

5

 

 

 

 

 

 

 

 

 

 

5

1

3

2

1

5

2

5

1

2

1 2

3

2

 

 

 

 

 

 

 

 

 

 

 

Число сравнений =

1

число

совпадений =

0

отношение =

 

О

 

 

 

Второе положение

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5

1

2

1

2

5

2

3

2

4

2

5

 

3

2

1

5

2

5

1

2

1

2

 

3

2

 

 

 

 

 

 

 

 

 

 

Число сравнений =

2

 

число совпадений =

0

отношение =

О

 

 

 

Третье положение

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5

1

2

1

2

5

2

3

2

4

2

5

 

 

3

2

1

5

2

5

1

2

1

2

3

 

2

 

 

 

 

 

 

 

 

 

 

 

Число сравнений =

3

число совпадений =

1

отношение =

0,33.

 

 

 

Если на графике каждому положению сравнения поставить соответствующее отношение, то мы получим линию, аналогич­

ную коррелограмме. Такой

график 'для двух сечений изобра­

жен на фиг. 5.22.

сходства можно установить с по­

Значимость отношения

мощью %2-критерия. Чтобы выполнить эту проверку, мы должны определить число совпадений и число несовпадений в перекры­ вающихся участках. Для этого достаточно вычислить вероят­ ность некоторого числа совпадений в двух совершенно случай­ ных последовательностях. Эти случайные последовательности должны содержать такое же число наблюдений каждого типа, как и две данные выборки.

Эти две последовательности будем называть соответственно цепью 1 и цепью 2. Предположим, что имеется m категорий, на которые классифицируются наблюдения. Если мы обозначим число наблюдений, попадающих в класс с номером к, для цепи

 

 

 

 

 

 

 

 

m

1

через

Хш,

то общая длина

цепи

1 будет

равна

n j=к2=X1ik .

В

цепи

2 имеется также ш

категорий,

каждая с Хгк наблю-

дениями, и

поэтому общая длина

цепи

2

равна

Ш

п2= 2 Х2к-

 

 

 

 

 

 

 

 

к=1

Чтобы определить вероятность того, что данное число наблю­

дений в двух последовательностях совпадает, мы должны

раз-

 

m

категориям

на

делить сумму произведений У ^кХ гк п0 всем

k = 1

 

 

произведение длин цепей, т. е.

 

 

 

m

 

 

2

Х1к*2к

 

 

Р г = —

---------- .

(5.49)

 

П1П2

4

7

В нашем примере число категорий равно 5. Первая цепь содер­ жит два песчаника, пять сланцев и т. д. Числа наблюдений для каждой категории в двух цепях приведены в табл. 5.20.