Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Статистика и анализ геологических данных

..pdf
Скачиваний:
20
Добавлен:
15.11.2022
Размер:
21.12 Mб
Скачать

чений распределения. Если же нам нужно проверить эту гипо­ тезу при уровне значимости а=0,05, то вычисленное значение статистики t для одностороннего критерия должно превышать значение 1,83. Статистический критерий имеет тот же вид, что

ив предыдущем случае:

1.Но : H-i < 18°/0, H i: и > 18°/0.

2.а =0,0 5 .

3. t = 2 1 .3 - 1 8 .0

1,89.

5 .5 2 //1 0

 

Вычисленное значение 1,89 превышает табличное, соответст­ вующее девяти степеням свободы и пятипроцентному уровню значимости, т. е. попадает в критическую область. Это значит, что мы должны отклонить нулевую гипотезу и принять альтерна­ тиву, заключающуюся в том, что пористость совокупности, из ко­ торой были извлечены образцы

песчаников Тенслип, больше 18%.

 

Т а б л и ц а 3.11

Если бы вычисленная величина t

Результаты измерения пористости

оказалась

меньше

чем 1,83, то

десяти образцов песчаников

не было

бы никаких

оснований

Тенслип пенсильванского возраста,

предполагать,

что

выборочное

бассейн реки Уинд, Вайоминг

среднее

больше

18%.

Заметим,

Номер образца

Пористость (%)

что мы при этом не утверж­

 

 

даем,

что среднее

меньше

 

18%,

 

 

 

а только

говорим, что

нет

осно­

11

 

15

ваний

считать,

что

оно больше.

12

 

10

Как это

было

установлено

ра­

13

 

15

нее,

эта

неопределенность

ле­

 

14

 

23

жит в основе статистических кри­

 

15

 

18

териев. Они могут показать с не­

 

которой

вероятностью,

чего

нет,

16

 

26

но не позволяют установить, что

17

 

24

же имеет место.

 

 

 

 

 

18

 

18

С другой площади в Вайомин­

 

19

 

19

ге были получены десять допол­

 

 

21

нительных

измерений

значений

20

 

пористости в песчаниках Тенслип,

 

 

 

которые

приведены

в табл. 3.11.

 

Сумма

189

Можно ли

средние

двух

выбо­

 

Среднее 18,9

рок считать равными?

В

отли­

 

 

S2 =

23,21

чие от предыдущей задачи, где

 

мы сравнивали

выборочное сред­

 

s =

4,82

нее

с

заданным

выборочным

 

 

 

8 З а к а з № 455

средним значением совокупности, в данном случае проверяется гипотеза, имеющая следующий вид:

Но : P'1 = Р2.

Проверяемая гипотеза заключается в том, что среднее значе­ ние совокупности, из которой взята первая выборка, равно сред­ нему значению совокупности, из которой взята вторая выборка.

Множество альтернатив для гипотезы Hi •* Pl ф Р2

утверждает, что средние значения двух совокупностей не равны. Снова мы должны задать уровень значимости, и пусть он будет равен а=0,10 . Теперь статистический критерий имеет следующий

вид:

Х1 - Х 2

(3.23)

Sp / 1 / П 1 + 1/п8 ’

 

где Sp — оценка стандартного отклонения совокупности, получен­ ная по двум объединенным выборкам. Эту оценку можно вы­

числить по формуле

V

(п, — 1)8? + (n2

*)S2

(3.24)

П1 “I- П2 —

2

 

где индексы соответствуют выборкам, взятым из пород впадины Бигхорн и бассейна реки Уинд. Для того чтобы оценить дис­ персию исходной совокупности, из которой были взяты обе вы­ борки, нужно сначала оценить дисперсию каждой выборки, а за­ тем, комбинируя их, получить требуемое значение s p по формуле

(3.24). Эта процедура требует оценки дополнительных парамет­ ров [ о \ ; так же как и а \), а также вычисления дополнитель­

ного числа степеней свободы v—tii+tii 2. Является ли разли­ чие между двумя средними значимым при десятипроцентном

уровне значимости?

 

21.3 — I8j9______ _ _ =

t==

• Z 1/5

_

_ _ JiL _ _ = ^ = l,0 3 .

 

у 26,84 У0,2

Так как табличные значения двустороннего критерия с 18 сте­ пенями свободы, соответствующие десятипроцентному уровню

значимости

(5% на каждом конце распределения), равны

2,10

и +2,10, то

вычисленное значение не попадает

в критическую

область и нулевую гипотезу нельзя отклонить. (

апомним, что

критическая область охватывает 10% площади под кривой

-рас­

пределения.)

Отсюда следует, что нет основании

предполагать,

что две изучаемые выборки взяты из совокупностей, имеющих разные средние значения.

Для того чтобы применять этот критерий, необходимо выпол­ нить следующие условия. Во-первых, обе выборки должны быть получены на основании процедуры случайного выбора. Во-вто­ рых, значения случайных величин в совокупностях, из которых были извлечены выборки, должны описываться нормальным рас­ пределением. В-третьих, дисперсии этих совокупностей должны быть равны. Выполнение первого условия в большинстве геоло­

гических

задач проверить трудно. Однако его невыполнение

в случае,

если выборки имеют сильное и систематическое сме­

щение (как в том случае, когда измерения пористости произво­ дятся только в образцах, взятых из продуктивных зон или неф­ тяных полей), может явиться серьезным источником ошибок. Конечно, проверку гипотезы о нормальности распределения зна­ чений признака изучаемой совокупности можно провести, так как одно отклонение от нормальности редко приводит к изме­ нению результатов, в особенности если выборочная совокупность достаточно велика (скажем, больше 30). Третье условие — ра­ венство дисперсий двух совокупностей — очень важно, так как почти все статистические критерии основаны на предположении о равенстве дисперсий сравниваемых совокупностей. К счастью, это предположение легко проверяется.

F -критерий

Критерии для проверки гипотезы о равенстве дисперсий осно­ ваны на так называемом F -распределении Фишера. Это теорети­ ческое распределение отношения

si

(3.25)

F = 4

S2

двух выборочных дисперсий для выборок, извлеченных из нор­ мальных совокупностей при условии, что истинные дисперсии равны.

Вполне естественно, что выборочные дисперсии в случае, ко­ гда число наблюдений, используемое для их вычисления, мало, меняются от испытания к испытанию в довольно широком диа­ пазоне. Поэтому вид F -распределения изменяется с изменением объема выборки. Это снова заставляет нас учитывать степени свободы, но в данном случае F -распределение зависит от двух значений v, каждое из которых соответствует одной из двух оце­ нок дисперсий F -отношения. Так как F -статистика является от­ ношением двух положительных чисел, то ясно, что случайная величина F не может принимать отрицательных значений. Если выборка велика, то при условии равенства истинных значений дисперсий среднее значение отношения будет близко к 1,0.

ходов. Оценки дисперсий двух выборок можно вычислить по фор­ муле (3.8). Тогда соответствующее им F -отношение вычисляется

по формуле

2

 

F

- 4s2.

(3.26)

где — большая выборочная дисперсия, a s | — меньшая

выбо­

рочная дисперсия.

 

 

По этим данным требуется проверить гипотезу

 

т т

2_ 2

 

По . 01 = 0 2

 

против множества альтернатив

 

 

т т

2 / 2

 

nj . Oi^=02.

 

Нулевая гипотеза утверждает, что изучаемые совокупности имеют равные дисперсии; множество альтернатив устанавливает, что это не так. Степени свободы vi и V2, отвечающие этому кри­ терию, равны ni — 1 и п2— 1, соответственно. Критическое зна­ чение F CVI = 9 HV2= 9 степенями свободы и уровнем значимости 5% (а = 0,05) можно найти по табл. 3.12, а; это значение равно 3,18.

Значение F, вычисленное по формуле (3.26), попадает в одну из двух областей, указанных на фиг. 3.23. Если вычисленное зна­ чение F превышает 3,18, то нулевая гипотеза отвергается и мы приходим к заключению, что дисперсии пористости можно счи­ тать неодинаковыми в двух группах. Если вычисленное значение меньше 3,18, то мы не можем утверждать, что дисперсии раз­ личны. Используя программу 3.2, оценим дисперсию пористости двух совокупностей песчаников Тенслип и проверим предполо­ жение о равенстве дисперсий при пятипроцентном уровне зна­ чимости.

Вбольшинстве практических задач мы обычно не знаем ис­ тинных значений параметров совокупности и можем лишь по вы­ борке вычислить их оценки. При сравнении двух выборок сна­ чала целесообразно установить, являются ли их дисперсии ста­ тистически эквивалентными. Если они оказываются равными и если выборки были извлечены без смещения из изучаемых сово­ купностей, то мы можем спокойно перейти к использованию сле­ дующих статистических критериев.

Вкачестве примера рассмотрим такую проблему: образцы снега и льда, собираемые с участков земли, покрытых многолет­ ними льдами, содержат частички пыли, называемые микроча­ стицами. Размеры отдельных таких частиц имеют пределы от 0,5 до 3,0 мкм; они попадают в атмосферу разными путями: в ре­ зультате вулканических извержений, пылевых штормов, падения

микрометеоритов.

Частицы

настолько малы,

что

могут

быть

во взвешенном

состоянии

неограниченное

время,

но

легко

 

 

Т а б л и ц а

3.12, а

R pHTH ^ K H e ^ 3 H a 4 e i« fl^ F ^ p a c n p w ^ H j« ^ c ^ v ^ ^ V 2 ^ _ ^

" j 0j

 

 

*

I

ипгЛ1/П10ЛЯ V *

 

 

 

Число степеней

свобоЗы

числителя у1

 

 

 

 

8

15

20

24

00

 

 

 

 

 

огпм

ТЗК Как служат ядрами для кристаллиза-

поглощаются снег0

отез что перемРешивание атмосферы и

ции льда. СУ ^ с^ иУкоочаСтицы попадают в снег из воздуха, припути, к0Т°Рымио^ пй концентрации микрочастиц в снегу на зем-

водят к

 

S

Л ™ ™ о т “ за соответствует действительно-

ной поверхност]и* 1в

имеют значение для предсказания послед-

сти, то выводы из н

я в ахМосфере. Поэтому были

ствий Hcnb,f

вв1боркиРпроб снега в снеговых покровах Гренлан-

собраны дяв®

! . £ РПри тщательном контроле снег был расплав-

дии и Антарктики,

РeKTDH4eCKOro классификатора было опре-

лен, „

с помощью

не„ чФастиц. Коннеитрадня

делено

количес

рна биллион в талом снегу приведена

микрочастиц

в часли

Т а б л и ц а 3.12, б

Критические значения F-распределения с V| и Vj степенями свободы для 2,5%-ного уровня значимости (а=0,025) [10]

 

 

 

 

 

Число степеней свободы

числителя v 1

 

 

 

 

 

 

1

2

3

4

5

6

7

8

9

10

12

15

20

24

0 0

 

1 64779

79950

86416

89958

92185

937 11

948 22

95666

963 28

988 83

976 71

984 87

99910

997 25

1001 4

 

2

3851

3900

3917

3925

3930

3933

3936

3937

3939

3940

3941

3943

3845

3946

3946

 

3

1744

1604

1544

1510

1488

1473

1462

1454

1447

1442

1434

1425

1417

1412

1408

 

4

1222

1865

998

960

936

920

907

898

890

884

875

866

856

851

846

 

5

ИМИ

843

776

739

715

698

685

678

688

662

652

643

633

628

623

 

6

881

726

660

623

599

582

570

560

552

546

537

527

517

512

507

 

7

807

654

589

552

529

512

499

490

482

476

467

457

447

441

436

«V

8

757

606

542

505

482

465

453

443

436

430

420

410

400

395

389

 

9

721

571

508

4 72

448

432

420

410

403

996

987

977

367

361

356

о;

10

694

546

483

447

424

407

395

985

978

972

962

952

342

337

331

ш

11

672

526

463

428

404

388

976

366

359

353

943

933

323

317

312

£

о

12

655

510

447

412

389

373

961

951

344

937

928

318

307

302

996

X

13

641

497

435

400

377

360

34В

939

931

325

915

305

995

289

284

а>

Z

14

630

486

424

389

366

350

938

329

921

915

905

995

984

979

973

о

X

15

620

477

415

380

358

341

929

920

912

906

29В

986

976

2 70

964

СО

Ъ

16

612

469

408

373

350

334

322

912

305

999

989

979

268

963

957

ГО

17

604

462

401

366

344

328

916

906

998

992

982

972

982

956

950

о

УО

18

598

456

395

361

338

922

910

901

293

987

977

967

956

950

944

о

со

19

592

451

390

356

333

317

905

996

988

982

972

962

951

245

239

и

•3

20

587

446

386

351

329

313

901

991

284

977

26Р

957

946

941

235

со

21

583

442

382

348

325

309

997

987

980

273

964

953

242

237

231

X

с

22

579

438

378

344

322

905

293

984

978

970

260

950

939

933

227

Е

23

575

435

375

341

318

902

990

981

973

967

957

947

936

930

224

с_>

24

572

432

372

338

315

299

987

978

970

984

954

944

933

927

221

о

25

569

429

369

335

313

997

985

975

268

961

951

941

930

924

218

е;

=3

26

566

427

367

333

310

994

982

973

965

959

249

939

928

922

216

 

27

563

424

365

331

308

992

980

971

963

957

947

936

925

919

213

 

28

561

422

363

329

306

990

978

969

961

955

245

934

923

917

211

 

29

559

420

361

327

304

988

976

967

959

953

943

932

921

915

209

 

30

557

418

359

325

303

987

975

965

957

951

941

931

920

914

207

 

40

542

405

346

313

290

274

962

953

245

939

929

918

907

901

194

 

60

529

393

334

301

279

963

951

241

933

927

917

906

194

188

182

120

515

380

323

2-89

267

252

239

930

222

916

905

194

182

176

169

ОО

502

369

312

279

257

941

929

919

911

905

194

183

171

164

157

/

в табл. 3.13. Можно ли считать обе выборки извлеченными из одной и той же совокупности и приводят ли результаты испыта­ ний к подтверждению или опровержению идеи об атмосферной однородности?

Предполагая, что выборки были взяты без смещения и что распределение микрочастиц подчиняется нормальному закону на всем протяжении снеговых полей, проверим сначала гипотезу о равенстве дисперсий по двум выборкам. Используя формулу (3.25), запишем нулевую гипотезу и альтернативу:

тт

. 2

2

По • 01 =

02,

и

. 2 ,

2

H i

. О] ф <32-

 

 

 

 

 

 

 

 

 

 

 

 

 

Т а б л и ц а 3.12, в

 

 

 

 

 

 

 

 

 

„ „

м vo степенями свободы

 

 

 

 

 

 

 

 

 

 

 

<«-••»■ >

п «

 

 

 

 

 

 

 

 

Число

степеней

сеобоЗы числителя у,

__-------------

 

 

 

 

 

 

 

 

-------

 

 

,2

15

го

24

сю

 

 

 

 

 

 

 

 

59284

5981 1

60225

6055 8

61063

6157 3 62087

6234 6

62606

 

1

40522

49995

5403 4

56246

57636

58590

9040

9942

9943

9045

9946

9947

 

9925

9930

9933

9936

9937

9939

2887

2669

2660

2650

 

2

9850

99*00

9917

2767

2749

2735

2723

2705

 

2871

2824

2791

1455

1437

1420

1402

1393

1384

 

3

3412

3082

29 46

1552

1521

1498

14 80

1466

055

947

, 938

 

2120

1800

1669

1598

1016

1005

989

972

 

4

11 39

1097

1 067

1946

1029

 

740

731

723

 

5

1626

1327

1206

826

810

798

787

7 72

756

 

 

 

915

875

847

616

607

599

Ci

6

1375

1092

9 78

672

662

647

631

785

746

7 19

699

684

552

536

528

520

 

7

1225

9*55

845

618

603

591

581

567

о;

865

759

701

663

6 37

526

511

496

481

4 73

465

8

1126

606

580

561

547

535

458

441

4 33

4 25

о;

9

10*56

802

699

642

520

506

494

485

4 71

 

 

756

655

599

564

539

 

 

 

410

402

394

Е

10

1(704

 

 

 

 

 

4 54

4 40

4 25

о

 

 

 

532

507

489

474

463

386

378

370

х

 

965

721

622

567

430

416

401

OJ

11

506

482

464

450

439

366

359

351

Ж.

933

693

595

541

430

419

396

382

а

12

521

486

462

444

394

380

366

351

343

335

X

13

907

670

574

428

414

403

337

329

321

со

651

5 56

504

469

446

380

367

352

_

14

886

456

4 32

414

400

389

 

 

 

го

15

868

636

542

489

 

 

 

369

355

341

326

318

310

444

420

403

389

378

£о

 

 

623

529

477

359

346

331

316

ЗОВ

300

16

853

434

410

993

379

368

308

300

292

о

611

518

467

360

351

337

323

17

840

458

425

401

384

371

343

330

315

300

292

284

 

18

029

601

509

417

394

377

363

352

*94

286

278

со

450

337

323

309

818

593

501

356

346

X

19

443

410

387

3 70

 

 

 

*88

280

272

OJ

20

810

585

494

 

 

 

331

3 17

303

с .

 

 

437

404

381

364

351

340

283

275

267

Е

 

 

5 78

4 87

326

312

298

21

802

399

376

359

345

335

278

270

262

о

572

482

431

330

321

307

293

о

22

795

394

371

354

341

2 74

2 66

258

788

566

476

426

336

326

317

303

289

«=:

23

390

967

350

 

 

270

262

254

а

782

561

472

422

332

322

313

299

285

24

385

363

346

 

 

 

25

777

557

468

418

 

329

318

309

296

281

266

258

250

 

 

 

 

382

359

 

263

255

247

 

26

772

553

464

 

 

326

315

306

293

278

 

 

378

356

 

303

290

275

260

252

244

 

549

460

 

 

312

 

27

768

 

375

353

 

323

257

249

241

 

764

545

457

 

 

320

309

300

287

273

 

28

 

373

350

 

298

284

270

255

247

239

 

29

760

542

454

 

 

317

307

 

 

 

 

539

451

 

370

347

 

 

 

 

 

237

229

220

 

30

756

 

 

 

 

 

 

280

266

252

 

 

 

 

351

329

 

 

 

2 20

2 12

203

 

 

731

518

431

 

 

 

 

2 63

2 50

2 35

 

40

 

 

 

 

203

1 95

1 86

 

498

413

 

334

312

 

 

 

247

234

219

 

60

708

 

3 17

296

 

 

 

1 88

1 79

1 70

 

685

 

 

 

 

 

 

2 32

2 18

204

 

120

 

 

 

302

280

 

 

 

 

 

 

 

 

 

 

00

663

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Если дисперсии не сил^

 

 

 

 

 

 

 

значений.

Используя критерий(3.23). запишем соответствующую нулевую гипотезу и альтернативу.

 

 

 

H i:

Ф 1*2•

 

 

Такая

нулевая

гипотеза

 

 

 

никаких

основании

счит

,

уг,0Вень

значимости,

соответ

среднее, чем другая. Ясн >

£ быть выше, чем уровень зн -

вующий этому критерию,

при

проверке

гипотезы о

равенст

чимости,

использованный

провер!

 

 

Т а б л и ц а 3.13 Концентрация микрочастиц в талой воде

 

 

Концентрация, блн'

 

Антарктика, п =

16

Гренландия, п = 18

3,7

0,6

 

3,7

1,6

2,0

1,4

 

7,8

2,4

1,3

4,4

 

1,9

1,3

3,9

3,2

 

2,0

2,6

0,2

1,7

 

1,1

3,7

1,4

2,1

 

1,3

2,2

4,2

4,2

 

1,9

1,8

4,9

3,5

 

3,7

1,2

 

 

 

3,4

0,8

дисперсий. Если дисперсии и средние окажутся неразличимыми, т. е. нулевая гипотеза не может быть отклонена на основании выборочных данных, то нет и статистических оснований считать, что средние концентрации микрочастиц на двух изучаемых пло­ щадях соответствуют различным совокупностям. С другой сто­ роны, если хотя бы один из двух критериев приводит к отклоне­ нию нулевой гипотезы, то вопрос об атмосферной однородности можно поставить под сомнение. Более того, если критерий (3.25) приведет к отклонению гипотезы о равенстве дисперсий, то и при­ менение критерия (3.23) в нашей задаче теряет смысл. Прибли­ зительные критерий, аналогичные описанному в работе Гюн­ тера [7], применимы для проверки гипотезы о равенстве средних в условиях неравенства дисперсий, но они мало помогают при решении данной задачи.

Дисперсионный анализ

До сих пор мы рассматривали только методы сравнения двух выборок, тогда как существует еще ряд задач, касающихся групп наблюдений. Предположим, например, что мы получили пять образцов песчаника с кальцитовым цементом. Каждый из них обладает своими литологическими особенностями: в одном бросается в глаза его крупнозернистость, другой характеризуется наличием глинистых частиц, третий слабо ожелезнен и т. д. Мы хотим определить, одинаковы ли в них содержания карбоната.

Для решения этой задачи можно использовать один из статисти­ ческих методов, называемый дисперсионным анализом.

В общем виде этот метод основан на разделении общей дис­ персии изучаемой совокупности на компоненты, соответствующие источникам изменчивости, а применяемые критерии позволят одновременно изучить различия как в средних значениях, так и в дисперсиях.

Экспериментальный подход к этой задаче заключается в дро­ блении образцов на более мелкие части и определении содер­ жания карбоната в каждой из них путем взвешивания после об­ работки кислотой. Каждая мелкая часть называется повторе­ нием. Цель, которую мы преследуем, разбивая первоначальный кусок на части,— определение изменчивости, вызванной погреш­ ностями взвешивания. Очевидно, что если изменчивость между повторными определениями для одного образца велика по срав­ нению с различиями между образцами, то последние трудно об­ наружить,

Предположим, что мы разбили исходный образец на шесть частей и собираемся проанализировать каждую из них. Наблю­ даемые изменения возникают по ряду причин: из-за колебаний состава внутри исходного образца, из-за небрежности в получе­ нии повторных наблюдений (остатки одного травления могут быть промыты более тщательно, чем остатки другого), из-за из­ менения условий взвешивания (повторные образцы могут содер­ жать различные количества влаги либо на результаты взвеши­ вания может повлиять зависимость положения нулевой точки на весах от изменений температуры в течение дня и т. д.) и благо­ даря влиянию других более тонких факторов. Комбинация всех этих источников изменчивости приводит к возникновению так называемой экспериментальной ошибки или изменчивости, не учитываемой только различиями между образцами.

Чтобы избежать возможности появления систематической ошибки в статистическом анализе, повторные наблюдения дол­ жны быть отобраны наудачу. Это так называемая рандомизация наблюдений. Необходимость этой процедуры станет очевидной, если имеется некоторый фактор, который непрерывно меняется во время эксперимента, как, например, продолжающееся высы­ хание проб, ожидающих своей очереди взвешивания. Если взве­ сить все шесть проб, полученных из образца 1, а затем все пробы, полученные из образца 2 и т. д., то при последнем взве­ шивании могут быть зарегистрированы большие весовые потери лишь по той причине, что пробы высыхали в течение более про­ должительного периода времени. Одним из способов решения этой задачи является последовательная нумерация каждой по­ вторной процедуры и выбор этих номеров в процессе анализа по таблице случайных чисел. Действительно, если процесс про­