Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Метр_фбме_укр1.doc
Скачиваний:
2
Добавлен:
24.08.2019
Размер:
3.14 Mб
Скачать

Додаток г Перевірка гіпотези нормальності розподілу

Метод середнього абсолютного відхилення (САВ).

Для не дуже великих вибірок (n<120) можна застосувати прості рекомендації по перевірці нормальності розподілу випадкових величин.

Для вживання цього методу необхідно визначити величини S (СКВ при невідомому середньому арифметичному значенні) і САВ:

,

Для вибірки, що має приблизно нормальний закон розподілу, повинне бути справедливе співвідношення

Якщо приведене співвідношення дотримується, то гіпотеза нормальності розподілу приймається.

Метод розмаху варіювання (R).

Для порівняно широкого класу вибірок 3<n<1000 можна виконати перевірку нормальності розподілу з використанням розмаху варіювання R. Величину R визначають за формулою R = xmax  xmin .

Потім визначають відношення R/S і зіставляють його з критичними верхніми в і нижніми н межами цього відношення, при заданій вірогідності розподілу помилок. Якщо в<R/S<н , то нормального розподілу немає. Гіпотеза нормальності розподілу підтверджується, якщо н<R/S<в .

Таблиця Г1. Критичні межі відношення R/S

Об'єм

виборки n

Нижні границі (н )

Верхні границі (в )

Вірогідність помилки

0,01

0,05

0,1

0,01

0,05

0,1

3

1,737

1,758

1,782

2,000

1,999

1,997

5

2,020

2,150

2,220

2,803

2,753

2,712

7

2,260

2,400

2,490

3,338

3,222

3,143

10

2,510

2,670

2,760

3,875

3,685

3,570

15

2,800

2,970

3,070

4,440

4,170

4,020

20

2,990

3,180

3,290

4,800

4,490

4,320

50

3,620

3,830

3,950

5,770

5,350

5,140

100

4,100

4,310

4,440

6,360

5,900

5,680

Метод аналізу показників асиметрії і ексцесу.

Деяке уявлення про близькість емпіричного розподілу до нормального закону розподілу може дати аналіз показників асиметрії і ексцесу.

Для вживання цього методу необхідно визначити наступні величини:

  • центральні моменти розподілу другого (m2), третього (m3) і четвертого (m4) порядків:

; ; ;

  • показник асиметрії g1:

;

  • показник ексцесу (відхилення) g2 :

;

  • незміщені оцінки для показників g1 і g2 :

; ;

  • СКВ для показників g1 і g2 :

; .

Після виконання розрахунків проводиться порівняння величин незміщеної оцінки і СКВ для величин g1 і g2. Якщо виконується умова и , тоді гіпотеза нормальності розподілу приймається (підтверджується).

Метод перевірки нормальності розподілу за допомогою критерію згоди Колмогорова-Смірнова (КС критерій).

Цей метод подібний критерію згоди 2, за винятком того, що для розрахунку К-С критерію використовуються накопичені абсолютні і очікувані частоти.

Для вживання цього методу необхідно визначити величину

,

де Fn - накопичена спостережувана частота результатів вимірювання, F0 – накопичена очікувана частота результатів вимірювання.

Величина Fn для кожного інтервалу визначається підсумовуванням спостережуваної частоти m даного інтервалу і всіх попередніх інтервалів (наприклад, Fn для другого інтервалу = m2 + m1; Fn для третього інтервалу = m3 + m2 + m1). Так само визначається і величина F0: для другого інтервалу F0 = np2 + np1; для третього інтервалу F0 = np3 + np2 + np1 і т.д.

Результати розрахунку заносять в таблицю (як приклад визначення Fn  F0 див. табл. Г 2), визначають найбільше абсолютне значення різниці Fn  F0, обчислюють величину D і порівнюють її з табличним значенням критерію, табл. Г 3. Гіпотеза про нормальний закон розподілу приймається, якщо D  Dкр .

Таблиця Г 2. Приклад виконання розрахунків

Параметр

Величина по інтервалах

m

7

5

8

10

18

17

12

9

7

7

Fn

7

12

20

30

48

65

77

86

100

93

np

5,33

5,79

9,29

12,83

15,20

15,39

13,45

10,05

6,23

6,44

F0

5,33

11,12

20,41

33,24

48,44

63,83

77,28

87,33

100

93,77

Fn  F0

1,67

0,88

0,41

3,24

0,44

1,17

0,28

1,33

0,00

0,77

Розрахунок: max Fn  F0 = 3,24; D = 3,24/100 = 0,0324.

Таблиця Г 3. Критичні Dкр значення К-С критерію

n

D0,1

D0,05

3

0,636

0,708

5

0,509

0,563

7

0,436

0,483

10

0,369

0,409

15

0,304

0,338

20

0,265

0,294

50

0,170

0,177

100

0,121

0,134

Для нашого прикладу розрахована величина D=0,0324 набагато менше критичну величину D0,1=0,636, прийнятої з досить жорстким 10 % рівнем вірогідності. Таким чином, можна зробити висновок, що гіпотеза про нормальність розподілу приймається.

Метод перевірки з використанням критерію відповідності 2.

Якщо результати експерименту викликають сумнів в нормальності закону розподілу випадкових помилок, то для вирішення питання про придатність або непридатність нормального закону розподілу треба провести достатньо велике число вимірювань.

Результати вимірювань (зрозуміло, вільні від систематичних помилок) групують по інтервалах так, щоб ці інтервали покривали всю вісь (, +) і щоб кількість даних в кожному інтервалі була достатньо великою (в усякому разі, не менше п'яти, краще десяти). Для кожного інтервалу (xі1, xi) підраховують число mi результатів вимірювання, що потрапили в цей інтервал. Потім обчислюють вірогідність pi попадання в цей інтервал при нормальному законі розподілу вірогідності:

, (1)

де - середнє арифметичне значення результатів вимірювання, s - емпіричний стандарт (середня квадратична помилка), Ф - інтеграл вірогідності, який визначається за відомою формулою (2) і представлений таблицями Г5 і Г6.

(2)

Для визначення критерію "2" обчислюють суму

, (3)

де - число усіх інтервалів (, х1), (х1, х2), … , (xi-1, ), n - число усіх результатів вимірювань (n = m1 + m2 + … + ml).

Якщо сума, визначувана виразом (3), виявиться більше критичного значення 2 по таблиці Г7 при деякій довірчій вірогідності R і числі ступенів свободи к =l-3, то з надійністю R можна вважати, що розподіл вірогідності випадкових помилок в даній серії вимірювань відрізняється від нормального. Інакше для такого висновку немає достатніх підстав.

За відсутності достатніх підстав для того, щоб відкинути гіпотезу про нормальний розподіл випадкових помилок вимірювання, ця гіпотеза приймається, оскільки в звичних ситуаціях ця гіпотеза часто може бути обґрунтована теоретично.

Наголосимо ще на важливій властивості критерію 2. Якщо розподіл відмінний від нормального, то при достатньо великому числі вимірювань сума, визначена по виразу (3), перевищить відповідне критичне значення 2. 

Тому, якщо при проведеному числі вимірювань критерій 2 дав малу надійність, слід суттєво збільшити число вимірювань (у декілька разів!).

Вказане вище число ступенів свободи k=l-3 відноситься тільки до того випадку, коли обидва параметри нормального закону розподілу визначаються за наслідками вимірювань, тобто коли замість точних значень а (істинних значень) і  застосовуються їх емпіричні значення і S. Якщо значення а точно відомо (наприклад, при вимірюванні еталона), то число ступенів свободи рівне к=l-2, якщо відомо обидва параметри а і , то число ступенів свободи рівне k=l-1. На практиці така ситуація зустрічається рідко, і тому для отримання числа ступенів свободи не менше п'яти треба брати число інтервалів не менше восьми.

На закінчення помітимо, що ефективність критерію 2 підвищується, якщо в кожний з виділених інтервалів потрапляє приблизно однакова кількість даних. Це слідує враховувати при угрупуванні первинного матеріалу (якщо можливо).

Приклад розрахунку вірогідності для вживання критерію 2. Візьмемо ряд результатів вимірювань в кількості 100 шт. Ряд включає послідовні величини від 8,275 до 8,975. Значення параметрів розподілу для нього вже були підраховані по відомих залежностях: = 8,63, s = 0,127. Для вживання критерію 2 об'єднаємо крайні інтервали, щоб число даних в кожному інтервалі стало не менше п'яти. Одержані дані представлені у перших двох стовпцях табл. Г4. Крайні інтервали узяті нескінченними. В третьому стовпці підраховані відношення

для правих кінців інтервалів, наприклад, t1 = (8,425-8,63)/0,127 = 1,614. В четвертому стовпці приведені відповідні значення інтеграла вірогідності Ф(ti) з табл. Г5. При цьому проведена лінійна інтерполяція. По значеннях Ф(ti) в п'ятому стовпці обчислена вірогідність pi, як різниці відповідних значень Ф(t):

pi = Ф(ti)  Ф(ti-1);

наприклад, р2 = 0,3888  (0,4467) = 0,0579. При обчисленні вірогідності p1 враховане, що Ф()= 0,5. Останні стовпці таблиці не потребують пояснення. Сума чисел останнього стовпця дає значення 2 = 2,528.

Таблиця Г 4. Результати обробки

Інтервали

mi

ti

Ф(ti)

pi

minpi

(minpi)2

npi

(xi-1; xi)

( ; 8,425)

7

- 1,614

- 0,4467

0,0533

1,67

0,523

(8,425; 8,475)

5

- 1,220

- 0,3888

0,0579

- 0,79

0,108

(8,475; 8,525)

8

- 0,827

- 0,2959

0,0929

- 1,29

0,179

(8,525; 8,575)

10

- 0,433

- 0,1676

0,1283

- 2,83

0,624

(8,575; 8,625)

18

- 0,039

- 0,0156

0,1520

2,80

0,516

(8,625; 8,675)

17

0,354

0,1383

0,1539

1,61

0,168

(8,675; 8,725)

12

0,748

0,2728

0,1345

- 1,45

0,157

(8,725; 8,775)

9

1,142

0,3733

0,1005

- 1,05

0,110

(8,775; 8,825)

7

1,536

0,4377

0,0644

0,56

0,048

(8,825; +)

7

+ 

0,5000

0,0623

0,77

0,095

Суми

100=n

---

---

1,0000

---

2,528=2

Порівняння цього значення з таблиці Г4 з критичними значеннями з таблиці Г7 при числі ступенів свободи k=10-3=7 показує, що величина 2 менше критичних значень для вибраних ступенів надійності і тому немає підстав сумніватися в нормальності розподілу результатів вимірювання.

Таблиця Г5. Значення інтеграла вірогідності , Ф(t) = Ф(t)

t

Сотые доли t

0

1

2

3

4

5

6

7

8

9

0,0

0,0000

0040

0080

0120

0160

0199

0239

0279

0319

0359

0,1

0398

0438

0478

0517

0557

0596

0636

0675

0714

0753

0,2

0793

0832

0871

0910

0948

0987

1026

1064

1103

1141

0,3

1179

1217

1255

1293

1331

1368

1406

1443

1480

1517

0,4

1554

1591

1628

1664

1700

1736

1772

1808

1844

1879

0,5

1915

1950

1985

2019

2054

2088

2123

2157

2190

2224

0,6

2257

2291

2324

2357

2389

2422

2454

2486

2517

2549

0,7

2580

2611

2642

2673

2703

2734

2764

2794

2823

2852

0,8

2881

2910

2939

2967

2995

3023

3051

3078

3106

3133

0,9

3159

3186

3212

3238

3264

3289

3315

3340

3365

3389

1,0

3413

3437.

3461

3485

3508

3531

3554

3577

3599

3621

1,1

3643

3665

3686

3708

3729

3749

3770

3790

3810

3830

1,2

3849

3869

3888

3907

3925

3944

3962

3980

3997

4015

1,3

4032

4049

4066

4082

4099

4115

4131

4147

4162

4177

1,4

4192

4207

4222

4236

4251

4265

4279

4292

4306

4319

1,5

4332

4345

4357

4370

4382

4394

4406

4418

4429

4441

1,6

4452

4463

4474

4484

4495.

4505

4515

4525

4535

4545

1,7

4554

4564

4573

4582

4591

4599

4608

4616

4625

4633

1,8

4641

4649

4656

4664

4671

4678

4686

4693

4699

4706

1,9

4713

4719

4726

4732

4738

4744

4750

4756

4761

4767

2,0

4772

4778

4783

4788

4793

4798

4803

4808

4812

4817

2,1

4821

4826

4830

4834

4838

4842

4846

4850

4854

4857

2,2

4861

4864

4868

4871

4875

4878

4881

4884

4887

4890

2,3

4893

4896

4898

4901

4904

4906

4909

4911

4913

4916

2,4

4918

4920

4922

4925

4927

4929

4931

4932

4934

4936

Таблиця допускає лінійну інтерполяцію з помилкою до 10-4.

Наприклад необхідно обчислити Ф(1,614). Рішення. Беремо з таблиці два значення Ф(1,61)= 0,4463 і Ф(1,62)= 0,4474 з різницею 0,0011 і вводимо поправку на відносний приріст аргументу (1,614-1,61) /0,01 =0,4:

Ф(1,614)= Ф(1,61)+ 0,0011Ч0,4 = 0,4467.

Продовження таблиці для значень t  2,5 см. в табл. П3.

Таблиця Г6. Величини, пов'язані з інтегралом вірогідності Ф (t); функція t = t(R) є зворотною для R = 2Ф(t)

t

Ф(t)

12Ф(t)

1R

t = t(R)

R

2,5

0,49379

0,01242

0,05

1,960

0,95

2,6

0,49534

0,00932

0,04

2,054

0,96

2,7

0,49653

0,00693

0,03

2,170

0,97

2,8

0,49744

0,00511

0,02

2,326

0,98

2,9

0,49813

0,00373

0,01

2,576

0,99

3,0

0,49865

0,00270

0,009

2,612

0,991

3,1

0,49903

0,00194

0,008

2,652

0,992

3,2

0,49931

0,00137

0,007

2,697

0,993

3,3

0,49952

0,00097

0,006

2,748

0,994

3,4

0,49966

0,00067

0,005

2,807

0,995

3,5

0,499767

0,000465

0,004

2,878

0,996

3,6

0,499841

0,000318

0,003

2,968

0,997

3,7

0,499892

0,000216

0,002

3,090

0,998

3,8

0,499927

0,000145

0,001

3,291

0,999

3,9

0,499952

0,000096

0,0009

3,320

0,9991

4,0

0,499968

0,000063

0,0008

3,353

0,9992

4,1

0,499979

0,000041

0,0007

3,390

0,9993

4,2

0,499987

0,000027

0,0006

3,432

0,9994

4,3

0,499991

0,000017

0,0005

3,481

0,9995

4,4

0,499995

0,000011

0,0004

3,540

0,9996

4,5

0,4999966

0,0000068

0,0003

3,615

0,9997

4,6

0,4999979

0,0000041

0,0002

3,720

0,9998

4,7

0,4999987

0,0000025

0,0001

3,891

0,9999

4,8

0,4999992

0,0000016

105

4,417

1105

4,9

0,4999995

0,0000009

106

4,892

1106

5,0

0,4999997

0,0000006

107

5,327

1107

У таблиці значень Ф(t) помилка лінійної інтерполяції зменшується із збільшенням значень t; вона не перевершує:

10-4- в інтервалі (2,5…3,2); 10-5 - в інтервалі (3,2…3,9);

10-6- в інтервалі (3,9…4,5); 10-7- в інтервалі (4,5…5,0).

У таблиці значень t(R) інтерполяцію не проводять.

Таблиця Г7. Критичні значення 2при надійності R числі ступенів свободи k=n-3

k

Значення R

0,80

0,90

0,95

0.98

0,99

0,995

0,998

0,999

4

5,99

7,78

9,49

11,67

13,28

14,9

16,9

18,5

5

7,29

9,24

11,07

13,39

15,09

16,3

18,9

20,5

6

8,56

10,64

12,59

15,03

16,8

18,6

20,7

22,5

7

9,80

12,02

14,07

16,6

18,5

20,3

22,6

24,3

8

11,03

13,36

15,51

18,2

20,1

21,9

24,3

26,1

9

12,24

14,68

16,9

19,7

21,7

23,6

26,1

27,9

10

13,44

15,99

18,3

21,2

23,2

25,2

27,7

29,6

11

14,63

17,3

19,7

22,6

24,7

26,8

29,4

31,3

12

15,8

18,5

21,0

24,1

26,2

28,3

31,0

32,9

13

17,0

19,8

22,4

25,5

27,7

29,8

32,5

34,5

14

18,2

21,1

23,7

26,9

29,1

31,3

34,0

36,1

15

19,3

22,3

25,0

28,3

30,6

32,7

35,6

37,7

16

20,5

23,5

26,3

29,6

32,0

34,2

37,1

39,3

17

21,6

24,8

27,6

31,0

33,4

35,7

38,6

40,8

18

22,8

26,0

28,9

32,3

34,8

37,2

40,1

42,3

19

23,9

27,2

30,1

33,7

36,2

38,6

41,6

43,8

20

25,0

28,4

31,4

35,0

37,6

40,0

43,1

45,3

22

27,3

30,8

33,9

37,7

40,3

42,7

45,9

48,3

24

29,6

33,2

36,4

40,3

43,0

45,5

48,7

51,2

26

31,8

35,6

38,9

42,9

45,6

48,2

51,5

54,1

28

34,0

37,9

41,3

45,4

48,3

51,0

54,3

56,9

30

36,3

40,3

43,8

48,0

50,9

53,7

57,1

59,7

Примітка. При k > 30 для критичного значення 2 можна користуватися наближеним значенням

,

де t(R) береться з табл. Г6.

Наприклад, при R=0,99 маємо t(0,99)= 2,576; тому при k =100 критичне значення 2 рівне: .