Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

big_doc_LKG

.pdf
Скачиваний:
17
Добавлен:
07.02.2016
Размер:
20.24 Mб
Скачать

Формування вихідної інформації для аналізу і дослідження систем

71

 

 

.

(1.68)

У відповідності з отриманим значенням

 

із вибірки вилучають

екстремальне спостереження

або

. Така процедура повторю-

ється разів. Обчислення послідовних статистик здійснюється до тих пір, доки . В результаті отримуємо послідовність статистик

. Отримані статистики порівнюються з критичними значеннями , наведеними в табл. 1.25.

Всі спостереження даної послідовності, для яких виконується умо-

ва , вважаються викидами.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблиця 1.25

 

 

 

Критичні значення

 

 

для рівня значимості

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

10

2

1

2,39

20

4

1

2,95

 

35

2

 

1

3,09

50

4

3

2,72

80

3

3

2,81

 

10

2

2

2,17

20

4

2

2,63

 

35

2

 

2

2,74

50

4

4

2,59

80

4

1

3,57

 

11

2

1

2,45

20

4

3

2,49

 

40

2

 

1

3,17

50

5

1

3,45

80

4

2

3,05

 

11

2

2

2,23

20

4

4

2,39

 

40

2

 

2

2,77

50

5

2

2,96

80

4

3

2,84

 

12

2

1

2,50

20

5

1

2,97

 

40

3

 

1

3,22

50

5

3

2,74

80

4

4

2,69

 

12

2

2

2,27

20

5

2

2,65

 

40

3

 

2

2,81

50

5

4

2,61

80

5

1

3,61

 

13

2

1

2,57

20

5

3

2,51

 

40

3

 

3

2,62

50

5

5

2,52

80

5

2

3,11

 

13

2

2

2,31

20

5

4

2,42

 

40

4

 

1

3,32

60

2

1

3,34

80

5

3

2,86

 

14

2

1

2,62

20

5

5

2,37

 

40

4

 

2

2,86

60

2

2

2,90

80

5

4

2,72

 

14

2

2

2,39

25

2

1

2,99

 

40

4

 

3

2,67

60

3

1

3,42

80

5

5

2,62

 

15

2

1

2,65

25

2

2

2,62

 

40

4

 

4

2,55

60

3

2

2,95

100

2

1

3,52

 

15

2

2

2,42

30

2

1

3,05

 

40

5

 

1

3,31

60

3

3

2,73

100

2

2

3,03

 

16

2

1

2,70

30

2

2

2,67

 

40

5

 

2

2,88

60

4

1

3,48

100

3

1

3,60

 

16

2

2

2,44

30

3

1

3,12

 

40

5

 

3

2,69

60

4

2

2,98

100

3

2

3,10

 

17

2

1

2,75

30

3

2

2,73

 

40

5

 

4

2,55

60

4

3

2,77

100

3

3

2,86

 

17

2

2

2,48

30

3

3

2,56

 

40

5

 

5

2,47

60

4

4

2,63

100

4

1

3,64

 

18

2

1

2,79

30

4

1

3,16

 

45

2

 

1

3,17

60

5

1

3,51

100

4

2

3,13

 

18

2

2

2,46

30

4

2

2,77

 

45

2

 

2

2,82

60

5

2

3,01

100

4

3

2,89

 

19

2

1

2,80

30

4

3

2,59

 

50

2

 

1

3,27

60

5

3

2,77

100

4

4

2,74

 

19

2

2

2,49

30

4

4

2,49

 

50

2

 

2

2,85

60

5

4

2,65

100

5

1

3,70

 

20

2

1

2,83

30

5

1

3,19

 

50

3

 

1

3,34

60

5

5

2,56

100

5

2

3,16

 

20

2

2

2,52

30

5

2

2,78

 

50

3

 

2

2,89

80

2

1

3,45

100

5

3

2,91

 

20

3

1

2,88

30

5

3

2,60

 

50

3

 

3

2,68

80

2

2

3,03

100

5

4

2,77

 

20

3

2

2,60

30

5

4

2,51

 

50

4

 

1

3,40

80

3

1

3,49

100

5

5

2,67

 

20

3

3

2,45

30

5

5

2,45

 

50

4

 

2

2,93

80

3

2

3,03

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

72

Розділ 1

Приклад 20. Для ряду спостережень прикладу 15 перевірити наявність викидів і встановити їх кількість за критерієм Роспера з довірчою ймовірністю .

Розв’язок. Визначаємо для повної вибірки

;

.

Обчислюємо

статистику

 

 

 

 

 

 

 

 

 

.

 

Виключаємо із вибірки значення

, яке відповідає отриманому максимуму.

Для залишку членів вибірки ( ) знаходимо

,

;

 

 

 

 

 

.

 

Так як

, продовжуємо обчислення. Виключаємо із вибірки значення

, яке відповідає максимуму.

 

 

 

 

Для залишку

спостережень маємо

;

;

 

 

 

 

 

.

 

Так як

, то продовжуємо обчислення. Виключаємо із вибірки значення

, що відповідає максимуму.

 

 

 

 

Для залишених

вибіркових даних знаходимо

 

;

;

.

Так як , то подальше обчислення припиняємо. Перевіримо тепер значимість послідовності статистик

 

;

;

;

.

 

Із табл. 1.25

для

, і

визначаємо

критичні

значення

;

 

;

;

 

. Так як

 

;

 

;

 

;

 

,

то робимо висновок, що спостереження

;

;

;

не є викидами.

 

 

 

Формування вихідної інформації для аналізу і дослідження систем

73

1.4.2. Експоненціальний розподіл статистичних даних

1.4.2.1. Критерій Смоляка-Титаренка. Для експоненціального розподілу найбільш підозрілим вважають спостереження з максимальним значенням, яке має найменшу імовірність.

Починаючи з останнього елемента ранжованої вибірки, обчислюється статистика

 

 

 

 

 

 

 

 

 

;

 

,

 

 

 

(1.69)

 

де

– максимальний елемент ранжованого ряду.

 

 

 

 

 

Елемент вибірки

 

 

вважається викидом за умови

 

 

Критичні значення

 

наведені в табл. 1.26.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблиця 1.26

 

 

 

Критичні значення

 

 

для рівня значимості

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

 

3,072

14

4,921

24

 

5,648

 

34

6,093

44

6,412

 

70

6,967

 

5

 

3,419

15

5,019

25

 

5,702

 

35

6,129

45

6,439

 

75

7,047

 

6

 

3,697

16

5,107

26

 

5,752

 

36

6,165

46

6,467

 

80

7,122

 

7

 

3,928

17

5,190

27

 

5,800

 

37

6,199

47

6,492

 

85

7,192

 

8

 

4,125

18

5,267

28

 

5,847

 

38

6,232

48

6,518

 

90

7,257

 

9

 

4,297

19

5,340

29

 

5,892

 

39

6,261

49

6,543

 

95

7,319

 

10

 

4,449

20

5,408

30

 

5,936

 

40

6,295

50

6,567

 

100

7,378

 

11

 

4,586

21

5,473

31

 

5,977

 

41

6,326

55

6,682

 

 

 

 

12

 

4,709

22

5,553

32

 

6,020

 

42

6,355

60

6,786

 

 

 

 

13

 

4,821

23

5,592

33

 

6,059

 

43

6,381

65

6,880

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Приклад 21. Транспортна партія дрібнопартіонних вантажів включає такі вантажні одиниці за масою ()

: 7, 10, 12, 13, 15, 22, 26, 30, 32, 38, 45, 47, 52, 60, 75, 80, 88, 105, 118, 148.

Необхідно перевірити наявність викидів за критерієм Смоляка-Титаренка з довірчою імовірністю .

Розв’язок. Маємо ; .

74

Розділ 1

Для

 

і

із табл. 1.26 знаходимо

.

Так

як

не

перевищує критичного значення

, то найбільше значення

 

не може бути визнане викидом.

 

1.4.2.2. Критерій Кімбера для декількох викидів. Послідовна про-

цедура для виокремлювання найбільших викидів здійснюється за допомогою статистики

,

(1.70)

де – кількість виокремлених найбільших спостережень.

Для відомого критичного значення статистики

прийняття рі-

шення за гіпотезою здійснюється у відповідності з такими правилами:

1. Якщо для

із групи

виокремлених спостережень

виконується умова

 

 

 

 

,

 

 

то на рівні значимості

вважається, що

найбільших спостережень

у вибірці не є викидами.

 

 

2. Якщо

для

і

, то

найбільших спостережень є викидами.

 

3. Якщо

, то спостережень є викидами.

 

Для виокремлювання найменших за значенням викидів використо-

вується статистика

 

 

,

.

(1.71)

Очевидно, що . Процедура виокремлювання найменших викидів аналогічна процедурі виокремлювання найбільших викидів.

Критичні значення для виокремлювання найменших і найбільших викидів наведені в табл. 1.27 і табл. 1.28.

Формування вихідної інформації для аналізу і дослідження систем

75

Таблиця 1.27 Критичні значення для виокремлення найбільших викидів

()

 

 

 

 

 

 

 

 

 

 

 

1

2

3

4

 

1

2

3

4

 

 

 

 

 

 

 

 

 

 

10

0,4830

0,4340

 

 

28

0,2270

0,1810

 

 

11

0,4530

0,4010

 

 

30

0,2150

0,1710

 

 

12

0,4270

0,3720

 

 

35

0,1900

0,1500

 

 

13

0,4030

0,3480

 

 

40

0,1710

0,1340

 

 

14

0,3830

0,3270

 

 

45

0,1550

0,1210

 

 

15

0,3640

0,3080

 

 

50

0,1420

0,1110

 

 

16

0,3470

0,2920

 

 

60

0,1220

0,0470

 

 

17

0,3320

0,2770

 

 

70

0,1070

0,0630

 

 

18

0,3180

0,2640

 

 

80

0,0960

0,0740

 

 

19

0,3060

0,2520

 

 

90

0,0869

0,0670

 

 

20

0,2940

0,2410

 

 

100

0,0794

0,0612

 

 

22

0,2730

0,2220

 

 

120

0,0679

0,0523

 

 

24

0,2560

0,2060

 

 

140

0,0595

0,0459

 

 

26

0,2400

0,1930

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

15

0,3800

0,3210

0,3060

 

35

0,1980

0,1550

0,1390

 

16

0,3630

0,3040

0,2870

 

40

0,1790

0,1400

0,1250

 

17

0,3470

0,2880

0,2710

 

45

0,1660

0,1280

0,1130

 

18

0,3330

0,2740

0,2570

 

50

0,1470

0,1140

0,1010

 

19

0,3250

0,2660

0,2480

 

60

0,1270

0,0973

0,0860

 

20

0,3130

0,2550

0,2360

 

70

0,1110

0,0852

0,0751

 

22

0,2910

0,2350

0,2160

 

80

0,1030

0,0781

0,0685

 

24

0,2690

0,2140

0,1960

 

90

0,0932

0,0706

0,0706

 

26

0,2510

0,2000

0,1830

 

100

0,0853

0,0636

0,0559

 

28

0,2360

0,1880

0,1700

 

120

0,0626

0,0476

0,0417

 

30

0,2290

0,1800

0,1630

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

20

0,3210

0,2610

0,2410

0,2350

50

0,1550

0,1190

0,1050

0,0974

22

0,2990

0,2400

0,2210

0,2130

60

0,1340

0,1010

0,0892

0,0826

24

0,2800

0,2230

0,2030

0,1950

70

0,1170

0,0888

0,0779

0,0719

26

0,2630

0,2080

0,1890

0,1800

80

0,1050

0,0792

0,0693

0,0639

28

0,2480

0,1950

0,1760

0,1680

90

0,0948

0,0715

0,0625

0,0576

30

0,2350

0,1840

0,1660

0,1570

100

0,0866

0,0653

0,0571

0,0525

35

0,2080

0,1610

0,1440

0,1360

120

0,0740

0,0588

0,0487

0,0447

40

0,1870

0,1440

0,1280

0,1200

140

0,0647

0,0488

0,0426

0,0391

45

0,1690

0,1300

0,1150

0,1070

 

 

 

 

 

76

Розділ 1

 

 

 

 

 

 

 

 

 

Таблиця 1.28

Критичні значення

 

для виокремлення

найменших викидів

 

 

 

 

 

(

)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

10

0,977

0,837

 

 

 

 

 

 

 

 

 

15

0,977

0,829

 

0,984

0,855

0,705

 

 

 

 

 

20

0,976

0,825

 

0,984

0,852

0,698

0,988

0,868

0,717

0,596

 

50

0,975

0,819

 

0,983

0,846

0,687

0,987

0,863

0,706

0,580

 

100

0,975

0,817

 

0,983

0,845

0,683

0,987

0,861

0,702

0,575

 

200

0,975

0,816

 

0,983

0,843

0,681

0,987

0,860

0,700

0,573

 

 

 

 

 

 

 

 

 

 

 

 

 

Приклад 22. Для даних прикладу 21 перевірити наявність викидів за критерієм Кімбера при довірчій імовірності .

Розв’язок. Перевіряємо найбільші викиди. Обчислюємо:

 

 

;

 

;

 

 

;

 

.

Із табл. 1.27 для

і

маємо:

;

;

;

.

 

 

 

Порівнюючи значення

 

 

;

;

 

;

 

робимо висновок, що най-

більші викиди у виборці відсутні.

Перевіряємо найменші викиди. Маємо:

;

.

;

.

Із табл. 1.28 для і

визначаємо:

;

;

;

.

Формування вихідної інформації для аналізу і дослідження систем

77

Проводимо порівняння:

; ;

; .

Отже, найменші викиди теж відсутні.

1.5. Перевірка статистичної однорідності сукупності для незалежних вибірок

1.5.1. Теоретичні аспекти перевірки. До незалежних належать такі вибірки, в яких статистичні дані зібрані на різних об’єктах одного призначення, в різні періоди часу або в різних умовах функціонування систем.

Перевірка передбачає виявлення можливості об’єднати декілька незалежних вибірок в одну генеральну сукупність з метою виконання умови репрезентативності статистичної вибірки.

Однорідність сукупності оцінюється за допомогою -критерію, який визначається за формулами:

– для великих вибірок ()

;

(1.72)

– для малих вибірок ( n 30 )

 

 

,

(1.73)

де ,

– середні вибіркові значення випадкової величини відпо-

 

відно в і-й і j-й вибірках;

 

,

– дисперсії відповідних випадкових величин;

 

,

– обсяги вибірок.

 

78

Розділ 1

Для визначення істотності відмінностей двох вибірок із заданою довірчою імовірністю необхідно порівняти значення t , обчислене за здобутими вибірками, з критичним значенням .

Для великої вибірки () при визначенні з достатньою для практичних цілей точністю можна вважати, що величина підпорядковується закону нормального розподілу і може бути отримана із залежностей

або .

У таблиці функції Лапласа (додаток Д5) відшукують значення аргументу , якому відповідає значення функції або .

Значення для найбільш часто застосовуваних значень довірчої імовірності наведені в табл. 1.29.

 

 

 

 

 

 

Таблиця 1.29

 

 

Значення

 

 

 

 

 

 

 

 

 

 

 

 

0,90

 

0,95

 

0,99

 

 

 

1,65

 

1,96

 

2,58

 

 

Для малої вибірки (

) критичне значення

визначають за

t-критерієм Стьюдента з кількістю ступенів вільності

 

 

(додаток Д6).

 

 

 

 

 

 

Якщо обчислене значення

 

, то з надійністю

можна вважа-

ти відмінності між вибірковими середніми істотними (невипадковими), тобто вибірки вважають неоднорідними. Якщо вибіркове значення менше критичного (), то відмінність між вибірковими середніми можна вважати неістотними (випадковими), тобто вибір-

ки із заданою надійністю вважають однорідними.

У загальному випадку, коли статистична сукупність задана неза-

лежними частинними вибірками об’ємами

, , …,

з відповід-

ними вибірковими середніми , , ...,

і дисперсіями

, , ...,

, перевірку однорідності виконують таким чином: із даної множини

вибираються дві частинні вибірки відповідно з максимальним

і

мінімальним

вибірковими середніми і для них за формулами

(1.72) або (1.73)

обчислюється критерій t .

 

Формування вихідної інформації для аналізу і дослідження систем

79

На початковому етапі, коли закон розподілу генеральної сукупності невідомий, оцінити розходження двох вибіркових середніх можна тільки приблизно.

Якщо , то з великою імовірністю вважають, що вибіркові середні , відрізняються суттєво і, навпаки, якщо , розходження між , з великою ймовірністю можна вважати несуттєвим, випадковим.

У разі виконання умови однорідності вибірок їх об’єднують в одну сукупність і подальший статистичний аналіз здійснюють з об’єднаною вибіркою. Якщо умова не виконується, то для подальшого аналізу приймають вибірку з меншим значенням стандартного відхилення .

Приклад 23. Статистичні дані тривалості робочого циклу (с) електронавантажувача при розвантаженні тарно-штучних вантажів із критих вагонів представлені трьома незалежними вибірками.

Номер

 

 

 

 

 

Номер спостереження

 

 

 

 

 

вибірки

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

20

60

16

25

80

25

18

20

35

40

16

30

25

18

40

2

15

16

18

18

30

60

40

20

22

30

34

35

60

3

44

30

25

60

55

50

40

42

80

30

16

19

40

70

Необхідно перевірити статистичну однорідність вибірок.

Розв’язок. Обчислюємо середні вибіркові і дисперсію для відповідних вибірок:

с;

с;

с;

с2;

с2;

с2;

За формулою (1.73) обчислюємо статистики t :

– вибірки 1–2

;

– вибірки 1–3

;

80

Розділ 1

– вибірки 2–3

.

Обчислюємо число ступенів вільності і із додатку Д6 для визначаємо критичне значення :

вибірки 1–2: ; ; вибірки 1–3: ; ; вибірки 2–3: ; .

Порівнюємо розрахункові та критичні значення. Так як , , , то статистичні сукупності можна вважати однорідними. Це означає, що всі випадкові величини належать до одні-

єї генеральної сукупності.

1.5.2. Перевірка однорідності вибірок на ЕОМ в інтерфейсі

STATISTICA. Для перевірки статистичної однорідності незалежних вибірок використовується статистична процедура T-TEST FOR

INDEPENDENT SAMPLES T-ТЕСТ ДЛЯ НЕЗАЛЕЖНИХ ВИБІРОК. У цьому випадку досліджувані вибірки можуть мати різну кількість випадків. Виконання тесту виконується у такій послідовності:

1) для реалізації процедури необхідно викликати діалогове вікно статистичних процедур модуля (рис. 1.1) та активізувати у ньому пункт . Після натискання кнопки ОК чи подвійного натискання миші на обраному пункті на екрані з’явиться діалогове вікно T-

TEST FOR INDEPENDENT SAMPLES (GROUPS) – Т-ТЕСТ ДЛЯ НЕЗАЛЕЖНИХ ВИБІРОК (ГРУП) (рис. 1.8);

Рис. 1.8. Діалогове вікно Т-тесту для незалежних вибірок

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]