Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Химмельблау Д. Анализ процессов статистическими методами

.pdf
Скачиваний:
28
Добавлен:
27.10.2023
Размер:
31.74 Mб
Скачать

152 Глава 3

примерно подчиняется ^-распределению

с п — 1 степенями сво­

боды.

Дл я больших значений

ѵг

величина

с «

1.

Д л я

частного случая, когда

все ѵг- равны,

так что

 

 

 

 

 

п

 

 

 

 

 

 

t-^-nVi

( i n s 2

- - ^ 2

l n s

i )

'

(3.6.3)

где с =

1 + [(re -г 1)/3пѵг ].

Если

значение

%2, вычисленное по

формуле

(3.6.2) или (3.6.3), превышает значение Хі-« Д д я ге — 1

степени

свободы, то испытываемая

гипотеза,

утверждающая, что

а\ =

а\

= . . ., отвергается. В

работе Хальда

[7]

обсуждаются

некоторые дополнительные возможности и ограничения приме­ нения критерия Бартлетта, из которых наиболее существенным и критичным является требование, чтобы наблюдения были рас­ пределены по нормальному закону.

Пример 3.6.3. Критерий непостоянства а 2

Было проведено десять повторных измерений потерь при кор­ розии Y для четырех различных по количественному составу сплавов X. Результаты приведены в табл. П.3.6.3 и на фиг. П.3.6.3.

Таблица П.3.6.3

Результаты экспериментов по измерению потерь при коррозии

г

х і

Vi

YH

Yi2

Yis

YU

 

1

1,28

10

6,34

6,36

6,41

6,42

6,80

2

1,30

10

5,95

6,04

6,11

6,31

6,36

3

1,40

10

5,23

5,27

5,32

5,39

5,40

4

1,48

10

4,55

4,65

4,68

4,68

4,72

г

YU

Yn

YiS

Yi9

YH0

Y i

4

1

6,85

6,91

6,91

7,02

7,12

6,71

0,091

2

6,52

6,60

6,62

6,64

6,71

6,39

0,076

3

5,52

5,52

5,53

5,60

5,78

5,46

0,020

4

4,73

4,78

4,78

4,84

4,86

4,72

0,009

Чтобы убедиться, являются ли дисперсии при различных зна­ чениях Xt одинаковыми (однородность дисперсий), можно прове­ сти некотопое испытание, использѵя кпитепий Бяптлеття. Если

Статистический

анализ и его

применения

153

величина Л превышает значение %2, найденное по таблицам при­ ложения В для данного значения а, то гипотеза Н0 о том, что

7,50

 

7,00

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6,50

 

1

 

 

 

 

 

 

 

 

 

 

I

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

600

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

550

_

 

 

 

 

 

 

 

 

 

 

 

<

 

t

 

 

 

 

 

 

 

 

Эксперименталбные

S

 

 

 

 

 

 

 

5,00

точки

 

 

 

 

 

 

 

 

- -У,-

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

450

 

 

 

 

 

 

Г

 

 

 

 

 

1

1

1

 

1

1

 

 

 

 

 

130

 

IAO

 

 

 

1,50

 

 

Ф и г . П . 3 . 6 . 3 . Результаты экспериментов по изучению коррозии для

сплавов .

дисперсии

одинаковы, отвергается. Здесь

n =

4, p t

= 10,

2 Р г

=

= 40, Vi = pi — 1.

 

 

 

 

 

 

 

 

 

<=1 + и ( і і - ^ Ч = i ( 4 4 ) -*.

 

 

 

i=l

 

 

 

 

 

 

 

 

 

 

 

 

i=l

 

 

 

 

 

 

 

 

 

1

2

(Pi - 1 ) *! =

40^4

 

2 9s* « °'0 4 9 '

 

 

 

 

 

 

 

2 P i — и

i=i

 

 

 

 

 

 

 

 

 

i=l

 

 

 

 

 

 

 

 

 

 

 

Л :

- 2 ^

 

l Q ^ = - 9 2 l n ô W « 1 5 , 3 .

 

 

 

 

i=l

 

 

i = l

 

 

 

 

 

 

При a

= 0,05

и числе степеней свободы n — 1 =

3 значение

у?

из таблиц равно 7,81; таким образом, гипотеза о равенстве диспер­ сий для различных Xt отвергается. На фиг. П.3.6.3 показано, как изменяется дисперсия в зависимости от X.

154

Глава 3

Д л я

многих экспериментов предположение о том, что наблю­

даемые случайные величины распределены по нормальному зако­ ну, весьма обосновано; исследователь может выполнить подходя­

щие проверки этого

предположения, часть из

которых

описана

в разд. 3.7. Однако

допустим, что наблюдаемые

случайные

вели­

чины не распределены по нормальному закону.

Что

можно

ска­

зать в таком случае

о применимости критерия

F?

Критерий F

и особенно критерий

Бартлетта для сравнения

дисперсий

весьма

Ф и г . 3.6.1. Логарифмическое преобразование .

чувствительны к отклонениям от нормального закона; если пред­ положение о нормальности распределения не выполняется, эти критерии должны быть видоизменены или нужно использовать другие критерии.

Другим методом решения проблемы, связанной с отклонением "распределения измеряемых случайных величин от нормального,

является

использование некоторого

преобразования

переменных

•с целью

приблизить распределение

данных к

нормальному

и уменьшить различия между дисперсиями отдельных групп дан­ ных. Эти преобразования можно рассматривать как некоторое изменение масштаба для первоначальных переменных, позволяю­ щее расположить их наиболее благоприятным образом. Например, логарифмическое преобразование заменяет резко асимметричное распределение, изображенное на фиг. 3.6.1, а, на распределение, гораздо более похожее на нормальное (фиг. 3.6.1, б). Однако, пытаясь разрешить существующие проблемы с помощью пре­ образований, следует быть достаточно осторожным, чтобы случай­ но не создать новые трудности.

Пример 3.6.4. Преобразование плотности распределения

вероятности

Роуз и Инглиш [10] исследовали распределение прочности на разрыв для одинаковых бумажных пакетов, содержащих равное количество некоторого вещества, при бросании в заданных уело-

Статистический

анализ и его

применения

155

виях. Соответствующее распределение относительных частот для 200 пакетов изображено на фиг. П.3.6.4а в зависимости от числа бросаний, т. е. числа бросаний с определенной высоты до того

 

о

20

40

60

80

100

120

140

160

 

 

 

Число бросаний

N

 

 

 

Ф и г .

П . 3 . 6 . 4а . Распределение

прочности на разрыв пакетов [10].

Вещество: песок; средний размер частиц 150

мкм; размеры пакета: 10

х 6,3 см; партия:

 

 

 

 

200

пакетов.

 

 

 

момента,

когда пакет

лопнет.

Те

же данные

представлены на

фиг. П.3.6.46 в виде зависимости от логарифма числа бросаний. Авторам удалось, используя соответствующие статистические критерии, связать распределение относительных частот с лога­ рифмически нормальным распределением. Затем они теоретически

Ф и г . П . 3 . 6 . 46 . Данные фиг. П . 3 . 6 . 4а в логарифмическом масштабе [10].

обосновали, почему такое распределение следовало ожидать. Кроме того, зная исходное распределение, оказалось возможным только двумя параметрами, средним значением и стандартным

156

Глава 3

отклонением, описать ~2000 испытаний пакетов с другим напол­ нением.

Если данные можно получить без особых затруднений и затрат, простейшим методом нормализации распределения является усреднение данных по группам и проведение проверок по сред­ ним в группе. Рациональность такого подхода базируется на центральной предельной теореме, упомянутой в разд. 2.4.1, согласно которой распределение суммы п случайных (распреде­ ленных не обязательно по нормальному закону) величин имеет тенденцию приближаться к нормальному распределению по мере возрастания объема выборки.

Выборочные дисперсии, если они получены из генеральной совокупности с одной и той же дисперсией а 2 , могут быть объеди­ нены для улучшения оценки а 2 . Однако, если выборочные диспер­

сии основаны на выборках из неоднородной совокупности,

объеди­

ненная величина s2 не является

удовлетворительной оценкой а 2 ;

доверительные интервалы и уровни значимости,

связанные с нейг

в таком случае искажаются.

 

 

 

В заключение следует сделать одно замечание. Так как пред­

ставление информации в виде доверительных пределов и

провер­

ка гипотез опираются на одни и те же исходные параметры,

можно

поставить вопрос, какая форма

представления

предпочтитель­

нее? Можно сделать заключение, что если доверительный интервал не включает выборочное среднее, нулевая гипотеза отвергается — такой же вывод можно получить при проверке гипотезы. Однако использование доверительных пределов может оказаться более предпочтительным, так как это дает исследователю представление

о степени неопределенности параметров, а не

просто ответ «да»

или «нет», который получается

при проверке

гипотез.

3.7. Н Е П А Р А М Е Т Р И Ч Е С К И Е

К Р И Т Е Р И И

( К Р И Т Е Р И И

С П Р О И З В О Л Ь Н Ы М

Р А С П Р Е Д Е Л Е Н И Е М )

Все критерии, которые рассматривались до сих пор, явно включали предположение о том, что исследуемые случайные величины распределены по некоторому известному закону, как правило, по нормальному. Такие критерии называются параме­ трическими. Существуют другие типы критериев, включающие ранговую корреляцию и проверку знаков, которые не требуют таких предположений и называются непараметрическими, крите­ риями или критериями с произвольным распределением. (Непара­ метрические характеристики реально применимы только к уровню значимости и лишь для выборок непрерывных величин. Во многих непараметрических критериях вероятностные соотношения в дей­ ствительности зависят от распределения вероятности случайной

Статистический

анализ и его

применения

157

переменной.) Непараметрические методы можно использовать при проверке гипотез для того, чтобы найти интервальную или даже точечную оценку параметров и т. д. Например, непараметриче­ ской оценкой среднего по ансамблю служит медиана случайной выборки (центральное значение переменной для нечетных п и сред­ нее двух центральных значений для четных п)\ непараметриче­ ской оценкой стандартного отклонения является размах (абсо­ лютная величина разности между наибольшим и наименьшим значениями в выборке). Ни одна из этих статистик не является столь эффективной, как выборочное среднее и выборочное стан­ дартное отклонение, которые описывались выше.

Здесь будет рассмотрено лишь несколько непараметрических критериев, главным образом те, которые могут заменить пара­ метрические критерии для средних и дисперсий, описанные в раз­ делах 3.4 и 3.5, а также критерии, которые могут быть исполь­ зованы при установлении стационарности, случайности и нор­ мальности случайных переменных. Большинство монографий по статистике содержит главу, в которой описаны различные типы непараметрических критериев; Сэвидж [11] составил хорошую библиографию, посвященную применениям таких критериев.

3.7.1. Критерий

знаков

для разности

медиан

в парных

наблюдениях

 

Простейшим непараметрическим критерием, который можно использовать вместо критерия t, является критерий знаков для парных наблюдений. Предположим, что проведено п пар изме­ рений некоторой случайной величины, причем одно из каждой пары при условии А, а другое при условии В. Если нет нулевых разностей, то разности At — Bt либо положительны, либо отри­ цательны; положительный результат распределен как биномиаль­ ная переменная с Ѳ = Ѵ2 . (Полученные при расчете нулевые разности могут быть обработаны различными способами, ни один из которых не является полностью удовлетворительным. Но если доля нулевых разностей невелика, скажем меньше 5%, пары наблюдений с нулевой разностью можно опустить из рассмотрения или поделить поровну между положительными и отрицательными исходами.) Так как критерий знаков основан на биномиальном распределении, биномиальные события должны быть независимы (табл. 2.3.1), т. е. знак разности для одной пары измерений никак не должен влиять на знак разности любой другой пары, а выборка должна быть случайной. Кроме того, исходы должны быть непре­ рывными.

Д л я

каждой

разности At

— Bt

вероятность P {At >

Bt}

— Р {At

< Bi)

= У2, если % {Ai

— В{} = 0.

Критерий

знаков

просто

проверяет гипотезу,

утверждающую,

что параметр

Ѳ

158

Глава

3

в биномиальной

плотности равен

Ѵ2 , т. е. по экспериментальным

данным проверяется нулевая гипотеза, что совокупность разно­ стей А — В имеет медиану, равную нулю. Пусть г — число слу­ чаев реже встречающегося знака, а п г — число случаев чаще встречающегося знака после распределения случаев нулевой разности. Тогда накопленная вероятность получения г или мень­

шего числа

знаков, если справедлива нулевая гипотеза ( Я 0 :

эффекты А

и В одинаковы), равна

• і=0

Нулевая гипотеза отвергается согласно двустороннему критерию, если

P<Y или і > > 1 _ - J - .

Если используется односторонний критерий и альтернативная гипотеза состоит в том, что разность медиан меньше нуля, то

нулевая гипотеза

отвергается,

если Р ^ а; при

противополож­

ной альтернативной гипотезе нулевая гипотеза

отвергается, если

Р > 1 — ос. Д л я

разностей,

распределенных

по

нормальному

закону, односторонний критерий знаков имеет асимптотическую эффективность относительно критерия t, равную 2/я « 0,637.

Пример 3.7.1. Критерий знаков

В табл. П.3.7Л записаны десять пар измерений процентного содержания двуокиси серы в отходящих газах дымовой трубы для двух различных степеней измельчения топлива А ж В. Прове­ рим предположение, что в обоих случаях степень загрязнения двуокисью серы одинакова-

 

 

 

 

 

 

 

 

Таблица

П.3.7.1

 

 

Процентное

содержание

двуокиси серы

 

 

 

Степень

 

 

 

 

Номер выборки

 

 

 

 

 

 

 

 

 

 

 

 

 

 

измель­

1

2

3

4

5

6

7

8

9

10

чения

А

2,4

2,7

2,0

1,9

2,2

2,3

2,3

2,1

2,4

2,6

В

2,6

2,6

2,0

1,8

2,0

2,0

2,4

2,1

2,1

2,5

Знак А—В

+

0

+

+

+

0

+

+

Было получено шесть плюсов и два минуса. Если нулевые разности разделить поровну между положительными и отрица­ тельными, то будем иметь г = 3, n — г = 7. Затем, используя

Статистический

анализ и его

применения

159

таблицы для биномиального распределения накопленной вероят­ ности, вычислим

р { Г <^ 3} =

Р {г =

0} +

Р {г =

1} + Р {г = 2} +

 

 

 

+

Р {г =

3} =

0,001 +

0,010 + 0,044 + 0,117

=

0,172.

 

Если уровень значимости а выбран равным 0,05, а/2 =

0,025,

и

так как 0,172 > 0,025, то нулевую гипотезу следует

принять.

В

табл. В.5 (взята

из

работы

[12]) приводится число

плюсов,

необходимое для того, чтобы отвергнуть гипотезу, для различных критических областей. При пользовании этой таблицей нулевые разности нужно отбросить. Например, пусть п = 8, г = 2, а и»

таблицы

при а/2 =

0,025

критическое

значение г равно нулю.

Так как

2 > 0, гипотеза

принимается.

 

3.7.2.

Критерий U* Манна

— Уитни

Среди непараметрических критериев критерий U* Манна — Уитни является наиболее мощным критерием, заменяющим кри­ терий t. Этот общий метод, впервые предложенный Уилкоксоном и другими, был усовершенствован и представлен в форме таблиц Манном и Уитни [13]. Он может быть применен для проверки идентичности двух совокупностей. Пусть взята некоторая выборка, состоящая из п наблюдений (обозначаемых символом х), и выбор­ ка из m наблюдений (обозначаемых символом у) предположи­ тельно из одного и того же непрерывного ансамбля. Затем эти n + m наблюдений записываются в порядке возрастания значений независимо от их принадлежности к той или иной выборке. Каждое упорядоченное таким образом наблюдение заменяется символом х или у в соответствии с тем, из какой выборки взято это наблюде­ ние. В результате получается некоторый структурный ряд, содер­ жащий п символов X и m символов у, перемешанных между собой. Если все m + п наблюдений были различны, то можно было бы получить (т + п)\ различных структур. Однако для каждой действительно отличной от других структуры возможны п\ пере­ становок символов X, которые ее не меняют, и аналогично ml перестановок символов*!/. Поэтому всего имеется

(т-\-п)\

fm-\-n\

п\т\

V m I

различных структур.

 

Если две выборки извлекаются из одного'и того же ансамбля,

то каждая

из структур равновероятна; однако, если выборки

берутся из

разных ансамблей, следует ожидать, что возникнут

структуры, в которых символы X будут скапливаться на одном

конце ряда, а символы у — на другом. Статистикой U*,

лежащей

в основе рассматриваемого критерия, является число

случаев,

160 Глава 3

когда символ у предшествует символу х. Величина U* равна числу символов у, предшествующих наименьшему символу х, плюс число символов у, предшествующих следующему по величине символу х, включая все символы у, уже вошедшие в первую группу, и так далее, пока не будет подсчитано и включено в сумму число симво­ лов у, предшествующих последнему символу х. Если нулевая

гипотеза справедлива, то вероятность обнаружить

некоторое

значение U* равна той доле полного числа возможных

структур

Im 4-

д\

 

 

 

U* равны

 

 

 

I

I , в которых

величины

или больше

величин,

полученных

экспериментально.

(Нулевая

гипотеза Н0

состоит

 

 

 

Im

4 - п\

 

 

 

 

в том, что

каждая из I

I

структур

равновероятна;

тем

самым

это

означает,

что

обе

выборки

извлекались

случайно

и независимо друг от друга

из одной и той же генеральной

сово­

купности.) Испытание будет значимым при уровне значимости а, если P {U* ^ £/„} = а. В случае совпадения величин реко­ мендуется приписывать каждому члену группы совпадающих величин среднее значение рангов совпадающих членов, подсчитан­ ных последовательно. Если сумма рангов, т. е. сумма значений, приписанных рангам, не является целой, ее следует округлить до ближайшего целого числа; в литературе, приведенной в конце этой главы, описаны некоторые другие способы применения дан­ ного критерия.

Чтобы применить этот критерий, некоторый член xt выборки меньшего объема нужно заменить і-ш символом х (в порядке возрастания значений) и выписать его ранг согласно структуре, содержащей символы х и у. Обозначим через ut число символов у, предшествующих значению xt. Пусть Тх обозначает сумму рангов наблюдений х (Т представляют собой критические значения Т Уилкоксона [14], приведенные во многих монографиях по ста­ тистике). Статистика U* Манна —Уитни связана с Тх следую­ щим образом: •

 

n

n

n

 

Г я =

2 г , =

2 (і + и , ) = п Л + і + 2 т = пЦ±

+ и*, (3.7.2)

 

і=1

i=l

i=l

 

где n — число

элементов в выборке меньшего объема. Сумму

рангов для у, Ту, также можно выразить через U*. Сумма всех

рангов

просто

равна их числу,

умноженному

на средний ранг,

или х / 2 (m 4- n) (m 4- п 4- 1).

Статистика Ту

равняется

V 2 (m -f- n) (m 4- n 4-

1) — Tx,

или

 

Ty

= mn+

го("+4)—17*.

(3.7.3)

 

Статистический

анализ

и его

применения

 

 

161

Таким образом,

нет

необходимости

подсчитывать

статистику

U*,

вычисляя

2 иі

( ч т о

может

оказаться

весьма

утомительным),

а достаточно

воспользоваться

соотношениями

(3.7.2)

или

(3.7.3).

 

 

у, которые или предшествуют,

 

 

 

Число

символов

или

следуют

за некоторым х,

равно объему выборки т. Так как всего

имеется

п символов x, то общее число символов у, предшествующих или следующих за символами х, равно тп. Следовательно, величина тп — U* равна числу случаев, когда некоторый символ у следует за некоторым символом х, или когда х предшествует у. В боль­ шинстве таблиц, таких, как табл. В.6 приложения В, приводятся

лишь меньшие из значений U* или U*' =

тп

U*. В табл. В.6

m относится к выборке меньшего объема,

are

к выборке боль­

шего объема. Для выборок большого объема, превышающего таб­

личные значения, среднее значение U*

равняется Щ {U*} = х!гтп,

дисперсия

 

 

\т <тт&\

ліге (m +

ra-r-1)

Var {U*} =

S

'

a величина1 )

 

 

Z =

.

(3.7.4)

 

y V a r { £ / * }

представляет собой (приближенно) нормированную величину, рас­ пределенную по нормальному закону.

Асимптотическая эффективность критерия Манна — Уитни относительно критерия t равна 3/я « 0,955, если оба критерия применяются к нормальным совокупностям с однородными дис­ персиями. Таким образом, преимущество критерия t невелико; если данные отклоняются от нормального закона, то критерий Манна — Уитни может оказаться более мощным. Детали расчета иллюстрируются следующим примером.

Пример 3.7.2. Критерий Манна —Уитни

 

 

 

Пусть при

различных катализаторах

взяты

для

испытания

две выборки

А

и В.

Прирост

выхода для каждой из выборок

представлен

в

виде

таблицы

в порядке

возрастания

значений,

и имеется вторая таблица (здесь не приводится),

объединяющая

обе выборки

тоже в

порядке

возрастания:

 

 

•) Вычитание Ѵ 2 необходимо д л я непрерывности.

Соседние файлы в папке книги из ГПНТБ