книги из ГПНТБ / Химмельблау Д. Анализ процессов статистическими методами
.pdf
|
|
|
|
|
|
|
|
|
|
99,73% |
/ |
/ |
|
l |
u |
i |
1 |
I |
|
1 |
|
1 |
1 |
|
|
|
|
1 |
|
\ |
||
|
1 |
|
|
|
l |
1 i |
t |
1 |
||
/ |
< |
|
|
|
|
|
|
|
|
|
/ |
1 |
|
|
|
|
|
|
|
|
|
/ |
1 |
|
|
|
\ |
1 |
|
I |
|
\ |
/ |
J |
|
|
|
1 |
|
1 |
|
\ |
|
|
|
|
|
|
|
• |
|
\ |
|
\ |
|
|
|
|
|
>. |
1 |
|
1 |
|
\ |
/ |
/ |
|
|
|
\ |
1 |
|
1 |
|
\ |
|
|
|
\ |
1 |
|
1 |
|
1 |
||
/ |
/ |
|
|
|
|
|
||||
|
|
|
\ |
1 |
|
I |
|
\ |
||
. |
1 |
|
|
|
|
|
||||
; |
1 |
|
|
|
|
Y |
|
' |
|
' |
; |
1 |
|
|
|
|
|
|
|
|
|
/ |
1 |
' |
\ |
|
|
l |
\ |
1 |
|
1 |
1 |
1 |
|
|
|
||||||
|
|
|
|
1 |
X |
\ l |
|
\ |
||
|
|
|
|
|
|
I |
1 |
|
* |
/J . /
I |
/1 |
1 |
1 |
i / , • |
• o, |
A • |
• ^ — i - = s — . J |
|
|
|
|
|
|
|
^ |
- i |
|
M x - 3<гх |
д х - 2ffx |
м х - ax |
цх |
ßx+ |
crx ßx+2<rx |
ßx + 3<r. |
Ф и г . 2.3.4. Сравнение нормальных распределений вероятности для нор мированной случайной величины U и случайной величины X. Проценты характеризуют величину площади под к р и в о й в пределах, у к а з а н н ы х на оси х.
-3 |
-2 |
- 1 |
0 |
1 2 |
/формированная нормальная переменная к |
||||
Ф и г . 2.3.5. Нормальное |
(гауссово) |
распределение накопленной вероят |
||
|
|
ности. |
|
Распределения вероятности и выборочная статистика 63
а в других справочниках используется
|
|
|
|
и |
|
|
|
|
|
G(u) = -%=- |
[ e~t2dt. |
(2.3.56) |
|
|
|
|
У л |
J |
|
|
Полезное |
соотношение |
|
|
|
||
|
|
|
|
и |
|
|
|
Р(и)= |
( |
-4=^e-<2dt |
= 4r+ [ -4=e~t2dt |
|
(2.3.6) |
|
V ' |
J |
У 2л |
2 ^ J - | / 2 я |
v |
' |
|
|
- о о |
V |
0 |
|
|
нетрудно |
получить, |
учитывая симметрию графика |
фиг. |
2.3.5. |
Пример 2.3.2. Среднее значение и дисперсия нормированной величины, распределенной по нормальному закону
Покажем, что среднее значение U равно 0, а дисперсия U равна 1.
Решение
оо оо
Ш{Щ= j |
up(u)du^—±== |
j |
ue-^ßdu. |
(a) |
|||
— оо |
|
|
|
— оо |
|
|
|
Пусть и2І2 = t. Тогда |
и du |
= |
dt; t = |
оо |
при и |
= |
—оо. Следова |
тельно, |
|
|
|
|
|
|
|
|
|
О |
|
оо |
|
|
|
g{J7} = -jL-[ |
j |
e-*dt+ |
je-*d*] = |
0. |
(б) |
||
^ |
|
оо |
|
О |
|
|
|
Такой же результат можно получить, замечая, что u — нечетная функция, а е~и2'2 — четная, так что интегрирование их произве дения в симметричных пределах дает нуль.
оо
V a r { £ / } = j |
(и — 0)2p(u)du= |
|
|
|
|
(в) |
|
— оо |
|
|
|
|
|
|
|
|
|
оо |
|
|
ОО • |
|
|
= -4= |
Ç u2 e-"2 /2 d u = |
_ 2 |
Г и ? е - « » / 2 da = |
|
|||
|
У 2я |
J |
|
У 2 п |
J |
|
|
|
|
|
|
|
|
оо |
|
|
|
|
|
|
^ • |
[ ^ ' А . |
(г) |
|
|
|
|
|
|
о |
|
Так как |
гамма-функция, |
по |
определению, |
равна |
|
||
|
|
1 (и) = j |
*«-ie-« <ft |
|
|
|
о
64 |
Глава 2 |
r ( 4 - ) = J £ ,
интеграл в соотношении (г) равен
так что
Если получено достаточно много экспериментальных данных, то, прежде чем предполагать, что они описываются нормальным распределением вероятности, желательно: 1) исследовать распреде ление их относительных частот, используя критерии согласия, как описано в разд. 3.7.7, 2) построить график накопленной суммы частот на нормальной вероятностной бумаге которая линеари зует график Р (х) благодаря использованию специальной шкалы, или 3) провести какие-либо другие проверки, описанные в гл. 3. Во многих случаях экспериментальные данные хорошо описывают ся нормальным распределением вероятности, однако часто это распределение удобно использовать для непрерывных случайных величин, не распределенных по нормальному закону, поскольку
1. Величину можно преобразовать таким образом, чтобы пре
образованная |
величина |
имела нормальное распределение. |
||||
2. Распределение суммы |
случайных величин, распределенных |
|||||
не по нормальному закону, приближается к нормальному |
распре |
|||||
делению при стремлении |
к |
бесконечности |
объема |
выборки. |
||
3. Ошибка, |
связанная |
с |
применением |
статистических |
крите |
|
риев, основанных на предположении о нормальном |
распределении |
экспериментальных данных, которые в действительности описы ваются другим симметричным распределением, оказывается малой.
Пример 2.3.3. Графическая проверка нормальности распределения экспериментальных данных2 )
В табл. П.2.3.3 приведены диаметры 200 частиц, задержан ных фильтром нефтепровода. Количество частиц, попавших в выбранные интервалы диаметров, определяет частоту появления частиц в каждом интервале. Группировка данных сглаживает случайные колебания, свойственные небольшому количеству дан-
х ) 'Применение специальным образом разграфленной бумаги, линеари
зующей |
графики |
нормального |
и д р у г и х |
распределений, рассматривается |
|
в книге |
[3] и |
статье [4]. |
|
|
|
2 ) Данные |
и |
графики этого |
примера |
взяты из работы [5]. |
Распределения |
вероятности |
и выборочная |
статистика |
65 |
||||
|
|
|
|
|
|
|
Таблица |
Л.2.3.3 |
Распределение |
200 частиц, задержанных фильтром |
нефтепровода, |
||||||
|
|
|
по их |
размерам |
|
|
|
|
Диаметр, мкм |
Частота |
Накоп |
Скачки |
Среднее |
m |
Проценты |
||
появления |
ленная |
значение |
п + 1 |
|||||
|
частота |
|
скачка m |
|
||||
Меньше Ѳ,30 |
|
2 |
2 |
1 - 2 |
|
1,5 |
1,5/200 |
0,75 |
0,31—0,40 |
|
33 |
35 |
3 - 3 5 |
|
19 |
19/200 |
9,50 |
0,41 - 0,5 0 |
|
67 |
102 |
36—102 |
|
69 |
69/200 |
34,50 |
0,51—1,00 |
|
5 |
107 |
103—107 |
|
105 |
105/200 |
52,50 |
1,01-2,00 |
|
63 |
170 |
108—170 |
|
139 |
139/200 |
69,50 |
2,01—4,00 |
|
5 |
175 |
171—175 |
|
173 |
173/200 |
86,50 |
4,01 - 6,0 0 |
|
11 |
186 |
176-186 |
|
181 |
181/200 |
90,50 |
6,01—8,01 |
|
1 |
187 |
187 • |
|
187 |
187/200 |
93,50 |
8,01—10,00 |
|
11 |
198 |
188-198 |
|
193 |
193/200 |
96,50 |
10,01—20,00 |
|
1 |
199 |
199 |
|
199 |
199/200 |
99,50 |
ных, сохраняя основные, характерные черты собранного экспери ментального материала в целом. Выбор числа и величины интер валов группировки не должен приводить к большой потере информации о процессе. Обычно делают так, чтобы получилось от 10 до 20 одинаковых интервалов. В данном примере экспери ментальные данные группировались по интервалам разного раз мера (как это часто бывает на практике), что было связано со способом отбора частиц по размерам. Желательно получить некоторое представление о распределении частиц по размерам.
Д л я построения по экспериментальным данным графика преж де всего следует расположить интервалы группировки в порядке возрастания значений случайной величины X, как это сделано в первом столбце таблицы. Дл я каждого интервала указывается
частота появления и вычисляется накопленная |
частота. Каждому |
||||||
наблюдаемому |
значению |
х приписывается |
скачок, |
или ранг, |
|||
минимальное значение которого |
равно 1. Если частота |
появления |
|||||
некоторого значения х больше 1, то каждому |
значению |
приписы |
|||||
вается определенный ранг |
(т. е. трем наблюдениям приписывается |
||||||
три последовательных скачка). Дл я каждого |
значения |
х вычис |
|||||
ляется среднее |
значение |
ранга |
по формуле г ) |
|
|
||
|
|
|
"V |
рангов |
|
|
|
|
то = |
— = - |
^ |
. |
|
|
|
|
|
наблюдаемая |
частота п о я в л е н и я |
|
|
||
г ) К а к видно |
из табл. П . 2 . 3 . 3, среднее значение ранга равно |
полусумме |
|||||
его г р а н и ц . — Прим. |
ред. |
|
|
|
|
|
66 |
|
Глава |
2 |
|
По |
оси ординат |
при построении |
графика откладывается |
|
величинах ) |
|
|
|
|
|
Р = —^—г |
(п — полный объем выборки), |
||
которая |
представляет |
собой зависимую |
переменную. |
|
Так |
как график накопленной |
вероятности определяет вероят |
ность того, что переменная «равна или меньше, чем», то значение зависимой переменной следует откладывать над верхней границей каждого интервала. График, построенный по данным табл. П . 2 . 3 . 3 , дает сильно асимметричное распределение, на что указывает большая кривизна кривой на фиг. П . 2 . 3 . 3а . Эта кривая, а также физические соображения, что все измеряемые диаметры должны быть положительными и достигать н у л я (размеры частиц не могут быть отрицательными), наводят на мысль построить график
на |
логарифмически-нормальной |
бумаге, что и сделано |
на фиг. |
П . 2 . 3 . 36 . |
|
|
|
|
График на фиг. П . 2 . 3 . 36 при |
значениях диаметра, |
больших |
0,5 |
мкм, представляет собой практически прямую линию, в точке |
||
0,5 |
мкм он претерпевает внезапный излом и затем резко |
спадает |
|
до |
нуля . Обычно это указывает |
на существование каких-либо |
физических причин, запрещающих значения ниже (или выше) определенного уровня . В данном случае такая интерпретация не представляется разумной, поскольку техническими причинами нельзя объяснить отсутствие частиц с диаметром меньше 0,3 мкм.
В дальнейшем выяснилось, что это было связано с пределом разрешающей способности микроскопа, использовавшегося при измерениях. Дополнительные исследования показали, что около
5% проверяемых частиц имели диаметр меньше 0 |
,1 |
мкм, |
что |
|||
можно было |
предсказать, |
продолжая |
сплошную |
|
линию |
на |
фиг. П . 2 . 3 . 36 |
вплоть до 0,1 |
мкм. Можно |
ожидать, |
что частиц |
||
с диаметром больше 50 мкм будет очень |
мало (менее |
одной |
на |
|||
тысячу). |
|
|
|
|
|
|
Многомерная плотность нормального распределения вероят ности (2.3.7) является простым обобщением одномерной плотности
распределения. Д л я компактности запишем ее в матричной форме (приложение Б) 2 )
|
|
р (х ) |
= |
ке-ч^, |
(2.3.7) |
где положительное |
число |
|
|
|
|
|
, |
(det f - i ) 1 |
/ 2 |
_ |
1 |
Согласно |
работе |
[6]. |
|
|
|
2 ) Оставшуюся часть разд . 2.3.1, если это необходимо, можно изучать |
|||||
вместе с гл . 5. |
где даны матричные |
обозначения . |
99,9
О |
5 |
Ю |
15 |
20 |
|
Диаметр |
частиц, |
мкм |
|
Ф и г . П . 2 . 3 . 36 . График данных табл . |
П . 2 . 3 . 3 о размерах частиц на л о г а |
рифмически - нормальной |
вероятностной бумаге . |
68 |
Глава 2 |
определяемое из условия
называется нормировочным множителем, а
|
Gin |
f = Соѵ {Хг Х,} = |
— матрица размерности п х п, |
l _ Ö n l |
. . . Опп J |
I f I — детерминант матрицы f.
Величины [X; и Оц — некоторые постоянные, \it является средним значением соответствующей переменной Xt, a сг^- — дисперсия или ковариация величин (Xt, Xj). (Заметим, что tfu =
Пример 2.3.4. Двумерная плотность нормального распределения
Запишем формулу для двумерной плотности нормального рас пределения вероятности, полагая в выражении (2.3.7) п = 2. Это распределение применяется при рассмотрении турбулентных полей скоростей, картографировании и плановых съемках, а также при построении эмпирических моделей.
(x — n f = |
[(xi — ц 4 ) , (x2 — |
| i 2 ) l i |
|
|
* '—Г о н |
cr1 2 " » |
|
|
_°*21 |
G 22. |
|
det î = I f Icriiez —a1 2 o-2 i = cr*o\— o2i2 |
(так как a 1 2 = a2 1 ), |
||
p o2 2 |
— o"ia -î |
|
|
d e t f |
d e t f |
|
|
Q=[(Xl — V-l), (^2-^-1*2)1 |
z z £ s l |
_ £ L |
J |
l > 2 — И г ) |
L |
| f | |
|f| |
|
|
(Ді — Hi) 2 |
°1 — 2 (жі — |ii) (ж2 — (i2 ) ai2 + (s2 — Иг)2 в? |
Распределения вероятности и выборочная статистика 69
Теперь пусть
так что |
Р = Рі2 |
= |
O-jO-jj |
' |
|
|
|
|
СХ12 = |
0х02р, |
|
|
|
||
|
|
|
|
|
|||
а\а\ - |
of2 |
- |
ojajps |
а\ (1 _ рЯ) ' |
|
|
|
|
ff^Kl-p2) |
|
ffi<r2(l-pa) |
' |
|
||
|
|
о? |
|
1 |
|
|
|
Тогда |
I f I |
° i ( l - P 2 |
) ' |
|
|
||
|
|
|
|
|
|
|
|
Ѵ~^—) ~2 р |
1~5Г~) І - |
^ - ) + |
\ - 0 |
— ) |
|||
|
|
|
1—р2 |
|
|
|
|
где |
|
|
|
|
|
|
|
|
|
|
і = 1, |
2. |
|
|
|
Существуют таблицы |
двумерного |
нормального |
распределе |
||||
ния [7]. |
|
|
|
когда величины Хі |
и Х2 стати |
||
Д л я важного частного случая, |
|||||||
стически независимы, |
р = |
0 и |
|
|
|
|
|
|
|
2.3.2. Распределение |
%2 |
||
Распределение %2 находит широкое теоретическое и практиче |
|||||
ское |
применение; |
некоторые |
примеры |
его применения будут |
|
описаны в гл. 3 |
*), а |
именно: |
|
||
1) |
проверка согласия экспериментальных наблюдений с пред |
||||
полагаемыми распределениями |
вероятности; |
||||
2) |
получение доверительных интервалов для дисперсии и сред |
||||
него |
квадратического |
отклонения; |
|
3)проверка независимости переменных;
4)получение выборочного распределения для среднего квадра
тического отклонения, |
ковариации, относительного |
отклонения |
и т. д. |
|
|
Пусть Хи Х2, . . ., Хѵ |
— набор ѵ случайных величин, распре |
|
деленных по нормальному закону с соответствующими |
параметра- |
*) Методы использования ^ - р а с п р е д е л е н и я хорошо изложены в книге [8] .
70 |
|
|
Глава |
2 |
|
|
|
ми {ці, оф, (u.2 , оф, . |
. ., ([il, |
al). |
Если вычислить |
квадраты норми |
|||
рованных нормальных |
величин |
Ut |
|
|
|||
|
|
Uï |
= ( |
^ ~ ^ ) \ |
|
(2.3.8) |
|
а затем их сумму, |
то |
получится |
новая |
случайная величина х 2 |
|||
(хи-квадрат): |
|
|
|
|
|
|
|
|
|
|
|
|
V |
V |
|
|
|
|
|
і = 1 |
і = 1 |
1 |
Параметр ѵ в этом выражении называется числом степеней свободы величины %2. Распределение %2 зависит лишь от ѵ, так как величины Ut нормированы. Если имеется ѵ независимых
0,20 |
|
|
|
|
|
|
|
|
|
0,75 |
|
|
|
|
|
|
|
|
|
і< 010 |
I l |
\ |
Ѵ= 8 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0,05 |
- |
\ |
/\ |
|
|
|
|
|
|
О |
|
|
|
|
\ 1 |
! |
1 |
> ^ . ... |
|
О |
5 |
10 |
15 |
20 |
25 |
50 |
55 |
АО |
|
Ф и г . |
2.3.6. Плотность |
распределения |
вероятности |
%2 . |
|||||
наблюдений, то число степеней |
свободы равно |
ѵ; однако каждое |
соотношение, связывающее ѵ наблюдений, уменьшает число сте пеней свободы на единицу.
Можно показать, что плотность |
распределения |
вероятности |
|
для |
|||||||||
X2 |
равна |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Р (X1) |
= 2 ѵ / 2 г ( ѵ / 2 ) ( х 2 |
) ( ѵ / 2 ) - Ѵ ^ 2 |
> |
(0 < |
X2 |
< оо); |
(2.3.10) |
||||
график |
этой |
величины приведен на фиг. 2.3.6. |
|
|
|
|
|
||||||
|
Представляют интерес некоторые |
частные |
случаи |
распреде |
|||||||||
ления |
х 2 ; 1) распределение |
квадратного |
корня |
из |
х 2 |
Д л я |
ѵ = |
2, |
|||||
называемое |
распределением |
Рэлея, |
2) |
распределение |
х 2 |
Д л я |
|||||||
V = |
4 — распределение Максвелла |
для |
скоростей |
молекул |
и |
3) |
|||||||
распределение величины 1^2x2 для ѵ > |
30, которая |
распределена |
Распределения вероятности и выборочная статистика 71
приблизительно по нормальному закону с ц = ]^2ѵ — 1 и а 2 = 1.
Среднее значение у? равно |
числу степеней свободы |
||
£ { х 2 } = £ { 2 т)= |
2 |
%{(Ui-0)*} |
= i + i + . . . = v , |
і=1 |
i=l |
|
|
так как дисперсия Ut равна 1, т. е. % {(Ü7* — О)2} = 1. Непо средственным интегрированием можно показать, что
Ѵаг {х2} = 2ѵ.
Распределение накопленной вероятности %2 равно
* |
ill) |
- |
Р { Х 2 |
< Х 2 } - 2 Ѵ / 2 і ! ( ѵ / 2 ) | |
( f ) 2 |
" 1 е-*У* d {t). |
(2.3.11) |
|||||||||||
Существуют |
таблицы |
как |
для |
Р |
|
так |
и |
для |
Р (х^/ѵ) |
|||||||||
и Р { х 2 > |
X*}; |
небольшая |
часть |
табл. В2 приложения |
В |
при |
||||||||||||
ведена |
здесь |
в |
виде |
табл. 2.3.3. Числа в этой |
таблице |
представ- |
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Таблица |
2.3.3 |
||
|
|
|
|
|
|
Р а с п р е д е л е н ие 7 2 |
|
|
|
|
|
|
|
|||||
Число |
|
Вероятность того, что значение х 2 |
меньше, чем указанное в таблице, |
|||||||||||||||
|
|
|
|
|
|
|
|
Р {X2 |
=S Х|} |
|
|
|
|
|
|
|
||
степеней |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
свободы |
|
0,01 |
0,05 |
|
|
0,9 |
|
|
|
|
|
|
|
0,999 |
||||
V |
|
|
0,5 |
|
|
0,95 |
|
0,99 |
|
|||||||||
1 |
|
1,57-10-4 |
0,00395 |
0,455 |
2,706 |
|
3,841 |
|
6,635 |
|
10,827 |
|||||||
10 |
|
2,558 |
|
3,940 |
9,342 |
15,987 |
18,307 |
|
23,209 |
|
29,588 |
|||||||
ляют собой |
верхний |
предел |
интеграла |
в |
формуле |
(2.3.11) |
для |
|||||||||||
V степеней |
свободы. |
Например, |
для |
Р {%2 ^ |
|
%*} = |
0,95 |
или |
||||||||||
Р {%2 > |
%1) = 0,05 |
значения |
%* равны |
3,841 |
и |
18,307 |
соответ |
|||||||||||
ственно |
для |
ѵ = 1 |
и |
V = |
10 |
степеней |
свободы. |
|
|
|
|
|||||||
2.4. В Ы Б О Р О Ч Н Ы Е |
С Т А Т И С Т И К И |
И |
И Х Р А С П Р Е Д Е Л Е Н И Я |
|||||||||||||||
Распределение вероятности для переменной процесса обычно |
||||||||||||||||||
неизвестно, так что соотношения разд. 2.2 нельзя |
непосредственно |
|||||||||||||||||
использовать |
для |
вычисления |
среднего |
значения, |
|
дисперсии |
||||||||||||
и других характеристик ансамбля. В |
то |
же |
время |
получение |
||||||||||||||
оценки |
для |
плотности распределения |
вероятности |
переменной |
процесса, хотя и желательно, но оказывается весьма трудной
задачей, поэтому в большинстве случаев приходится |
ограничи |
|
ваться |
более простыми оценками среднего значения, |
дисперсии |
и т. д. |
В этой книге будут описаны два основных метода оценива- |