
книги из ГПНТБ / Гром, В. П. Экспресс-анализ данных сдаточных испытаний судов с помощью бортовой ЭЦВМ
.pdfмерной, зависимости величин вероятностей ошибок первого И ВТО РОГО! рода от выбора Sκp могут быть представлены графически.
Такие кривые изображены на рис. 1—4.
Статистические критерии характеризуются понятиями состоя
тельности и несмещенности. Состоятельность критерия означает, что при объеме наблюдений N → ∞ можно указать такую критическую
область, что вероятности ошибок первого и второго рода будут
равны нулю. Требование несмещенности заключается в том, что при проверке гипотезы G0 против альтернативной гипотезы Gi, вклю
чающей в себя множество (может быть, бесконечное) распределе
ний, вероятность принятия ни одного из них не должна быть
больше, нежели распределений, входящих в G0.
Рис. 1. Вид функций плотностей вероят
ностей статистического критерия про- |
статистического критерия. |
верки гипотез. |
|
Таким образом, задача разработки статистического критерия
для проверки гипотез о распределениях заключается в выборе такой
статистики S (я), которая обеспечивала бы наилучшее разделение
распределений, входящих в G0 и Gi. Однако практическое решение
этой задачи в каждом случае очень затруднительно.
Если гипотеза G0 определена как класс каких-то распределений,
а к Gi отнесены все распределения, не вошедшие в G0, стремятся отыскать такую статистику S(я), распределение которой могло бы быть определено и оставалось бы неизменным для любого распре деления случайной величины, входящего в G0, и в критическую
область S(я) >Sκp включают те значения S(я), которые наименее
вероятны именно при этом распределении статистики S(я). При использовании этих критериев никакие конкретные конкурирующие
гипотезы из Gi не рассматриваются. Объясняется это не только
невозможностью перебора всех гипотез из Gi, в результате чего
исследование было бы неполным, но и тем, что распределение ста тистики S (я) для распределений, не входящих в G0, неизвестно, и
потому проведение такого исследования просто невозможно.
Именно таким является наиболее широко используемый критерий
Пирсона χ2. Распределение статистики
P |
ʌr х |
_ V (Ni ~ yvp'r^' |
(13) |
|
S(N |
∙∙'λ>) |
ɪ |
NP1- |
|
|
||||
|
|
|
|
20
Pue. 3. Функции плотностей вероятностей Q-критерия. |
Рис. 4. Функции распределения Q-критерия, |
21
стремится при увеличении объемаP↑, Pвыборки2, - ., Pr.N к распределению χ2 |
|||||||||||||
только в том случае, если |
выборка |
производится■ |
из генеральной |
||||||||||
совокупности с распределением |
|
|
|
|
то статистикаN2, |
(W1, |
|||||||
Если же проверяются |
ложные |
гипотезы, |
|||||||||||
Λ'2, ..., |
Nr) |
будет иметь в |
|
|
S |
..., |
|||||||
|
|
каждом случае свое неизвестное распре |
|||||||||||
деление. |
Кроме |
того, как было |
|
|
Nстатистика S(Λ,1, |
|
|||||||
|
|
упомянуто, |
→~∞. В |
|
|
|
|||||||
Λ''r) и при проверке истинной гипотезы |
имеет распределение χ2 |
||||||||||||
толькоNr) |
в |
пределе, когда объем выборки |
|
|
|
случае выборки |
|||||||
любого конечного объема |
распределение статистики S |
(Ni, N2, ..., |
|||||||||||
|
|
также отличается от распределения χ2. Поэтому при проверке гипотез о распределениях по критерию χ2 имеет место погрешность
определения |
того, что |
проверяемая |
гипотеза |
верна, |
|||
|
N2, ..., вероятностиNr) |
|
|
||||
вследствие |
отличия действительного |
распределения |
статистики |
||||
S ((V1, |
|
от табличного — как |
из-за возможного отличия |
||||
проверяемой гипотезы от истинного |
распределения наблюдаемой |
случайной величины, так и из-за конечного объема наблюдений.
В основу предлагаемого программно-логического метода про
верки статистических гипотез о законах распределения наблюдае
мых дискретных случайных величин положен принцип статистиче
ского моделирования на ЭЦВМ некоторых вероятностных моделей,
связанных с мерами теории информации. В работе [8] теория
информации рассматривается как ветвь теории вероятностей и ма
тематической статистики. Непосредственно книга посвящена
вопросу применения логарифмических мер информации к проверке
статистических гипотез в плане унификации методов статистики.
Вводится определение собственно информации с этой точки зрения,
а также информационных мер, характеризующих различимость статистических гипотез, рассматривается интерпретация в понятиях
теории информации целого ряда вопросов математической стати
стики, выдвигается идея создания некоторых информационных кри
териев для проверки статистических гипотез, однако все эти во
просы разработаны в теоретическом плане.
При создании методики принята легко реализуемая на ЭЦВМ
программно-логическая модель (рис. 5) метода максимального
правдоподобия для случая дискретной случайной величины и пока зана связь ее с мерами информации. В результате проведенных
исследований удалось разработать:
—некоторые асимптотические свойства информационного кри
терия максимального правдоподобия, названного в работе Q-крите-
рием, позволяющим определять вероятности ошибок первого и вто рого рода;
—методику и машинные алгоритмы реализации Q-критерия,
учитывающие фактический точный объем выборки;
—машинные программы реализации программно-логического
метода;
—проверки гипотез;
—методику построения областей значений параметрических
законов распределения по заданным ошибкам первого и второго рода и априорного оценивания необходимых объемов выборок.
22
с помощью Q-крптерия на ЭЦВМ.
23
Вероятность произвольного, исхода выборки объема N из гене
ральной совокупности дискретной случайной величины х, прини
мающей значения X0,Г Xi, • ■ ∙, x>∙ с вероятностями P0, Pi, ..., Pr соот-
ветственно, так что ɪ Pl=^ , равна
і=0
(14)
r
где ɪ Ni = N.
Z = (I
Полиномиальное распределение (14) может быть представлено произведением частного биномиального и условного полиномиаль
ного распределений
где
π^∙'> |
п ; |
(16) |
|
Z ,λ |
(17) |
||
∕ p. |
|
|
|
ɪ |
tχ |
= п, |
(18) |
І N. |
|
|
|
ж |
1 |
|
(19) |
П* _____ P- |
|||
¿ |
1 |
— р ' |
V∕7=ι. (20)
ZI1X
Вдальнейшем все выкладки производятся для условного поли номиального распределения (16). Его совпадение с полным распре
делением (14) рассматривается как частный случай. *Индекс везде-
опускается.
Запишем логарифм вероятности, определяемый соотноше
нием (16),
log <7 = [log га! — Іɪζ и. |
log (rai)! +і ɪÇ 'X |
ni log Pi . |
(21) |
24
Введем обозначения
|
|
|
|
|
Qi |
(J) = ~ |
log |
n |
! - |
ɪ log |
(tιij) ! |
|
|
(22) |
|||||||
|
|
|
|
|
|
Q2 (/ : s) = ɪ іɪ |
n≈ μ |
log |
Pis, |
|
|
|
(23) |
||||||||
|
|
|
|
|
|
lj |
|
|
|
||||||||||||
так что |
|
|
|
|
|
|
|
|
|
|
|
x |
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
j |
|
|
|
|
Q(J-S) = Ql(J)UQ2Uts). |
|
|
|
(24) |
||||||||||||
Индекс |
означает, |
что величины |
nij, |
і |
|
|
μ есть |
|
|||||||||||||
|
|
|
|
результат вы |
|||||||||||||||||
борки объема |
п |
из генеральной совокупности дискретной случайной |
|||||||||||||||||||
величины, имеющей вɪобщем ' случае |
неизвестное |
|
распределение |
||||||||||||||||||
C вероятностями |
Pij, |
i μ. |
|
1. |
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
Pij- |
|
|
|
|
|
|
|
|
|
|
|
|
|||
Индексом s обозначена гипотеза о законе распределения наблю |
|||||||||||||||||||||
даемой случайной величины, |
так |
что |
ɪ 73⅛= 1, |
PisUO |
для z μ. |
||||||||||||||||
Таким образом, |
|
Q(∕ : |
s) |
|
|
|
|
i ɪl |
|
|
|
|
логарифма вероят |
||||||||
|
есть расчетное значениеɪ |
||||||||||||||||||||
ности получить имеемую выборку |
|
i μ. |
nij = n |
из генеральной |
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
∏ij, |
|
|
|
|
совокупности дискретной случайной величины, имеющей гипотети
ческое распределение s.
Записав |
значения факториалов и их логарифмов по |
формуле |
Стирлинга |
л! ~ nne~n~U2πtι, |
(25) |
|
In л! ~ л In л — л -ф -ɪ-In 2π -ф -і-іп л, |
(26) |
можно получить предельные значения для величины Ql(Z) при объеме выборки, стремящемся к бесконечности. При этом удобнее
в выражениях (21) — (23) принять натуральное основание логариф
мов, что на общности доказательства |
не отразится: индексы / |
и s |
|||||
в промежуточных выкладках опускаются |
-ф -ɪ- In 2π -ф |
|
|||||
Iim Qi (у) = Iim -ɪ-[ra In |
п |
— п |
|
||||
n→∞ |
n→-∞ |
nL |
|
|
2∙ |
ni) |
|
«Z - «Í + -і- In 2π ÷ ɪ In |
|
(27) |
|||||
|
|
|
При n→ ∞ можно считать щ—пРі, так что
+ ~2^ In n + ~2~ In p^ I = Iim |
[-ɪ-n In п — п. 4- |
|
|||||
+ -ɪ- In 2π — |
п |
In |
п |
і C їх |
|
і C ix |
|
|
|
^Pi-n]^PzlnPi + |
|
||||
Ц-Д VPZ i-^~l∏2π |
-4-lnn~4^2lnp/ |
|
|||||
ζ JX |
|
|
|
|
|
|
|
Принимая во внимание, что і2 Pi=і, |
|
||||||
Iim Q1 |
(у) |
μ∙ |
|
|
|
||
= -2^inpt∙∙ |
|
||||||
= |
|
|
|
||||
∏→ OO |
|
|
|
i μ. |
|
энтропию распределения /, |
|
Результат (27) представляет собой |
|||||||
т. е. того, из которого производилась выборка |
(28) |
||||||
|
Iim Q1 (/) = |
Hj. |
|||||
|
|
|
Аналогично можно найти предел для Q2 (/ : s)
Результат (29) |
Htn Q2 (у: s) =Í |
2£ JX |
P,7ln Pij- |
|
|
(29) |
||
может быть преобразован следующим образом: |
||||||||
іΣJXpH lɑ pis =Z |
2(С ¡X |
pιj [In pis + lπ pij - In Plj] |
=Z ɪξ ix |
Plj In Pij + |
(30) |
|||
+ ∑Λy(lnPi-i-lnPiz=-⅞-2PІ vln^L. |
||||||||
І μ. |
|
|
|
C |
μ. |
''ʒ |
|
|
Второе слагаемое в выражении (30) определено |
в работе как |
средняя информация от наблюдения распределения j для различия
в пользу гипотезы j против гипотезы s:
∑plj^U : s). (31)
Í(≤ JJ-
Вработе [8] доказана выпуклость функции /(/ : s) как для не
прерывных распределений, так и для дискретных, т. е.
с |
нулю |
|
|
j—s |
|
и |
(32) |
|
J(J∙.s)>O, |
|
|
||||
только |
в случае |
|
(здесь |
далее применяется |
|||
jus)равенством. |
|
|
|
||||
такое |
символическое обозначение |
тождественности распределений |
|||||
|
Из выражений (24), (27), (30), (31) следует, что |
||||||
|
|
Iim Q (у : s) = - √ (у : s) < 0 . |
(33) |
26
Величина Q(/:s) может служить статистическим критерием.
Его состоятельность, очевидно, следует из соотношений (32), (33).
Распределение Q-критерия для каждой пары распределений / и s
и заданного объема выборки п должно быть определено достаточно
точно. Только в этом случае можно будет количественно совер
шенно точно охарактеризовать различимость любых выборок и ста
тистических гипотез при любом заданном объеме выборки п,
а также решить обратную задачу — определения (именно точного
определения, а не оценивания) объема выборки, необходимого для
различения тех или иных распределений и гипотез с заданной дове
рительной вероятностью.
Построение распределений Q-критерия для конечных объемов
выборок ЛЦ/г) может быть осуществлено путем статистического
моделирования на ЭЦВМ. Для выполнения этого следует по резуль татам /И-кратного моделирования выборок объема N построить эмпирическую функцию распределения критерия fN[Q(j : s)], кото
рая будет тем ближе к истинной функции распределения критерия при данном объеме выборки N, чем больше величина Μ.
Несколько непривычным может показаться то, что сам крите
рий, характеризующий степень доверительной вероятности, оказы вается протабулированным с некоторой доверительной вероят ностью. Однако это в действительности имеет место применительно
ко всем известным критериям. Например, распределение χ2 пред
ставляет собой распределение суммы квадратов нормально распре
деленных случайных величин. В случае же применения критерия χ2
для проверки статистических гипотез о законах распределения
наблюдаемых случайных величин, фактически вычисляется сумма
квадратов, имеющих распределение не нормальное, а близкое к би номиальному (с учетом корреляции). Степень его близости к нор мальному определяется количеством наблюдений на интервале
группирования. Поэтому в каждом случае (каждого нового соче тания) случайной выборки и статистической гипотезы критерий,
называемый χ2, будет иметь свое собственное, отличное от других случаев распределение.
Пользуясь таблицами критерия χ2, следует отдавать себе отчет в том, что с фактическим распределением критерия совпадает лишь несколько первых знаков. В случае Q-критерия эта ошибка табули
рования, во-первых, принципиально может быть сделана сколько
угодно малой за счет затрат машинного времени при табулирова нии, что в случае критерия χ2 в принципе невозможно, а во-вторых,
может быть легко оценена и учтена в ходе проверки статистических
гипотез о законах распределения.
Для реализации этого подхода необходима разработка машин ных программ, которые при высоком быстродействии обеспечили бы достаточную точность вычисления величин Q(j:s, N), являющихся малыми разностями больших величин, и построение их эмпириче
ских распределений. Это достигается путем ввода значений лога рифмов факториалов в память ЭЦВМ в табличной форме.
27
Такие таблицы имеются в работе [11] |
до √V = 1п000, в работе [12] |
||||||
до Л/= 1200. Эти таблицы исчерпывают |
все возможные |
|
|
||||
|
N), |
|
|
|
практиче |
||
ские нужды, тем более что вместо |
величины log |
в формуле (21), |
|||||
по которой вычисляется Q(/:s, |
|
|
может быть |
взята любая |
по |
стоянная. Ограничение накладывается только на максимумы вели чин Ni(ιti). Ошибки оценивания вероятностей ошибок первого и
второго рода (рис. 6) могут быть оценены как ошибки оценивания параметра биномиального распределения — непосредственно или
с использованием аппроксимации-нормальным законом.
Рис. 6. Вид доверительных областей значений параметров для однопа раметрического (ɑ) и двухпараметрического (б) законов распределений.
Система машинных программ, включающая в себя программы расчета и статистического моделирования типовых законов распре
деления с произвольно задаваемыми параметрами, позволяет про
верить любую последовательность статистических гипотез. Расши рение управляющей программы системы позволяет априорно оцени
вать различимость гипотез, необходимые объемы выборок и строить
опорные таблицы различимости.
§ 4. Анализ и расчет представительности статистических данных
Точность и достоверность результатов статистической оценки
непосредственно наблюдаемой случайной величины определяются
абсолютным объемом выборки, по которой производится оценка.
Применительно к программно-логическому методу это, например,
означает, что с ростом объема выборки стягиваются доверительные
области значений параметров для фиксированных уровней довери
тельной вероятности и все больше типов гипотез оказывается воз можным обоснованно исключить из рассмотрения.
Однако на практике точность и достоверность статистического анализа столь однозначно абсолютным объемом выборки не опре
деляются вследствие того, что экспериментальные данные часто бывают получены в результате наблюдения лишь некоторой части
эксплуатируемых или подлежащих проверке технических устройств.
28
И вопрос о том, в какой мере результаты наблюдения части сово
купности могут быть распространены на всю совокупность, требует отдельного рассмотрения.
Предположим, что на 10 машинах зафиксировано 25 отказов и определены типы и значения параметров распределений времени наработки на отказ. Но в одном случае вся совокупность эксплуати
руемых машин составляет 20, в другом— 1000 единиц. Без прове
дения каких-либо расчетов представляется достаточно очевидным,
что о 10 оставшихся не обследованными машинах в первом случае
мы можем судить с |
большей определенностью, чем о 990 BO BTO- |
|||||
ром. Иначе говоря, |
один |
и тот же объем |
статистических данных |
|||
может обладать различной представи |
|
|
|
|||
тельностью в отношении всей совокуп |
|
|
|
|||
ности эксплуатируемых или подлежащих |
|
|
|
|||
проверке изделий и машин. |
|
|
|
|||
Каковы |
могут |
быть |
математические |
|
|
|
методы описания и анализа представи |
|
|
|
|||
тельности статистических данных? Можно |
|
|
|
|||
сказать, что задача в некоторой мере |
|
|
|
|||
аналогична задаче выборочного статисти |
|
|
|
|||
ческого контроля. Сходство заключается |
|
|
|
|||
в том, что |
при статистическом контроле |
Рис. 7. Вид оперативной ха |
||||
производства так же требуется по резуль |
рочного статистического кон |
|||||
татам обследования части партии продук |
троля. |
выбо |
||||
ции составить заключение о качестве всей |
рактеристики |
плана |
||||
партии. Различие, с точки зрения матема |
|
|
|
|||
тического |
описания и анализа, состоит |
|
|
|
в том, что в современной постановке задачи статистического кон троля производства принимаются во внимание только показатели
среднестатистические, по большому количеству проверяемых пар
тий продукции, тогда как в задаче анализа данных сдаточных испы
таний каждый раз рассматривается одна-единственная совокуп ность изделий или машин данного типа, назначение и т. д.
Заключение по каждому проверенному изделию при выборочном статистическом контроле принимается исходя из того, удовлетво ряет или нет оно некоторому граничному условию. Выбор и обосно вание планов выборочного статистического контроля осуществля
ются по их оперативным характеристикам. Оперативная характери стика плана выражает зависимость вероятности принятия партии
от степени ее засоренности дефектными изделиями.
Вид оперативной характеристики представлен на рис. 7. Для
каждого плана выборочного статистического контроля обычно ука
зывают две ее нетривиальные точки: вероятность а браковки пар
тии с малым содержанием дефектных изделий d↑ — риск постав щика и вероятность β принятия партии с недопустимо высоким
содержанием дефектных изделий d2— риск заказчика.
Такое описание является вполне достаточным для решения по
ставщиком и заказчиком массовой продукции экономических вопро-
" сов, оно позволяет определить и многие количественные показатели
29