Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

baldin_kv_red_matematika_dlia_gumanitariev

.pdf
Скачиваний:
18
Добавлен:
28.07.2020
Размер:
19.84 Mб
Скачать

(12.5)

и откладывают их по оси ординат.

Из изложенного принципа построения гистограммы следует, что ее площадь всегда равна единице.

Таким образом, статистическая плотность распределения представляет собой функцию, ординаты которой в пределах интервалов разбиения результатов наблюдений постоянны. С увеличением объема выборки и, следовательно, числа интервалов гистограмма все более приближается к плотности распределения случайной величины и может использоваться для приближенного ее описания.

Построение статистической функции распределения и гистограммы рассмотрим на примере.

Пример 12.1. Для оценки точности показаний датчиков давления были произведены испытания 60 датчиков. При испытаниях каждым датчиком измерялось некоторое номинальное давление и определялась ошибка измерения dp как разность между показанием датчика и номиналом, выраженная в процентах. В протокол испытаний записывались числа датчиков, ошибки измерений которыми оказались в пределах интервалов, равных 0,5%. Минимальное значение ошибки измерения оказалось равно -2,5%, а максимальное + ,0%. Результаты проведенных испытаний сведены в табл. 12.5.

Таблица 12.5

статистический ряд распределения

№ интервала

1

2

 

4

5

6

7

8

9

10

11

Число

1

 

5

9

11

9

8

6

4

 

1

датчиков

 

 

 

 

 

 

 

 

 

 

 

Частоты в

 

 

 

 

 

 

 

 

 

 

 

интервалах

 

 

 

 

 

 

 

 

 

 

 

Требуетсяпостроитьстатистическиефункциюиплотность распределения F*(dp) и f*(dp) ошибки измерения давления датчиками этого типа.

401

Решение

1.Представляем результаты измерений в виде статистического ряда.

2.Рассчитываем по формулам (12.4) значения статистической функции распределения в точках, отвечающих границам выбранных интервалов.

. Определяем высоты прямоугольников гистограммы (ор-

динаты функции f*(dp)) для каждого интервала разбиения полученных результатов измерений, используя для этого форму-

лу (12.5).

Результаты расчетов по пунктам 1, 2, представлены в табл. 12.6.

Таблица 12.6

статистическая плотность и функция распределения

Правая граница

интервала

-2,5

-2,0

-1,5

-1,0

-0,5

0,0

0,5

1,0

1,5

2,0

2,5

,0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f*(dp)

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

F*(dp)

 

0

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4. Строим графики статистической функции распределения (рис. 12. ) и плотности распределения (рис. 12.4).

Следует отметить, что неудачное разбиение на интервалы результатов измерений при составлении статистического ряда проявляется при построении гистограммы: она будет иметь либо «провалы», либо окажется невыразительной.

Полученные статистические функцию и плотность распределения аппроксимируют подобранным теоретическим законом. Затем проверяют гипотезу о согласованности теоретического и статистического законов распределения. Методы проверки гипотез о законах распределения изложены в главе 1 .

402

 

 

 

F*(

р)

 

 

 

1,0

 

 

 

 

 

 

0,5

 

 

 

 

 

 

2 1

0

1

2

 

р

 

Рис. 12.3. Статистическая

 

 

функция распределения

 

 

 

 

 

f*(

р)

 

 

 

2

1

0

1

2

 

р

Рис. 12.4. Статистическая

 

плотность распределения

 

 

 

(гистограмма)

 

 

12.4.точечноеоцениваниечисловыххарактеристик случайныхвеличин

12.4.1.Оцениваниевероятностинаступленияслучайногособытия

Данную задачу приходится решать, если результат эксперимента описывается случайным событием и в качестве характеристики свойства исследуемого объекта целесообразно принимать вероятность наступления некоторого события. Например, целью эксперимента является исследование надежности какой-либо системы. В качестве показателя надежности системы принята вероятность ее безотказной работы в течение определенного времени T. Для определения данного показателя планируется провести испытания n систем. Результат функционирования каждой системы можно описать случайным событием: за время T система не отказала либо наступил ее отказ. Результаты испытания n систем рассматривают как выборку объема n из генеральной совокупности.

Необходимость решения аналогичных задач возникает при исследовании эффективности боевых действий с помощью

40

имитационных моделей. В этом случае результаты n «прогонов» модели на ЭВМ рассматривают как выборку из генеральной совокупности.

По результатам n испытаний подсчитывают число испытаний nj, в которых наступило интересующее нас событие. Затем находят частоту наступления этого события

которую принимают в качестве его вероятности (P* → P). Результат каждого отдельного испытания можно описать

случайной переменной (дискретной случайной величиной) если событие наступило; в противном случае.

Тогда число испытаний, в которых событие наступило, будет равно

(12.6)

а частота определяется выражением

(12.7)

Проанализируем свойство частоты P* как оценки вероятности наступления случайного события.

1. Оценка P* — несмещенная, так как математическое ожидание M[P*] равно истинному значению вероятности:

(12.8)

2. Поскольку, согласно теореме Бернулли,

404

т. е. частота P* сходится по вероятности к вероятности P, то P* — состоятельная оценка.

. Дисперсия частоты P* определяется выражением

(12.9)

Поскольку при n → ` дисперсия D[P*] → `, то частота P* — асимптотически эффективная оценка вероятности. Доказано, что при любом n дисперсия частоты (12.9) минимально возможная и, следовательно, P*является вообще эффективной оценкой вероятности P.

Таким образом, частота наступления случайного события P*является эффективной оценкой вероятности.

12.4.2.Оцениваниематематическогоожиданияслучайнойвеличины

Необходимость оценивания математического ожидания по результатам испытаний появляется в задачах, когда результат эксперимента описывается случайной величиной и показателем качества исследуемого объекта принято математическое ожидание этой случайной величины. Например, в качестве показателя надежности может быть принято математическое ожидание времени безотказной работы какой-либо системы, а при оценивании эффективности удара по группе объектов поражения — математическое ожидание числа пораженных объектов и т. д.

Задача оценивания математического ожидания формулируется следующим образом. Предположим, что для определения неизвестного значения математического ожидания случайной величины X предполагается произвести n независимых и свободных от систематических ошибок измерений X1, X2, …, Xn. Требуется выбрать наилучшую оценку математического ожидания.

Наилучшей и наиболее распространенной на практике оценкой математического ожидания является среднее арифметическое результатов испытаний

405

(12.10)

называемое также статистическим или выборочным средним.

Покажем, что оценка удовлетворяет всем требованиям, предъявляемым к оценке любого параметра.

1. Из выражения (12.10) следует, что

т. е. оценка — несмещенная оценка.

2. Согласно теореме Чебышева, среднее арифметическое результатов испытаний сходится по вероятности к математическому ожиданию, т. е.

Следовательно, оценка (12.10) есть состоятельная оценка математического ожидания.

. Дисперсия оценки , равная

(12.11)

с ростом объема выборки n неограниченно убывает. Доказано, что если случайная величина X подчинена нормальному закону распределения, то при любом n дисперсия (12.11) будет минимально возможной, а оценка — эффективной оценкой математического ожидания. Знание дисперсии оценки позволяет вынести суждение относительно точности определения неизвестного значения математического ожидания с помощью этой оценки.

В качестве оценки математического ожидания среднее арифметическое используется в том случае, если результаты измерений равноточные (дисперсии D[Xi], i = 1, 2, …, n одинаковы в каждом измерении). Однако на практике приходится сталкиваться с задачами, в которых ре-

406

зультаты измерений неравноточные (например, в процессе испытаний измерения производятся различными приборами). В этом случае оценка для математического ожидания имеет вид

(12.12)

где — вес i-го измерения.

В формулу (12.12) результат каждого измерения включается со своим весом Ci. Поэтому оценку результатов измерений называют средневзвешенной.

Можно показать, что оценка (12.12) является несмещенной, состоятельной и эффективной оценкой математического ожидания. Минимальная дисперсия оценки определяется выражением

(12.1 )

При проведении экспериментов с моделями на ЭВМ подобные задачи возникают в том случае, когда оценки находят по результатам нескольких серий испытаний и число испытаний в каждой серии различно. Например, проведены две серии испытаний объемом n1 и n2, по результатам которых получены оценки и . С целью повышения точности и достоверности определения математического ожидания результаты этих серий испытаний объединяют. Для этого следует воспользоваться выражением (12.12)

где j — число серий испытаний.

407

При вычислении коэффициентов Cj вместо дисперсий D[Xj] подставляют их оценки, полученные по результатам испытаний в каждой серии

где nj — число испытаний в j-й серии;

— оценка математического ожидания полученная по результатам j-й серии испытаний.

Аналогичный подход используют и при определении вероятности наступления случайного события по результатам серий испытаний.

Для оценивания математического ожидания случайной величины X, кроме выборочного среднего, могут использоваться и другие статистики. Чаще всего для этих целей используют члены вариационного ряда, т. е. порядковые статистики x1 # x2 # … # xr # … xn, на базе которых строят оценки, удовлетворяющие основным из предъявляемых требований, а именно состоятельности и несмещенности.

Предположим, что вариационный ряд содержит n = 2k членов. Тогда в качестве оценки математического ожидания может быть принято любое из средних:

При этом k-е среднее

есть не что иное, как статистическая медиана распределения случайной величины X, поскольку имеет место очевидное равенство

P*(Xi < Me*) = (Xi > Me*).

Преимущество статистической медианы состоит в том, что она свободна от влияния аномальных результатов наблюдений, неизбежного при использовании первого среднего, т. е. среднего из наименьшего и наибольшего числа вариационного ряда.

408

При нечетном объеме выборки n = 2k 2 1 статистической медианой является ее средний элемент, т. е. k-й член вариационного ряда Me* = xk.

Существуют распределения, у которых среднее арифметическое не является эффективной оценкой математического ожидания, например распределение Лапласа. Можно показать, что для распределения Лапласа эффективной оценкой математического ожидания является выборочная медиана.

Доказано [10, 15], что если случайная величина X имеет нормальное распределение, то при достаточно большом объеме выборки закон распределения статистической медианы близок к нормальному с числовыми характеристиками:

M[Me*] = M[X];

(12.14)

Из сравнения формул (12.11) и (12.14) следует, что дисперсия статистической медианы в 1,57 раза больше дисперсии среднего арифметического. Следовательно, среднее арифметическоекакоценкаматематическогоожиданиявостолькожераз эффективнее статистической медианы. Однако из-за простоты вычислений, нечувствительности к аномальным результатам измерений («засоренности» выборки) на практике в качестве оценки математического ожидания тем не менее используют статистическую медиану.

Следует отметить, что для непрерывных симметричных распределений математическое ожидание и медиана совпадают. Поэтому статистическая медиана может служить хорошей оценкой математического ожидания лишь при симметричном распределении случайной величины.

Для несимметричных распределений статистическая медиана Me* имеет существенное смещение относительно математического ожидания, поэтому для его оценивания непригодна.

409

12.4.3.Оцениваниедисперсииистандартногоотклонения случайнойвеличины

На практике часто возникает необходимость определения оценок и характеристик рассеивания Dx и sx результатов испытаний относительно математического ожидания случайной величины X. При решении этой задачи различают два случая: математическое ожидание случайной величины X известно и математическое ожидание неизвестно. Для вычисления оценок указанных характеристик используют выражения (статистики):

(12.15)

где k — число степеней свободы:

k = n, если математическое ожидание известно;

k = n 2 1, если математическое ожидание неизвестно. При неизвестном математическом ожидании в формулы

(12.15) вместо истинного значения mx подставляют его оценку

, вычисленную по формуле (12.10).

Оценки дисперсии обладают необходимыми свойствами, т. е. они несмещенные, состоятельные и эффективные. Что касается оценок стандартного отклонения, то они являются отрицательно смещенными. Однако абсолютная величина смещения быстро уменьшается при увеличении числа испытаний (объема выборки) и уже при n = 10 не превышает % от sx. Оценка стандартного отклонения вида (12.15) является состоятельной и асимптотически эффективной оценкой.

При большом объеме выборки n (например, при большом числе «прогонов» модели на ЭВМ) желательно так организовать процесс обработки результатов моделирования, чтобы оценки для искомых характеристик формировались постепенно по ходу моделирования, т. е. без специального запоминания всей информации. Так, например, для получения оценки вероятности наступления события при обработке результатов моделирования достаточно накапливать в памяти ЭВМ лишь число «ус-

410