Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Основы теории случайных процессов (4 семестр).doc
Скачиваний:
263
Добавлен:
09.04.2015
Размер:
4.95 Mб
Скачать

3.1. Вычисление характеристик эмпирических распределений

При рассмотрении основных положений теории вероятностей и математической статистики, определении параметров распределения мы исходили из предположения, что осуществляется достаточно большое, в пределе бесконечное число испытаний nN (N), что практически осуществить невозможно. Однако имеются методы, которые позволяют оценить эти параметры по выборке (части) случайных событий.

Генеральнойназывается совокупность всех мыслимых значений наблюдений, которые мы могли бы сделать при данном комплексе условий. Другими словами все возможные реализации случайной величины, теоретически в пределе их может быть бесконечное число (N). Часть этой совокупности nN, т.е. результаты ограниченного ряда наблюдений x1,x2,...,xnслучайной величины, можно рассматривать каквыборочноезначение случайной величины (например, при определении химического состава сплавов, их механической прочности и т.п.). Если все слитки данной марки стали, чугуна, сплава разделать на образцы и исследовать их химический состав, механическую прочность и другие физические характеристики, то имели бы генеральную совокупность наблюдений. Фактически доступно, возможно (целесообразно), исследовать свойства весьма ограниченного числа образцов – это и есть выборка их генеральной совокупности.

По результатам такого ограниченного числа наблюдений можно определить точечные оценкизаконов распределения и их параметров. Оценкой (или выборочной статистикой)* какого-либо параметраназывается произвольная функция*=*(x1, x2,..., xn) наблюдаемых значений x1, x2,..., xn, в той или иной степени отражающая действительное значение параметра.

Если говорить о характеристиках распределений вероятностей, то характеристики теоретических распределений (Mx,x2, Mo, Me) можно рассматривать как характеристики, существующие в генеральной совокупности, а характеризующие эмпирическое распределение – как выборочные их характеристики (оценки). Числовые параметры для оценки Mx,x2и др. – называются иногдастатистиками.

Для оценки математического ожидания используется среднеарифметическое (среднее значение) ряда измерений по выборке:

(3.1)

где хi– реализация либо дискретной, либо отдельная точка для непрерывной случайной величины; n – объем выборки.

Для характеристики разброса случайной величины используется оценка теоретической дисперсии – выборочные дисперсии (см.рис.2.4):

(3.2а)

(3.2б)

Неотрицательное значение квадратного корня из выборочной дисперсии – это выборочное стандартное отклонение(выборочное среднеквадратичное) отклонение

(3.3а)

(3.3б)

Следует отметить, что в любой задаче, связанной с выполнением измерений, возможны два способа получения оценки значения x2.

При использовании первого способа снимается последовательность показаний прибора и путем сравнения полученных результатов с известнымили калиброванным значением измеряемой величины находится последовательность отклонений. Затем полученная последовательность отклонений используется для вычисления среднего квадратичного отклонения по формуле (3.3а).

Второй способ получения оценки значения x2состоит в определениисреднего арифметического, т.к. в этом случае действительное (точное) значение измеряемой величины неизвестно. В этом случае целесообразно использовать другую, формулу для нахождения среднеквадратичного отклонения (3.2б, 3.3б). Деление на (n-1) производится по той причине, что наилучшая оценка, получаемая путем усреднения массива Х, будет отличаться от точного значения на некоторую величину, если рассматривается выборка, а не вся генеральная совокупность. В этом случае сумма квадратов отклоненийбудет несколько меньше, чем при использовании истинного среднего. При делении на (n-1) вместо n эта погрешность будет частично скорректирована. В некоторых руководствах по математической статистике рекомендуется при вычислении выборочного среднеквадратичного отклонения всегда делить на, хотя иногда этого делать не следует.Нужно делить на лишь в тех случаях, когда истинное значение не было получено независимым способом.

Выборочное значение коэффициента вариации, являющееся мерой относительной изменчивости случайной величины, вычисляют по формуле

(3.4а)

или в процентах

(3.4б)

Та из выборок имеет большее рассеяние, у которой вариация больше.

К оценкам , Sx2предъявляются требования состоятельности, несмещенности и эффективности.

Оценка параметра * называетсясостоятельной, если по мере роста числа наблюдений n (т.е. nN в случае конечной генеральной совокупности объема N и при nв случае бесконечной генеральной совокупности) она стремится к оцениваемому теоретическому значению параметра

Например, для дисперсии

(3.5)

Оценка параметра * называетсянесмещенной, если ее математическое ожидание M(*) при любом n асимптотически стремится к истинному значению M(*)=. Удовлетворение требованию несмещенности устраняет систематическую погрешность оценки параметра, которая зависит от объема выборки n и в случае состоятельности стремится к нулю при n. Выше было определены две оценки для дисперсиии. В случае неизвестного значения математического ожидания (истинного значения измеряемой величины) обе оценки состоятельны, но только вторая (3.2б), (3.3б), как было показано ранее, является несмещенной. Требование несмещенности особенно важно при малом числе наблюдений, так как при n.

Оценка параметра 1* называетсяэффективной, если среди прочих оценок того же параметра2*,3* она обладает наименьшей дисперсией.

(3.6)

или

(3.6a)

где i* – любая другая оценка.

Так, если имеется выборка х1, х2,..., хnиз генеральной совокупности, то среднее математическое ожидание можно оценить двумя способами:

(3.7)

где xmax(n), xmin(n) – соответственно максимальное и минимальное значения случайной величины из выборки n.

Обе оценки обладают свойствами состоятельности и несмещенности, однако можно показать, что дисперсия при первом способе оценки равна Sx2/n, а во втором2Sx2/[24ln(n)], т.е. существенно больше. Таким образом, первый способ оценки математического ожидания является состоятельным, несмещенным и эффективным, а второй – только состоятельным и несмещенным. Заметим, что из всех несмещенных и состоятельных оценок следует предпочесть такую, которая оказывается наиболее близкой к оцениваемому параметру.

Заметим, что все сказанное относится к равноточным измерениям, т.е. к измерениям, которые содержат только случайную погрешность, подчиняющуюся нормальному закону распределения.