- •Раздел 3. Элементарные статистические оценки результатов измерений и их аппроксимация
- •3.1 Задачи измерений и их точность
- •3.2 Некоторые элементарные сведения из теории вероятностей
- •3.2.1.Случайные погрешности
- •3.2.2. Определения основных понятий, фигурирующих при рассмотрении случайных величин
- •3.2.3. Условные вероятности. Априорная и апостериорная вероятность
- •3.3. Классификация случайных погрешностей и законы распределения
- •3.4. Нормальное распределение
- •3.6. Оценки точности и надежности математического ожидания
- •3.6.1. Доверительный интервал. Доверительная вероятность
- •3.6.2. Уточненные зависимости для доверительного интервала и доверительной вероятности
- •3.7. Представление результатов измерений
- •3.7.1. Общие требования к представлению результатов измерений
- •3.7.2. Аппроксимация опытных зависимостей
- •3.9. Планирование эксперимента с точки зрения анализа ошибок
- •Раздел 4
- •4.3.Основные определения, связанные с процессом планирования
- •4.3.Неформальное рассмотрение процесса планирования эксперимента
3.4. Нормальное распределение
При использовании непрерывного значения плотности вероятности при-веденные выше формулы для моментов распределения из сумм превращают-ся в интегралы.
; (10)
.
Можно доказать, что параметр m в законе Гаусса – математическое ожида-ние величины Х, а параметр – это ее среднее квадратичное отклонение.
Итак, величины для дискретных и непрерывных распределениях вполне определенным образом связаны между собой. Наиболее распространенной оценкой погрешности является оценка с помощью среднеквадратической погрешности , которую часто называют стандартной погрешностью. Если число измерений весьма велико, то переход от дискретных к непрерывным оценкам не вызывает существенных проблем. Однако, если число измерений не очень велико, при оценке дисперсии возникает проблема получения так называемой несмещенной оценки. Перед тем, как перейти непосредственно к вопросу обработки опытных данных, рассмотрим указанную проблему.
При определении математического ожидания и дисперсии из опытных данных к получаемым оценкам предъявляется два основных требования:
Оценки должны быть состоятельными. Это означает, что при увели-чении числа опытов они должны сходиться к точным значениям mx и D[X].
Оценки должны быть несмещенными, то есть не должно быть систе-матического отклонения от точных значений.
Опуская соответствующие выкладки, найдем, что смещенной оказывается лишь оценка среднеквадратической погрешности , которая должна определяться по скорректированной формуле
=. (11)
Появление в знаменателе величины n – 1 вместо n связано с так назы-ваемым «центрированием», которое позволяет считать nS, определенное по формуле (11), приближенным значением дисперсии, являющейся параметром нормального распределения.
3.6. Оценки точности и надежности математического ожидания
3.6.1. Доверительный интервал. Доверительная вероятность
Обычно, помимо нахождения математического ожидания величины, не-обходимо также оценить количественно его точность и надежность. Для такой оценки в статистике пользуются понятиями доверительного интервала и доверительной вероятности.
Однако, прежде чем перейти непосредственно к поставленной задаче, заметим, что оценки, о которых мы здесь будем говорить, относятся к математическому ожиданию. Итак, пусть имеется случайная величина X с математическим ожиданием mX и дисперсией DX . Над этой величиной проводится n независимых опытов и вычисляется среднее арифметическое наблюденных значений Х. Если обозначить результат i-го опыта через Xi, то совокупность величин Xi представляет собой n независимых случайных величин, каждая из которых распределена по одному и тому же закону. Обозначим среднее арифметическое величин Xi через Y.
.
Математическое ожидание суммы равно сумме математических ожиданий.
Поэтому
mY = M[Y] = = . (12)
Математическое ожидание дисперсии суммы независимых случайных величин равно сумме дисперсий
. (13)
Теперь перейдем к определению понятий доверительного интервала и доверительной вероятности.
Пусть для параметра а получена из опыта несмещенная оценка . Назначим некоторую вероятность , для которой событие можно считать практически достоверным и найдем такое значение , для которого
. (14)
Тогда диапазон реально возможных значений ошибки, возникающей при замене а на будет ; вероятность бóльшей по абсолютной величине ошибки равна 1- .
Иначе можно записать (23) следующим образом:
. (15)
Это означает, что с вероятностью неизвестное значение параметра а попа-дает в интервал .
Введенную таким образом вероятность принято называтьдоверительной вероятностью, а интервал – доверительным интервалом. Границы интервала называют доверительными границами.
При известном законе распределения величины а нахождение доверите-льных границ для заданного значения не вызывает затруднений. Но обыч-но это распределение априори не известно. Мы, однако, будем считать, что для рассматриваемой величины справедливо нормальное распределение.
Тогда на основании результатов n опытов получим оценки для математичес-кого ожидания и дисперсии
; . (16)
Далее задача решается следующим образом. По определению функции Лапласа
= , (17)
где - среднее квадратичное отклонение оценки.
Положим, что , где k – целое число. Пусть k = 2, 3. Получим соответствующие значения . Будем иметь дляk = 2 =0,954, а для k =3 - =0,997. Оценка, соответствующаяk = 2, используется наиболее часто. С учетом округления она соответствует 95% вероятности того, что отклонение рассматриваемой случайной величины от оценки ее математического ожидания не превышает 2, то есть доверительная вероятность для доверительного интервала 2 равна 95%. Соответственно, для доверии-тельного интервала 3 доверительная вероятность равна 99,7%. Этой оценкой пользуются, если необходима более высокая точность. В принципе, по формуле (26) можно определить доверительную вероятность для любого доверительного интервала.
Существуют более точные методы оценки в случае отклонения от нормального распределения. Они могут привести к заметной корректировке результатов, если количество опытных точек мало.