Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Метрология

.pdf
Скачиваний:
23
Добавлен:
10.04.2019
Размер:
877.09 Кб
Скачать

Четвертый центральный момент определяет островершинность распределения.

P x

Площади под всеми кривыми одинаковы.

Эксцесс ex 44 3 - у нормального распределения – ноль.

Случайную величину, таким образом, можно задать параметрами функции распределения.

Оценки моментов распределения.

На конечной выборке невозможно определить ни мат. ожидание, ни дисперсию, а только их оценки.

Оценки моментов распределения – это не есть упрощение формул, их предлагают, а затем определяют, насколько эта оценка хороша.

Критерии качества оценки:

1)Оценка называется состоятельной, если при увеличении количества наблюдений она приближается, сходится по вероятности, к самому оцениваемому результату.

2)Оценка называется несмещенной, если ее мат. ожидание равно самому оцениваемому параметру.

3)Оценка называется эффективной, если ее дисперсия меньше, дисперсии всех других оценок, предложенных к рассмотрению.

8

Математическое ожидание

M X xp x dx - глядя на это, предлагается оценка:

 

1

n

 

M X

xi x

- среднее арифметическое, где n - количество

 

n i 1

 

наблюдений выборки.

В качестве оценки мат. ожидания предлагается среднее арифметическое.

Возьмем мат. ожидание этой величины:

 

1

n

 

 

1

n

M

 

xi

 

M Xi

 

n i 1

 

 

n i 1

Мат. ожидания отдельных наблюдений одинаковы, так же как и их характеристики рассеивания.

Т.е. i, j M Xi M X j M X и i, j D Xi D X j D X .

Тогда 1 n M Xi M X - т.е. среднее арифметическое является несмещенной n i 1

оценкой мат. ожидания.

 

1

n

Оценка

xi x является линейной величиной.

 

n i 1

n

Пусть у нас есть еще несколько линейных оценок. Возьмем M X ai xi .

i 1

Сравним их. Возьмем дисперсию

 

X

n

n

 

D M

ai2D Xi ai2D X

, эта величина является минимальной

 

 

i 1

i 1

при равных коэффициентах ai 1n .

 

 

 

1

n

D X

 

 

 

2

D Xi

 

Т.е. minD M

X

n

n

D X Т.е. среди всех оценок среднее

 

 

 

 

i 1

 

арифметическое обладает минимальной дисперсией. Т.е. данная оценка является эффективной.

При увеличении n эта оценка сходится (стягивается по вероятности) к мат. ожиданию. Поэтому средняя арифметическая оценка является состоятельной.

Т.е. она является несмещенной, состоятельной и эффективной.

9

Дисперсия.

Естественно предположить, что в качестве оценки дисперсии необходимо

взять величину D X 1 n x M X 2 n i 1

Чтобы исследовать эту оценку надо ее преобразовать:

1 xi M x M x M

x 2

сгруппируем

1 xi M x M x M

x 2

n

 

 

 

n

 

 

n i 1

 

 

 

n i 1

2 xi M x M

x M x

дальше формула квадрата разности

1 xi M x

 

 

 

n

 

n

 

 

 

 

n i 1

 

n i 1

 

n

 

 

 

 

 

 

1 M x M x 2

 

 

 

 

 

 

n i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

M x M x 2

Рассмотрим среднее слагаемое:

 

1

n

1

n

 

2 M

2

2 M x M x

 

xi

 

M x

x M x .

n i 1

n i 1

 

 

 

Подставляем преобразования и получаем:

D x 1 n xi M x 2 M x M x 2 . n i 1

Теперь возьмем мат ожидание от предложенной нами оценки дисперсии:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 n

 

xi M x

2

 

M

 

 

 

 

 

 

 

 

2

 

 

D x D x

M D x

M

 

 

 

 

M x M x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n i 1

 

 

 

 

 

 

 

 

 

 

 

D x

 

 

 

 

 

 

 

 

D x

 

 

 

 

 

 

 

 

 

 

Дисперсия оценки мат ожидания:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

n

 

 

 

1

 

n

 

 

 

 

 

D x

 

 

 

 

 

D

 

xi

 

 

 

 

D xi

 

 

 

 

.

 

 

 

 

 

 

n

2

 

 

n

 

 

 

 

 

n i 1

 

 

 

 

 

i 1

 

 

 

 

 

 

 

Подставив, получим:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D x

D x

 

n 1

D x

 

M

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

n

 

D x .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Это исследование показывает, что предложенная оценка - смещенная на коэффициент nn 1 . Чтобы получить несмещенную оценку, надо ее поправить на этот коэффициент:

 

1

n

 

Dнесм x

xi M

x 2 .

 

 

n 1 i 1

 

При неограниченном увеличении n эта оценка стремится к самой величине. Т.е. эти оценки состоятельные.

10

Лекция 8 Нормальное распределение, распределение Стьюдента. Доверительная

вероятность и доверительный интервал

Результат измерений – это численное значение результата с размерностью и обязательно приписанной погрешностью. За численный результат измерения принимается среднеарифметическая оценка мат ожидания, а также приписанная погрешность.

R x случайная погрешность. Что это такое? Пусть у нас есть числовая прямая, на ней можем отметить оценку мат ожидания и интервал (в общем случае он может быть несимметричным), в котором находится истинное значение измеряемой величины:

Чем это отличается от того, что мы писали раньше?

x a a - здесь мы говорили так: “если нам известно предельное значение погрешности измерения, то мы с единичной (100%) вероятностью сможем указать интервал, в котором находится истинное значение”. А здесь нет 100% вероятности. Это доверительный интервал – верхняя и нижняя границы интервала накрывающего с известной (заданной) вероятностью случайное отклонение результата наблюдения (результата измерений). Отличаются эти случаи характеристикой рассеивания:

Если используем оценку среднеквадратичного отклонения наблюдений, то получим доверительный интервал, накрывающий наблюдения:

 

D x

D x

n

 

 

Если используем среднеквадратическое отклонение среднеарифметических, то получим доверительный интервал, накрывающий результат измерения:

 

 

 

 

x

 

x

x x

 

 

 

, где n – длина выборки.

 

n

 

 

 

 

 

Рассеивание среднеарифметических результатов измерений меньше, чем рассеивание отдельных наблюдений.

1

Зайдем с другой стороны. Характеристика рассеивания наблюдений характеризует как наблюдения рассеиваются вокруг среднеарифметического, т.е. мат ожидания. Это есть некоторая точка, которая может не совпадать не с одним результатом наблюдений. Это центр группирования, вокруг которого рассеиваются наблюдения. Но как может рассеиваться среднеарифметическое, если оно одно? Т.е. мы взяли выборку наблюдений, подсчитали среднеарифметическое, т.е. оценку мат ожидания, и приписали еще ее

характеристику рассеивания через n . Задается сразу два вопроса тогда: вокруг чего они рассеиваются, и как может рассеиваться одно значение? Все просто: можно сделать выборку выборок n значений. Считаем среднеарифметическое у каждой из этих выборок (они будут разные). Тогда мы получим выборку среднеарифметических и можем получить дисперсию и среднеквадратичное отклонение. Если n устремить к бесконечности, то дисперсия среднеарифметического будет стремиться к нулю, т.е. среднеарифметические будут стягиваться в точку, рассеиваться все меньше, пока не успокоятся совсем. А постоянной величиной является истинное значение.

Теперь, за счет n мы можем задать погрешность.

Если бы у нас было бы непрерывное распределение, о квантиль x .

M x - это 50%-ая квантиль.

А в конечной выборке, если число наблюдений не велико, то расчет вероятности, или интервала (они взаимосвязаны) по рассмотренной формуле приводит к большим погрешностям. Чтобы убрать эти погрешности, было предложено другое распределение. В 1908г. математик Госсет (псевдоним Student) предложил распределение, которое аппроксимирует нормальное распределение – распределение Стьюдента. Если квантили зависят от

2

вероятности, то квантили Стьюдента зависят от вероятности длины выборки:

tp,m x . По сути, здесь несколько распределений:

n– длина выборки, p – вероятность, t – квантили. Получится несколько таблиц, зависящих от n.

Для того, чтобы определить доверительный интервал из конечной выборки

x tp,m . Оценку посчитали из выборки, квантиль из таблицы. Получили интервал, в котором находится наблюдение:

xнабл tp,m

Для результата измерения:

xрез tp,m n tp,m x

Произвольное назначение доверительной вероятности является не совсем корректным. Можно вывести рекомендательную формулу для доверительной вероятности. Пусть у нас есть выборка наблюдений (n штук). Сделаем из нее вариационный ряд.

Вариационный ряд - выборка, упорядочная по возрастанию или по убыванию: x1 x2 ... xn .

Вычтем из каждого наблюдения оценку мат ожидания и получим следующий вариационный ряд:

x1 x2 ... xn

Три точки делят ось на четыре отрезка по 25%.

3

Допустим, что в нашей выборке три наблюдения (так не бывает, но сойдет). Тогда имеем вариационный ряд из этих трех отклонений. Теперь нанесем эти отклонения на ось. Будем считать эти значения аппроксимацией соответствующих квантилей. Эти точки делят всю ось на n+1 отрезков, но все случайные отклонения (погрешности) укладываются n-1 участков. Т.е. вероятность буде равняться:

Pg n 1 n 1

Эта формула зависит от числа наблюдений. Можно составить таблицу:

N

1

2

3

4

1

2

670 (666)

 

0

0

0

0

00

00

 

Pg

0

0

0,

0,

0,

0,

0,997 ( 3 )

 

,8

,9

93

95

98

99

 

Так можно посчитать, если мы уверены, что в выборке наблюдений нет случайных значений и выборка распределена по нормальному закону.

Исключение промахов из выборки.

Промахи – это грубые погрешности, не отражающие случайно наблюдаемый процесс.

Грубые погрешности – погрешности, существенно превышающие ожидаемые для данных измерений погрешности.

Промахи искажают выбор результата наблюдений, поэтому хорошо было бы исключить их из выборки. Промахи – это все равно, что систематическая погрешность, их сложно определить. Чистка выборки является условной.

Для нормального закона распространено Правило 3 .

4

L log2 n 1
M x 3

Все наблюдения, которые не попали в интервал , считают промахами и их исключают из выборки. Это правило основано на условном предположении, что они туда не попадают (но могут). Промахи из выборки исключают по одному.

Определение закона распределения случайной погрешности, на примере нормального закона

Существует 3 группы методов определения законов распределения – от субъективного метода к более объективному.

1) разглядывание гистограммы (столбчатый график) распределения –

Визуальный метод.

Правило построения гистограмм:

Имеется выборка наблюдений (вариационный ряд – то есть выборка, отсортированная по возрастанию или убыванию).

Среднее арифметическое (оценка математического ожидания) X 1 n xi n i 1

X X

Разделить выборку на интервалы. Обозначим L – количество интервалов.

- формула Старджеса

L 5lgn - формула Брукса и Корузера.

L n - формула Хайнхольда и Гаеде.

Эти формулы дают примерно одинаковый результат.

Удобно, чтобы количество интервалов было чётным и чтобы ширина интервалов, симметричных относительно математического ожидания была бы одинаковой.

 

x x x x x

x

 

 

 

 

5

 

3

 

1

 

2

 

4

 

 

6

 

 

 

X

 

 

 

n

 

n

 

n1

 

n

 

n4

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

5

3

 

 

2

 

 

 

 

6

 

 

 

 

То есть x1 x2 , x3 x4 , x5 x6 , и так далее. ni

- количество попавших

в интервал наблюдений.

5

Ширину интервалов надо поварьировать, «подогнать», чтобы гистограмма максимально приблизилась к гипотезе нормального закона распределения.

В данном случае гистограмма является аппроксимацией функции плотности распределения.

Теперь необходимо посчитать количество наблюдений, которые попали в каждый из интервалов.

Цель гистограммы – создать впечатление о законе распределения. Полигон распределения – это ломаная кривая, аппроксимирующая

гистограмму.

Если в какой-то интервал не попало ни одного значения наблюдения, то можно объединить его с соседним.

Высота прямоугольника, построенного на каждом интервале должна быть пронормирована по ширине интервала, то есть не ni , а nxi i и только в случае,

когда равны все xi , можно рисовать прямоугольники высотой равной ni - количеству наблюдений попавших в интервал.

 

 

 

 

 

 

 

 

 

 

 

n2

 

 

 

 

 

 

 

 

 

 

 

x2

x 5

x 3

x

1

x 2

x 4

x 6

X

n

5

n 3

n

1

 

X

n 2

n

4

n 6

 

 

 

 

 

 

 

 

2)Нанесение вариационного ряда на вероятностную бумагу (как миллиметровка, бывает логарифмическая миллиметровка). Должна получиться прямая линия.

3)Совсем формализованные методы: Критерий согласия.

Самый распространённый метод: Критерий 2 Пирсона:

Сущность: сравнение двух гистограмм: практической и теоретической, которая была бы, если бы выборка была распределена по нормальному закону.

6

 

 

%

 

 

 

Должно быть M X M X .

 

 

 

 

X

X - среднеквадратичное отклонение должно быть равно оценке

 

%

 

 

 

среднеквадратичного отклонения нашей выборки.

 

 

L L - те, что мы выбрали для нашей гистограммы.

 

xi xi ; n n

 

 

 

 

 

 

L

ni ni

2

 

 

 

 

В этом случае вычисляется формула практич2

 

- это оценка

 

 

 

ш 1

ni

 

дисперсии, где ni - сколько бы наблюдений попало в интервал, если бы был

идеальный закон распределения. Таким образом, критерий 2 оценивает рассеивание практической гистограммы относительно теоретической.

Если дисперсия невелика, то можно работать с этой гипотезой.

Количественный критерий дисперсии определяется из таблицы для 2 .

q

10%

5%

2%

q – уровень значимости

k

 

 

 

 

 

 

К – число степеней свободы

 

 

 

 

 

 

 

 

Здесь q уменьшается, а k

 

 

 

 

увеличивается Уровень значимости – это вероятность (условная) отвергнуть верную

гипотезу, если принято решение её отвергнуть.

Число степеней свободы – это чувствительность критерия отклонения реальной гистограммы от теоретической.

Критерий зависит от количества интервалов. Если количество интервалов возрастает, то чувствительность тоже возрастает.

K L 2 1 , где 2 – число моментов, которые заданы, (2+1) - число связанных координат.

ni Pi n , где Pi - вероятность попадания в i-ый интервал, n – число наблюдений. Должно быть Pi 1

Из таблицы Лапласа

7

Соседние файлы в предмете Метрология