- •Измерения.
- •С учётом ошибок измерений связь между результатами измерений и неизвестными параметрами описывается следующей системой уравнений: ,
- •Основные задачи обработки измерений.
- •Можно левые части уравнения заменить приближёнными соотношениями вида:
- •Статистическая обработка измерений. Задача обработки измерений: отыскать методы построения оценок, при которых отсутствует смещение оценки, а дисперсия оценок – наименьшая – т.Е. Эффективных оценок.
- •Если считать, что , то система не доопределена.
- •Случайная величина и ее характеристики
- •Функция распределения вероятностей
- •Случайная величина и ее характеристики
- •Равномерное распределение
- •Нормальный закон распределения (закон Гаусса)
- •Закон редких событий (закон Пуассона)
- •Системы случайных величин
- •Числовые характеристики системы двух случайных величин
- •Числовые характеристики системы нескольких случайных величин
- •Двумерный нормальный закон распределения
- •Законы распределения, связанные с нормальным
- •Критерии качества оценок
- •Оценивание параметров процессов по результатам измерений.
- •Обзор основных понятий и задач математической статистики
- •Методы оценивания параметров
- •Недостатки метода наименьших квадратов и понятие о помехоустойчивом ( робастном, устойчивом ) методе оценивания
- •Введение в помехоустойчивое оценивание
- •Робастные оценки
- •Помехоустойчивая оценка параметра масштаба
- •Различны ли сорта при уровне значимости ? Если это так, то является ли бензин с октановым числом 94 значимо лучше?
- •Построение линейной регрессионной модели с одной независимой переменной.
- •Исследование уравнений регрессии.
- •Литература
Помехоустойчивая оценка параметра масштаба
S
=
,
med
- оператор
вычисления медианы
В
случае выборки случайной величины,
подчиняющейся нормальному распределению,
S
- оценка СКО,
- дисперсии.
Оценки Ct, Cw, S обычно применяются в качестве начального приближения оценок параметров сдвига и масштаба, уточняя затем их с помощью итерационных процедур. Однако мы не будем останавливаться на них.
Получение интервальных оценок
Доверительный интервал с заданной вероятностью накрывает теоретический параметр (истинное значение параметра).
Доверительный интервал вычисляется по данным из некоторой выборки. Фиксированная величина параметра заключена между границами интервала, называемыми доверительными пределами, с некоторой заданной степенью достоверности, называемой доверительной вероятностью.
Общая процедура получения интервальной оценки:
Некоторое вероятностное утверждение записывается в математических символах, содержащих рассматриваемый параметр ансамбля.
Аргумент преобразуется так, чтобы параметр ансамбля был заключён между статистиками, которые модно вычислить по выборке.
.1.
Получение интервальной оценки для
среднего (неизвестного) по ансамблю x
случайной величины
,
распределённой по нормальному закону.
Используем выборочное среднее
и выборочную дисперсию Sx2
.
Известно,
что статистика
- подчиняется распределению Стьюдента.
Поэтому можно сделать вероятностные
утверждения относительно величины t
:
;
;
Если индексы и симметричны относительно t=0, то интервал по t симметричен.
Чтобы
сделать площадь под кривой распределения
вне интервала раной
/2
+ /2
= ,
было положено =1-;
таким образом =1-/2.
Таким
образом
После
того как получена выборка,
и
рассматриваются как фиксированные
числа. Однако сам интервал является
случайной переменной.
Симметричный доверительный интервал для среднего по ансамблю можно получить, преобразуя аргумент в с учётом равенства
Доверительная вероятность для интервала, заданного неравенством равна 1- .
2.
Если известна величина
и известен какой либо (U)
закон распределения случайной величины
(чаще всего это нормальный закон т.к. из
центральной предельной теоремы следует,
что выборочное среднее подчиняется
нормальному закону), то можно построить
доверительные интервалы для x.
.
Если известна, то
.
Доверительный интервал для дисперсии по ансамблю
случайной величины можно найти, используя
2
распределение
И
(ni
– число повторений xi)
подчиняется 2
– распределению с (n-1)
степенями свободы,
(при ni=1),
Следовательно,
=n-1.
Поэтому (подставив 2 в ) получаем
Преобразовав это выражение, получим
.
При
;
с доверительной вероятностью 1-.
Аналогично можно рассмотреть другие средние по ансамблю, если известно распределение их выборочных оценок. Если такие распределения не известны, необходимо воспользоваться неравенством Чебышева.
Пример: Доверительные интервалы для среднего значения и дисперсии по ансамблю.
Дана выборка:
76,48 |
76,25 |
76,43 |
76,48 |
77,20 |
76,48 |
76,45 |
76,60 |
Х (см3)- определение объёма.
=n-1=7
Для 95% вероятности и для симметричного интервала (1-=0,95 ; /2=0,025)
Находим t0,975=2,36
Симметричный доверительный интервал, согласно , определяется неравенством
с
вероятностью 0,95.
Доверительный
интервал для
с =0,05
имеет вид
Проверка гипотез.
При проверке гипотез подвергается испытанию некоторая гипотеза H0 в сравнении с одной или большим числом альтернативных гипотез H1, H2,... .
П
усть
известна плотность распределения
вероятности
для оценки
(несмещённой). Как сильно должна отличаться
величина
от
,
предполагаемого истинного значения
,
чтобы эта гипотеза была отвергнута?
Если
гипотеза
верна, то
.
.
В силу симметрии
.
- уровень значимости. << 1
=0,05; 0,01 и т.д.
Таким
образом при
гипотеза
принимается.
При
- гипотеза отвергается.
Простейший случай, когда проверяются две гипотезы:
Н0 : х – истинное значение случайной величины (нулевая гипотеза)
Н1 : х – не является истинным значением (альтернативная гипотеза)
Пусть проверяются гипотезы о значении параметра распределения вероятностей/
H0
:
H1
:
Решение принимается следующим образом: считая, что нулевая гипотеза верна, вычисляют статистику по экспериментальной выборке и проверяют, попадает ли вычисленное значение в область принятия гипотезы.
Если – нет , то гипотеза Н0 отвергается, принимается гипотеза Н1
Если – да, то принимается гипотеза Н0.
Ошибки при проверке гипотез:
Ошибка первого рода: гипотеза верна, но отвергается.
Ошибка второго рода: гипотеза не верна, но принимается.
Ошибка
первого рода связана с тем, что
.
Уменьшить
её можно уменьшая
.
Ошибка второго рода связана с вероятностью принятия гипотезы Н0, тогда как на самом деле имело место гипотеза Н1.
Вероятность
- вероятность не обнаружить разницу,
когда она существует.
Вероятность
называется мощностью критерия и
определяет вероятность принятия решения
Н0
, когда гипотеза является ложной. С
увеличением
,
уменьшается, а
возрастает.
Уменьшение ошибки первого рода ведёт к увеличению ошибки второго рода и наоборот при заданном объёме выборки.
Единственный способ уменьшить одновременно обе ошибки – увеличение объёма выборки.
Пример: проверка гипотезы относительно среднего.
Пусть
некоторая случайная переменная процесса
Х имеет среднее значение
.
Для выборки объёма
получено
и
(
).
Проверяем гипотезу Н0: случайная переменная имеет прежнее среднее .
Альтернативная
гипотеза: Н1
.
Пусть уровень значимости
.
Для
двустороннего критерия t гипотеза Н0
принимается, если
.
В противном случае принимается Н1.
для
степеней свободы и
равно 2,306
Принимается Н0.
Для
одностороннего критерия (если бы
проверяли гипотезу
)
следовало бы взять
.
0,30<0,31
Гипотезу
Н0:
следовало бы отвергнуть!
предполагается
известным.
Среднее по ансамблю сравнивается с .
Правила принятия решения приведены в таблице:
Гипотезы |
Стандартное отклонение G |
Используемый критерий |
Замечания |
|
Неизвестно. Используется выборочное (S2) ------------------------ Известно. |
|
Двусторонний критерий t ------------------------ Двусторонний критерий U
|
|
Неизвестно.
Известно. |
|
Односторонний t.
Односторонний U. |
|
Неизвестно.
Известно. |
|
Односторонний t.
Односторонний U. |
Пример: Проверка гипотезы относительно среднего.
Калибровка термометров сопротивления. Стандартный термометр показывает 1000 мВ.
Показания термометров:
986 |
1002 |
1005 |
996 |
991 |
998 |
994 |
1002 |
983 |
983 |
Можно ли считать отклонения случайными, или на показания термометров воздействовал некий фактор?
Гипотеза: Н0:
Дисперсия
неизвестна.
Используется
критерий
.
Выбираем
.
.
.
6>5.
На уровне значимости гипотеза принимается (не отвергается)
Проверка гипотез относительно средних по ансамблю двух продуктов (двух переменных).
Гипотеза |
Стандартн отклонения |
Критерий: гипотеза принимается, если неравенство удовлетворяется |
Примечание |
|
оба неизвестны
оба неизвестны
известны |
т.к.
2 случайные величины
нормальное распределение |
|
|
неизвестны
неизвестны
и известны |
|
-значение
|
Предполагается,
что генеральная совокупность имеет
нормальное распределение. nA
– число наблюдений из выборки А. nВ
– число наблюдений из выборки В. t
вычисляется для
степеней свободы.
Если вычисляется разность > правой части, то гипотеза принимается, в противном случае отвергается.
Критерии для сравнения средних значений.
Рассмотрим (для примера) первый случай.
Предположим, что имеются выборки случайных переменных А и В, распределённых по нормальному закону с указанными ниже средними значениями и дисперсиями.
|
А |
В |
Выборочные значения |
|
|
Средние по ансамблю |
|
|
Дисперсия по ансамблю |
|
|
Можно вычислить следующие выборочные статистики:
;
;
;
.
Выборочные
и
распределены по нормальному закону
и
.
Их
разность
также распределена нормально
.
(сумма дисп. средн.)
Если
значимо не отличается от
проверяются гипотезы
;
.
Если эти гипотезы справедливы, то разность распределена нормально
Известно,
что если из нормально распределённой
совокупности производится k
выборок, каждая из которых обладает
одной и той же дисперсией (но не обязательно
одним и тем же средним), то объединённая
оценка дисперсии
равна
\
( взвешенное среднее)
- число степеней свободы
(Если
,
то получим
,
то есть среднее.)
С
учётом этого находим оценку для
.
Таким
образом статистика
;
следовательно
имеет
t
распределение с
степенями свободы. Если t
значимо отлично от нуля, следует считать,
что
.
Пример: сравнение двух средних.
Два разных сорта бензина (октановые числа 90 и 94) использовались для определения числа пройденных километров на литр бензина. (Пробег по одному и тому же маршруту). – количество пробегов – по пяти.
Получено |
Октановые числа |
|
94 |
90 |
|
Выборочное среднее; км/л. |
22, 7 |
21, 3 |
Выборочное анализированное отклонение; км/л. |
0, 45 |
0, 55 |
