- •Измерения.
- •С учётом ошибок измерений связь между результатами измерений и неизвестными параметрами описывается следующей системой уравнений: ,
- •Основные задачи обработки измерений.
- •Можно левые части уравнения заменить приближёнными соотношениями вида:
- •Статистическая обработка измерений. Задача обработки измерений: отыскать методы построения оценок, при которых отсутствует смещение оценки, а дисперсия оценок – наименьшая – т.Е. Эффективных оценок.
- •Если считать, что , то система не доопределена.
- •Случайная величина и ее характеристики
- •Функция распределения вероятностей
- •Случайная величина и ее характеристики
- •Равномерное распределение
- •Нормальный закон распределения (закон Гаусса)
- •Закон редких событий (закон Пуассона)
- •Системы случайных величин
- •Числовые характеристики системы двух случайных величин
- •Числовые характеристики системы нескольких случайных величин
- •Двумерный нормальный закон распределения
- •Законы распределения, связанные с нормальным
- •Критерии качества оценок
- •Оценивание параметров процессов по результатам измерений.
- •Обзор основных понятий и задач математической статистики
- •Методы оценивания параметров
- •Недостатки метода наименьших квадратов и понятие о помехоустойчивом ( робастном, устойчивом ) методе оценивания
- •Введение в помехоустойчивое оценивание
- •Робастные оценки
- •Помехоустойчивая оценка параметра масштаба
- •Различны ли сорта при уровне значимости ? Если это так, то является ли бензин с октановым числом 94 значимо лучше?
- •Построение линейной регрессионной модели с одной независимой переменной.
- •Исследование уравнений регрессии.
- •Литература
Недостатки метода наименьших квадратов и понятие о помехоустойчивом ( робастном, устойчивом ) методе оценивания
Мы показали, что между ММП ( методом максимального правдоподобия ), гауссовским распределением ошибок и МНК (методом наименьших квадратов) существует тесная связь:
если ошибки измерений подчинены нормальному закону распределения, то метод МП сводится к методу НК.
Доказано, что получается при этом оценки - оптимальные !
То есть МНК оценки - эффективные !! ( в классе линейных оценок )
Однако Гаусс понимал, что нормальность не всегда имеет место, и поэтому подчеркивал, что основным доводом, которым он руководствовался, вводя этот метод, является вычислительная простота.
На самом деле “Нормальность - это миф. В реальном мире никогда не было и никогда не будет нормального распределения”.
“Каждый уверен в справедливости закона ошибок, экспериментаторы - потому, что они думают, что это математическая теорема, математики - потому, что они думают, что это экспериментальный факт”.
В действительности распределения часто являются «приближенно нормальными».
Поэтому еще в 1805 году Лежандр указывал, что прежде, чем воспользоваться этим методом ( и, в частности, выборочным средним ), следует тщательно просмотреть выборку и отбросить те выборочные значения, которые являются или кажутся аномальными ( то есть провести редактирование выборки ). В 1818 году Бессель при исследовании ряда выборок большой длины пришел к выводу, что большие значения ошибок измерений встречаются несколько чаще, чем это было бы при нормальном законе распределения ошибок.
В настоящее время общепринятым является утверждение, что 1-10% аномальных значений в общей массе данных - это скорее правило, а не исключение.
Пример: требуется оценить параметр сдвига ( меру положения ) для
выборки x1, x2,..,xn. МНК приводит к задаче минимизации
выражения
и оценка математического ожидания
дается
в виде среднего арифметического
.
Эта
оценка является эффективной в случае нормально
распределенных случайных величин.
Теперь рассмотрим набор данных:
0.96; 1.01; 0.97; 1.02; 1.04; 1.00; 10.52
МНК:
1
= 2.36
Если отбросить последние значение (10.52), то получится 2 = 1 !
Введение в помехоустойчивое оценивание
В 1818 году Лаплас предложил метод наименьших модулей для решения задачи линейной регрессии с одним параметром ( наклон ) при произвольном симметричном распределении ошибок измерений.
f(xi,
Q)
=
При
этом функцию правдоподобия составить
можно gn(x
\ Q)
=
,
а уравнение правдоподобия записать
нельзя вследствие неаналитического
характера функции ( нет производной,
так как модуль - негладкая функция ).
Поэтому для получения максимально
правдоподобных оценок необходимо
искать минимум функции Ln(x
\ Q)
=
непосредственно.
Решение
дает оценку
,
равную медиане выборки.
Медиана - значение X, при котором функция распределения Ф(x) = . Если выборку упорядочить по возрастанию, то медиана - значение среднего элемента выборки.
В предыдущем примере:
0.96; 0.97; 1.00; 1.01; 1.02; 1.04; 10.52
1 2 3 4 5 6 7
медиана дает оценку = 1.01, то есть вполне приемлемый результат.
