- •Измерения.
- •С учётом ошибок измерений связь между результатами измерений и неизвестными параметрами описывается следующей системой уравнений: ,
- •Основные задачи обработки измерений.
- •Можно левые части уравнения заменить приближёнными соотношениями вида:
- •Статистическая обработка измерений. Задача обработки измерений: отыскать методы построения оценок, при которых отсутствует смещение оценки, а дисперсия оценок – наименьшая – т.Е. Эффективных оценок.
- •Если считать, что , то система не доопределена.
- •Случайная величина и ее характеристики
- •Функция распределения вероятностей
- •Случайная величина и ее характеристики
- •Равномерное распределение
- •Нормальный закон распределения (закон Гаусса)
- •Закон редких событий (закон Пуассона)
- •Системы случайных величин
- •Числовые характеристики системы двух случайных величин
- •Числовые характеристики системы нескольких случайных величин
- •Двумерный нормальный закон распределения
- •Законы распределения, связанные с нормальным
- •Критерии качества оценок
- •Оценивание параметров процессов по результатам измерений.
- •Обзор основных понятий и задач математической статистики
- •Методы оценивания параметров
- •Недостатки метода наименьших квадратов и понятие о помехоустойчивом ( робастном, устойчивом ) методе оценивания
- •Введение в помехоустойчивое оценивание
- •Робастные оценки
- •Помехоустойчивая оценка параметра масштаба
- •Различны ли сорта при уровне значимости ? Если это так, то является ли бензин с октановым числом 94 значимо лучше?
- •Построение линейной регрессионной модели с одной независимой переменной.
- •Исследование уравнений регрессии.
- •Литература
Различны ли сорта при уровне значимости ? Если это так, то является ли бензин с октановым числом 94 значимо лучше?
Решение
: Проверяем гипотезу :
.
При условии, что
( об этом ниже ).
.
-
различие значимо. Гипотеза
принимается
(не отвергается).
Теперь
проверим гипотезу :
.
(
)
;
1, 4 > 0, 59 Гипотеза также принимается.
Проверка гипотез для дисперсий.
Проверить,
отличается ли выборочная дисперсия от
стандартной , заранее известной – (
)
можно, используя
распределение, которому подчиняется
выборочная дисперсия.
Для
двух случайных величин
и
проверка выборочных дисперсий проводится
с помощью F-распределения.
При этом можно пользоваться следующей
таблицей:
Гипотеза |
Используемый критерий |
Число степеней свободы |
Решение |
Замечания |
|
|
|
Гипотеза принимается, если неравенства справедливы |
Двусторонний критерий |
|
|
|
Гипотеза принимается, если неравенства справедливы |
Односторонний критерий |
|
|
|
Гипотеза принимается, если неравенства справедливы |
Односторонний критерий |
|
|
|
Гипотеза принимается, если неравенства справедливы |
Двусторонний
критерий F.
Проверять нужно только правое
ограничение, так как
|
|
|
|
Гипотеза принимается, если неравенства справедливы |
Двусторонний критерий F. |
Для
примера рассмотрим критерий F
из четвёртой строки. Проверяем гипотезу
;
.
Так как
всегда <1, проверяем только правое
неравенство, то есть
.
Пример. Смонтированы две опытные установки.
Получены результаты
-
Установка А (кг)
Установка В (кг)
97, 8
98, 9
101, 2
98, 8
102, 0
99, 0
99, 1
100, 8
100, 9
100, 5
97, 2
100, 5
98, 2
98, 3
97, 5
99, 9
97, 9
96, 8
97, 4
97, 2
99, 9
98, 1
1, 69
1, 44
Проверить равенство дисперсий Н0:
.
При
находим
.
1, 17<4, 03.
Гипотеза принимается.
Отличие дисперсий незначимо.
Построение линейной регрессионной модели с одной независимой переменной.
Одной из основных задач обработки данных является установление функциональной зависимости между переменными (параметрами) исследуемого процесса. Зачастую такие зависимости не очевидны, или слишком сложны. В таком случае ставится задача аппроксимации функциональной связи по эмпирическим данным. Эта задача решается с помощью регрессионного метода, который был назван известнейшим специалистом в области обработки данных Тьюки методом века.
Аппроксимацией называется подбор математического выражения, описывающего связь между экспериментальными данными. Само математическое выражение называют уравнением регрессии (регрессией), а соответствующую кривую - линией регрессии [1]. Простейшей регрессионной зависимостью является линейная. Если между переменными существует линейная функциональная связь, то результаты измерений будут концентрироваться около прямой, отражающей эту зависимость. Отклонения от прямой вызваны погрешностью измерений.
В случае двух переменных одна из них - X рассматривается как независимая и называется фактором или предиктором, вторая переменная Y является зависимой и называется откликом. Таким образом ,уравнение Y относительно X - уравнение регрессии ( говорят что Y регрессирует на X).
В случае линейной модели уравнение регрессии имеет вид:
,
(1)
где 0 и 1 параметры модели;
- остаточный член, обусловленный влиянием погрешностей измерений, случайных вариаций Y и погрешностью модели.
Погрешность модели возникает в случае замены какой - либо более сложной модели линейной зависимостью.
Оценки параметров модели (0 и 1) находятся по результатам наблюдений.
Модель (1) является линейной первого порядка. Порядок модели определяется наивысшей степенью предиктора. Так модель
(2)
является линейной (относительно параметров ) третьего порядка..
В результате построения модели находятся оценки параметров b0 и b1 Уравнение регрессии, соответствующее уравнению (1), имеет вид
,
(3)
где
- расчетное или прогнозируемое значение
Y
для данного X.
МНК - оценки параметров получаются минимизацией суммы квадратов отклонений от «истинной» линии.
где n - число независимых наблюдений величин Хi и Yi
Получены следующие МНК оценки параметров 0 и 1[2]
,
(5)
где
-
средние значения наблюдаемых величин
X
и Y.
Подставляя оценки (5) в уравнение (3),
можно вычислить «прогнозируемые»
значения
и найти остатки
.
Для правильно построенной модели сумма
остатков равна 0.
