
- •Анализ достоверности и точности статистических оценок
- •Оценка математического ожидания случайной величины X [ ]:
- •Доверительный интервал для среднего значения при доверительной вероятности
- •Введение в дисперссионный анализ
- •Показатели адекватности математической модели. Коэффициент множественной корреляции
- •F-критерий адекватности модели.
- •Проверка значимости коэффициентов регрессии
- •Корреляционный анализ
Анализ достоверности и точности статистических оценок
Каждая количественная характеристика, например,математическое ожидание, дисперсия, коэффициент регриссии и т.д. имеют весь спектр статистических оценок – математическое ожидание , дисперсия при различных выборках, коэффициент корреляции с другими параметрами и т.д. Для практического применения статистических оценок характеристик важна их точность.
Каждая оценка имеет свою функцию распределения, показывающую вероятность нахождения оценки в каком-то коридоре. Поэтому точность оценок определяется двумя величинами – значением доверительного интервала и значением вероятности нахождения оценки в данном интервале.
Для многих статистических характеристик – коэффициент корреляции, коэффициент регрессии и др. важной задачей является анлиз - имеется ли корреляционная или регрессионная зависимость, т.е. значимо ли отличаются от нуля данные характеристики или полученные оценки отличны от нуля в результате ошибок оценок. Значимость (отличие от нуля истинных характеристик при отличии от нуля оценок) проверяется двумя путями – построением доверительного интервала или путем использования t-критерия.
Рассмотрим эти понятия на примере:
Оценка математического ожидания случайной величины X [ ]:
Оценкой
матожидания
является среднее
.
Если
предел
,
то оценка не смещенная. Пусть, мы сделалиkвыборок, каждая поnэкспериментов, по
результатам которых получилиk
оценок среднего
и построили функцию распределения
оценки среднего поkполученным данным. Оценка среднего
имеет нормальное распределение с
параметрами:
(см
рисунок )
Теперь
представим, что мы сделали одну выборку
и получили какую-то оценку среднего
.
Данная оценка может находиться в любой
точке рассмотренного распределения.
Если оценка совпала с матожиданием
,
то ошибка равна нулю, но мы можем получить
и наихудший вариант, когда
.
Тогда истинное значение матожидания
находится в коридоре
.
Для нормального распределения в коридор
попадает
99,7% значений, следоветельно с 99,7%
доверительной вероятностью матожидание
равно
.
Соответственно, с 95% доверительной
вероятностью
Снижение ошибки оценки среднего необходимо уменьшить дисперсию оценки, что можно сделать путем увеличиния объема выборки.
Таким
образом, для получения доверительного
интервала мы к полученной оценке
добавляем интервал, равный в 1, 2, или 3
СКО (средняя квадратичная ошибка). При
этом с заданной надежностью 68%, 95%
или99,7% истинное значениеmxпопадает в данный интервал.
Но
указанная закономерность действительна
для нормального закона распределения.
Выразим доверительный интервал в
среднеквадратичных отклонениях
,
где
Дело в
том, что функция распределения отношения
отличается от нормального. Данное
распределение называется распределением
Стьюдента, а отношение
называетсяt-критерием.
Значениеt- критерия
зависит от объема выборкиNи заданной доверительной вероятности
и приводятся в литературе по статистичеким
методам анализа [ ].
При объемах выборки N30t- распределение близко к нормальному, при объеме выборки30 значенияt-критерия берутся из таблиц.
Рассмотрим применение t-критерия для анализа значимости величиныx.
Получены
оценки
Определяем
расчетное значение t-критерия
и сравниваем его с табличным, взятым
для данного значенияNи
доверительной вероятности
Если
,
тох– величина значимая.
Для других оценок при построении доверительных интервалов и оценка значимости являются аналогичными. Только, вследствие разницы выражений для определения конкретной оценки, изменяются вид распределения и вид критерия. Основные виды проверки гипотез и применяемые при этом критерии приведены в таблице
№ п/п |
Наименование проверки |
Тип |
1 |
Проверка значимости
|
t-критерий |
2 |
Оценка дисперсии |
|
3 |
Оценка отношений дисперсий при анализе адекватности математических моделей |
Критерий Фишера F-критерий |
,
иF-критерии также
табулированы и приводятся в литературе.
При использовании статистических оценок и критериев используется понятие число степеней свободы. Твердое тело в трехмерном пространстве имеет 6 степеней свободы – движение по 3-м осям и вращение вокруг этих осей. При вставлении во втулку оси у втулки остается 2 степени свободы – движение по оси и вращение вокруг этой оси.
Понятие – число степеней свободы используется в математике для определения количества переменых в системе, которые могут изменяться не нарушая имеющиеся математические соотношения.
Пусть
имеется выборка значений xобъемомn. Пока не
определили ни одной статистической
характеристики всеnзначений могут изменяться, тк они ничем
не связаны - система имеетn степеней
свободы. Пусть мы определили оценку
среднего(обратим внимание, что в знаменателе
стоитn). Теперь,
связав систему средним значением, мы
не можем изменять все значенияx,
т.к. среднее изменится. Можно изменятьn-1 значениеx, а последнее значение
рассчитать из уравнения оценки среднего.
Таким образом, система стала иметьn-1степень свободы. Поэтому в выражении
определения дисперсии, которая
определяется после определения среднего,
в знаменателе стоитn
–1
.
При оценке остаточной ошибки в задаче
идентификацииmкоэффициентов
число степеней свободы еще уменьшается
и становится равным
.
Пример: Определение оценок и доверительных интервалов среднего и дисперсии.
№ n |
x |
1 |
76.78 |
2 |
76.43 |
3 |
77.20 |
4 |
76.45 |
5 |
76.25 |
6 |
76.48 |
7 |
76.48 |
8 |
76.60 |