Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
лекции / Часть 3-1.doc
Скачиваний:
51
Добавлен:
17.02.2014
Размер:
531.46 Кб
Скачать
  1. Анализ достоверности и точности статистических оценок

Каждая количественная характеристика, например,математическое ожидание, дисперсия, коэффициент регриссии и т.д. имеют весь спектр статистических оценок – математическое ожидание , дисперсия при различных выборках, коэффициент корреляции с другими параметрами и т.д. Для практического применения статистических оценок характеристик важна их точность.

Каждая оценка имеет свою функцию распределения, показывающую вероятность нахождения оценки в каком-то коридоре. Поэтому точность оценок определяется двумя величинами – значением доверительного интервала и значением вероятности нахождения оценки в данном интервале.

Для многих статистических характеристик – коэффициент корреляции, коэффициент регрессии и др. важной задачей является анлиз - имеется ли корреляционная или регрессионная зависимость, т.е. значимо ли отличаются от нуля данные характеристики или полученные оценки отличны от нуля в результате ошибок оценок. Значимость (отличие от нуля истинных характеристик при отличии от нуля оценок) проверяется двумя путями – построением доверительного интервала или путем использования t-критерия.

Рассмотрим эти понятия на примере:

        1. Оценка математического ожидания случайной величины X [ ]:

Оценкой матожидания является среднее.

Если предел , то оценка не смещенная. Пусть, мы сделалиkвыборок, каждая поnэкспериментов, по результатам которых получилиk оценок среднегои построили функцию распределения оценки среднего поkполученным данным. Оценка среднего имеет нормальное распределение с параметрами:(см рисунок )

Теперь представим, что мы сделали одну выборку и получили какую-то оценку среднего. Данная оценка может находиться в любой точке рассмотренного распределения. Если оценка совпала с матожиданием, то ошибка равна нулю, но мы можем получить и наихудший вариант, когда. Тогда истинное значение матожидания находится в коридоре. Для нормального распределения в коридорпопадает 99,7% значений, следоветельно с 99,7% доверительной вероятностью матожидание равно. Соответственно, с 95% доверительной вероятностью

Снижение ошибки оценки среднего необходимо уменьшить дисперсию оценки, что можно сделать путем увеличиния объема выборки.

Таким образом, для получения доверительного интервала мы к полученной оценке добавляем интервал, равный в 1, 2, или 3 СКО (средняя квадратичная ошибка). При этом с заданной надежностью 68%, 95% или99,7% истинное значениеmxпопадает в данный интервал.

Но указанная закономерность действительна для нормального закона распределения. Выразим доверительный интервал в среднеквадратичных отклонениях , где

Дело в том, что функция распределения отношения отличается от нормального. Данное распределение называется распределением Стьюдента, а отношениеназываетсяt-критерием. Значениеt- критерия зависит от объема выборкиNи заданной доверительной вероятностии приводятся в литературе по статистичеким методам анализа [ ].

При объемах выборки N30t- распределение близко к нормальному, при объеме выборки30 значенияt-критерия берутся из таблиц.

Рассмотрим применение t-критерия для анализа значимости величиныx.

Получены оценки

Определяем расчетное значение t-критерия и сравниваем его с табличным, взятым для данного значенияNи доверительной вероятности

Если, тох– величина значимая.

Для других оценок при построении доверительных интервалов и оценка значимости являются аналогичными. Только, вследствие разницы выражений для определения конкретной оценки, изменяются вид распределения и вид критерия. Основные виды проверки гипотез и применяемые при этом критерии приведены в таблице

№ п/п

Наименование проверки

Тип

1

Проверка значимости

t-критерий

2

Оценка дисперсии

- критерий

3

Оценка отношений дисперсий при анализе адекватности математических моделей

Критерий Фишера F-критерий

, иF-критерии также табулированы и приводятся в литературе.

При использовании статистических оценок и критериев используется понятие число степеней свободы. Твердое тело в трехмерном пространстве имеет 6 степеней свободы – движение по 3-м осям и вращение вокруг этих осей. При вставлении во втулку оси у втулки остается 2 степени свободы – движение по оси и вращение вокруг этой оси.

Понятие – число степеней свободы используется в математике для определения количества переменых в системе, которые могут изменяться не нарушая имеющиеся математические соотношения.

Пусть имеется выборка значений xобъемомn. Пока не определили ни одной статистической характеристики всеnзначений могут изменяться, тк они ничем не связаны - система имеетn степеней свободы. Пусть мы определили оценку среднего(обратим внимание, что в знаменателе стоитn). Теперь, связав систему средним значением, мы не можем изменять все значенияx, т.к. среднее изменится. Можно изменятьn-1 значениеx, а последнее значение рассчитать из уравнения оценки среднего. Таким образом, система стала иметьn-1степень свободы. Поэтому в выражении определения дисперсии, которая определяется после определения среднего, в знаменателе стоитn –1

. При оценке остаточной ошибки в задаче идентификацииmкоэффициентов число степеней свободы еще уменьшается и становится равным.

Пример: Определение оценок и доверительных интервалов среднего и дисперсии.

n

x

1

76.78

2

76.43

3

77.20

4

76.45

5

76.25

6

76.48

7

76.48

8

76.60

1.По экспериментальным данным

Соседние файлы в папке лекции