
- •Глава 5. Основные принципы организации и первичной обработки данных эксперимента
- •5.1 Общие положения, эффективность эксперимента
- •5.2 Ошибки измерений при экспериментировании
- •5.3 Элементы теории вероятностей
- •5.3.1 Предмет и основные понятия теории вероятностей
- •5.3.2 Случайные величины и их числовые характеристики
- •Искомая дисперсия:
- •5.3.3 Интегральная функция распределения и числовые характеристики непрерывных случайных величин
- •5.3.4 Нормальное распределение
- •5.3.5 Понятие о системе нескольких случайных величин и их числовых характеристиках
- •5.4 Элементы математической статистики
- •5.4.1 Задача математической статистики
- •5.4.2 Генеральная и выборочная совокупности
- •5.4.3 Статистическое распределение выборки и эмпирическая функция распределения
- •Написать распределение относительных частот.
- •Варианты хi 2 6 10 частоты ni 12 18 30.
- •5.4.4 Полигон и гистограмма
- •5.4.5 Статистические оценки параметров распределения
- •5.4.6 Точность оценки, доверительная вероятность (надёжность). Доверительный интервал
- •5.4.7 Другие характеристики вариационного ряда
- •5.5 Приёмы первичной обработки экспериментальных данных
- •5.5.1 Систематизация данных измерений и нахождение числовых характеристик измеряемых величин
- •5.5.2 Обнаружение грубых ошибок (промахов)
- •5.5.3 Интервальная оценка истинного значения измеряемого параметра
- •5.5.4 Сравнение интервальных оценок измеряемого параметра
- •5.5.5 Проверка гипотезы о нормальности распределения случайных ошибок измерений
- •Результаты измерений плотности прессовок
- •Численные характеристики выборок
- •5.6.1 Проверка наличия промахов в выборках
- •5.6.4 Проверка нормальности распределения ошибок измерений плотности в выборках
- •5.7 Вопросы для самоконтроля
5.4.6 Точность оценки, доверительная вероятность (надёжность). Доверительный интервал
Точечной называют оценку, которая определяется одним числом. Все оценки, рассмотренные выше, – точечные. При выборке малого объёма точечная оценка может значительно отличаться от оцениваемого параметра, т.е. приводить к грубым ошибкам. По этой причине при небольшом объеме выборки следует пользоваться интервальными оценками.
Интервальной называют оценку, которая определяется двумя числами – концами интервала. Интервальные оценки позволяют установить точность и надежность оценок.
Пусть найденная
по данным выборки статистическая
характеристика
служит оценкой неизвестного параметра
.
Будем считать
постоянным
числом (
может быть случайной величиной). Ясно,
что
тем точнее определяет параметр
,
чем меньше абсолютная величина разности
.
Другими словами, если
> 0
и
то, чем меньше
,
тем оценка точнее. Таким образом,
положительное число
характеризует точность
оценки.
Однако,
статистические методы не позволяют
категорически утверждать, что оценка
удовлетворяет неравенству
,
можно лишь говорить о вероятности
,
с которой это неравенство осуществляется.
Надежностью
(доверительной
вероятностью)
оценки
по
называют вероятность
,
с которой осуществляется неравенство
.
Обычно надежность оценки задается
наперед, причем в качестве
берут число, близкое к единице. Наиболее
часто задают надежность, равную 0,95; 0,99
и 0,999.
Пусть вероятность
того, что
равна
:
Заменим неравенство
равнозначным
ему двойным неравенством
- δ
δ
или
- δ)
+ δ).
(5.39)
Тогда
(5.40)
Это соотношение
следует понимать так: вероятность того,
что интервал []
заключает в себе (покрывает) неизвестный
параметр
,
равна
.
Доверительным
называют интервал
[],
который покрывает неизвестный параметр
с заданной надежностью
.
Если случайная
величина X
распределена нормально, то выборочная
средняя
,
найденная по независимым наблюдениям,
также распределена нормально. При
известном среднеквадратичном отклонении
с надежностью
можно утверждать, что доверительный
интервал
покрывает неизвестный параметрХ;
точность оценки
.
Числоt
определяется по таблице (находят аргумент
t,
ему соответствует значение функции
Лапласа Ф(t),
равное
).
При возрастании
объема выборки n
число
убывает и, следовательно, точность
оценки увеличивается. Увеличение
надежности оценки
приводит к увеличению t,
a следовательно, и к возрастанию
.
Другими словами, увеличение
надежности оценки влечет за собой
уменьшение ее точности.
При неизвестном
среднеквадратичном отклонении
можно найти доверительный интервал,
покрывающий неизвестный параметр Х
с надежностью,
пользуясь распределением Стьюдента и
величиной S.
.
(5.41)
Здесь использованы
величины
и S,
найденные по выборке, а по заданным n
и
можно найти значения
(t-критерия
Стьюдента) по таблице.
Распределение Стьюдента определяется параметром n – объемом выборки (или числом степеней свободы*) и не зависит от неизвестных параметров Х и . Эта особенность является большим достоинством распределения Стьюдента.
При неограниченном возрастании объема выборки n распределение Стьюдента стремится к нормальному. Поэтому при n > 30 можно вместо распределения Стьюдента пользоваться нормальным распределением.
Однако, важно подчеркнуть, что для малых выборок (n < 2030), в особенно для малых значений n, заменараспределения нормальным может приводить к грубым ошибкам, а именно: к неоправданному сужению доверительного интервала, т.е. к неоправданному повышению точности оценки.
Итак, истинное значение измеряемого параметра можно оценивать по среднему арифметическому результатов отдельных измерений при помощи доверительных интервалов.
___________________________
* Числом степеней свободы называется число наблюдений минус число оцененных по ним параметров.