
- •Глава 5. Основные принципы организации и первичной обработки данных эксперимента
- •5.1 Общие положения, эффективность эксперимента
- •5.2 Ошибки измерений при экспериментировании
- •5.3 Элементы теории вероятностей
- •5.3.1 Предмет и основные понятия теории вероятностей
- •5.3.2 Случайные величины и их числовые характеристики
- •Искомая дисперсия:
- •5.3.3 Интегральная функция распределения и числовые характеристики непрерывных случайных величин
- •5.3.4 Нормальное распределение
- •5.3.5 Понятие о системе нескольких случайных величин и их числовых характеристиках
- •5.4 Элементы математической статистики
- •5.4.1 Задача математической статистики
- •5.4.2 Генеральная и выборочная совокупности
- •5.4.3 Статистическое распределение выборки и эмпирическая функция распределения
- •Написать распределение относительных частот.
- •Варианты хi 2 6 10 частоты ni 12 18 30.
- •5.4.4 Полигон и гистограмма
- •5.4.5 Статистические оценки параметров распределения
- •5.4.6 Точность оценки, доверительная вероятность (надёжность). Доверительный интервал
- •5.4.7 Другие характеристики вариационного ряда
- •5.5 Приёмы первичной обработки экспериментальных данных
- •5.5.1 Систематизация данных измерений и нахождение числовых характеристик измеряемых величин
- •5.5.2 Обнаружение грубых ошибок (промахов)
- •5.5.3 Интервальная оценка истинного значения измеряемого параметра
- •5.5.4 Сравнение интервальных оценок измеряемого параметра
- •Результаты измерений плотности прессовок
- •5.6.1 Проверка наличия промахов в выборках
- •5.6.2 Определение интервальных оценок плотности прессовок
- •5.6.3 Проверка гипотезы о статистической значимости различия плотности прессовок, полученных при различных давлениях прессования
- •5.6.4 Проверка нормальности распределения ошибок измерений плотности в выборках
- •Данные для проверки гипотезы о нормальном распределении ошибок измерений плотности прессовок
- •5.7 Вопросы для самоконтроля
5.4.6 Точность оценки, доверительная вероятность (надёжность). Доверительный интервал
Точечной называют оценку, которая определяется одним числом. Все оценки, рассмотренные выше, – точечные. При выборке малого объёма точечная оценка может значительно отличаться от оцениваемого параметра, т.е. приводить к грубым ошибкам. По этой причине при небольшом объеме выборки следует пользоваться интервальными оценками.
Интервальной называют оценку, которая определяется двумя числами – концами интервала. Интервальные оценки позволяют установить точность и надежность оценок.
Пусть найденная
по данным выборки статистическая
характеристика
служит оценкой неизвестного параметра
.
Будем считать
постоянным
числом (
может быть случайной величиной). Ясно,
что
тем точнее определяет параметр
,
чем меньше абсолютная величина разности
.
Другими словами, если
> 0
и
то, чем меньше
,
тем оценка точнее. Таким образом,
положительное число
характеризует точность
оценки.
Однако,
статистические методы не позволяют
категорически утверждать, что оценка
удовлетворяет неравенству
,
можно лишь говорить о вероятности
,
с которой это неравенство осуществляется.
Надежностью (доверительной вероятностью) оценки по называют вероятность , с которой осуществляется неравенство . Обычно надежность оценки задается наперед, причем в качестве берут число, близкое к единице. Наиболее часто задают надежность, равную 0,95; 0,99 и 0,999.
Пусть вероятность того, что равна :
Заменим неравенство равнозначным ему двойным неравенством
- δ
δ
или
- δ)
+ δ).
(5.39)
Тогда
(5.40)
Это соотношение
следует понимать так: вероятность того,
что интервал [
]
заключает в себе (покрывает) неизвестный
параметр
,
равна
.
Доверительным называют интервал [ ], который покрывает неизвестный параметр с заданной надежностью .
Если случайная
величина X
распределена нормально, то выборочная
средняя
,
найденная по независимым наблюдениям,
также распределена нормально. При
известном среднеквадратичном отклонении
с надежностью
можно утверждать, что доверительный
интервал
покрывает неизвестный параметр Х;
точность оценки
.
Число t
определяется по таблице (находят аргумент
t,
ему соответствует значение функции
Лапласа Ф(t),
равное
).
При возрастании объема выборки n число убывает и, следовательно, точность оценки увеличивается. Увеличение надежности оценки приводит к увеличению t, a следовательно, и к возрастанию . Другими словами, увеличение надежности оценки влечет за собой уменьшение ее точности.
При неизвестном среднеквадратичном отклонении можно найти доверительный интервал, покрывающий неизвестный параметр Х с надежностью , пользуясь распределением Стьюдента и величиной S.
.
(5.41)
Здесь использованы
величины
и S,
найденные по выборке, а по заданным n
и
можно найти значения
(t-критерия
Стьюдента) по таблице.
Распределение Стьюдента определяется параметром n – объемом выборки (или числом степеней свободы*) и не зависит от неизвестных параметров Х и . Эта особенность является большим достоинством распределения Стьюдента.
При неограниченном возрастании объема выборки n распределение Стьюдента стремится к нормальному. Поэтому при n > 30 можно вместо распределения Стьюдента пользоваться нормальным распределением.
Однако, важно подчеркнуть, что для малых выборок (n < 2030), в особенно для малых значений n, замена распределения нормальным может приводить к грубым ошибкам, а именно: к неоправданному сужению доверительного интервала, т.е. к неоправданному повышению точности оценки.
Итак, истинное значение измеряемого параметра можно оценивать по среднему арифметическому результатов отдельных измерений при помощи доверительных интервалов.
___________________________
* Числом степеней свободы называется число наблюдений минус число оцененных по ним параметров.