- •Глава 5. Основные принципы организации и первичной обработки данных эксперимента
- •5.1 Общие положения, эффективность эксперимента
- •5.2 Ошибки измерений при экспериментировании
- •5.3 Элементы теории вероятностей
- •5.3.1 Предмет и основные понятия теории вероятностей
- •5.3.2 Случайные величины и их числовые характеристики
- •Искомая дисперсия:
- •5.3.3 Интегральная функция распределения и числовые характеристики непрерывных случайных величин
- •5.3.4 Нормальное распределение
- •5.3.5 Понятие о системе нескольких случайных величин и их числовых характеристиках
- •5.4 Элементы математической статистики
- •5.4.1 Задача математической статистики
- •5.4.2 Генеральная и выборочная совокупности
- •5.4.3 Статистическое распределение выборки и эмпирическая функция распределения
- •Написать распределение относительных частот.
- •Варианты хi 2 6 10 частоты ni 12 18 30.
- •5.4.4 Полигон и гистограмма
- •5.4.5 Статистические оценки параметров распределения
- •5.4.6 Точность оценки, доверительная вероятность (надёжность). Доверительный интервал
- •5.4.7 Другие характеристики вариационного ряда
- •5.5 Приёмы первичной обработки экспериментальных данных
- •5.5.1 Систематизация данных измерений и нахождение числовых характеристик измеряемых величин
- •5.5.2 Обнаружение грубых ошибок (промахов)
- •5.5.3 Интервальная оценка истинного значения измеряемого параметра
- •5.5.4 Сравнение интервальных оценок измеряемого параметра
- •Результаты измерений плотности прессовок
- •5.6.1 Проверка наличия промахов в выборках
- •5.6.2 Определение интервальных оценок плотности прессовок
- •5.6.3 Проверка гипотезы о статистической значимости различия плотности прессовок, полученных при различных давлениях прессования
- •5.6.4 Проверка нормальности распределения ошибок измерений плотности в выборках
- •Данные для проверки гипотезы о нормальном распределении ошибок измерений плотности прессовок
- •5.7 Вопросы для самоконтроля
5.4.6 Точность оценки, доверительная вероятность (надёжность). Доверительный интервал
Точечной называют оценку, которая определяется одним числом. Все оценки, рассмотренные выше, – точечные. При выборке малого объёма точечная оценка может значительно отличаться от оцениваемого параметра, т.е. приводить к грубым ошибкам. По этой причине при небольшом объеме выборки следует пользоваться интервальными оценками.
Интервальной называют оценку, которая определяется двумя числами – концами интервала. Интервальные оценки позволяют установить точность и надежность оценок.
Пусть найденная по данным выборки статистическая характеристика служит оценкой неизвестного параметра . Будем считать постоянным числом ( может быть случайной величиной). Ясно, что тем точнее определяет параметр , чем меньше абсолютная величина разности . Другими словами, если > 0 и то, чем меньше , тем оценка точнее. Таким образом, положительное число характеризует точность оценки.
Однако, статистические методы не позволяют категорически утверждать, что оценка удовлетворяет неравенству , можно лишь говорить о вероятности , с которой это неравенство осуществляется.
Надежностью (доверительной вероятностью) оценки по называют вероятность , с которой осуществляется неравенство . Обычно надежность оценки задается наперед, причем в качестве берут число, близкое к единице. Наиболее часто задают надежность, равную 0,95; 0,99 и 0,999.
Пусть вероятность того, что равна :
Заменим неравенство равнозначным ему двойным неравенством
- δ δ или - δ) + δ). (5.39)
Тогда (5.40)
Это соотношение следует понимать так: вероятность того, что интервал [ ] заключает в себе (покрывает) неизвестный параметр , равна .
Доверительным называют интервал [ ], который покрывает неизвестный параметр с заданной надежностью .
Если случайная величина X распределена нормально, то выборочная средняя , найденная по независимым наблюдениям, также распределена нормально. При известном среднеквадратичном отклонении с надежностью можно утверждать, что доверительный интервал покрывает неизвестный параметр Х; точность оценки . Число t определяется по таблице (находят аргумент t, ему соответствует значение функции Лапласа Ф(t), равное ).
При возрастании объема выборки n число убывает и, следовательно, точность оценки увеличивается. Увеличение надежности оценки приводит к увеличению t, a следовательно, и к возрастанию . Другими словами, увеличение надежности оценки влечет за собой уменьшение ее точности.
При неизвестном среднеквадратичном отклонении можно найти доверительный интервал, покрывающий неизвестный параметр Х с надежностью , пользуясь распределением Стьюдента и величиной S.
. (5.41)
Здесь использованы величины и S, найденные по выборке, а по заданным n и можно найти значения (t-критерия Стьюдента) по таблице.
Распределение Стьюдента определяется параметром n – объемом выборки (или числом степеней свободы*) и не зависит от неизвестных параметров Х и . Эта особенность является большим достоинством распределения Стьюдента.
При неограниченном возрастании объема выборки n распределение Стьюдента стремится к нормальному. Поэтому при n > 30 можно вместо распределения Стьюдента пользоваться нормальным распределением.
Однако, важно подчеркнуть, что для малых выборок (n < 2030), в особенно для малых значений n, замена распределения нормальным может приводить к грубым ошибкам, а именно: к неоправданному сужению доверительного интервала, т.е. к неоправданному повышению точности оценки.
Итак, истинное значение измеряемого параметра можно оценивать по среднему арифметическому результатов отдельных измерений при помощи доверительных интервалов.
___________________________
* Числом степеней свободы называется число наблюдений минус число оцененных по ним параметров.