
- •Раздел 3
- •1. Основные понятия
- •Генеральная и выборочная совокупность. Вариационный ряд
- •Эмпирическая функция распределения. Полигон. Гистограмма
- •1.3. Статистические оценки параметров распределения
- •Требования, которым должны удовлетворять оцениваемые параметры
- •2. Точечные и интервальные оценки
- •Доверительные интервалы для оценки математического ожидания нормального распределения при известном
- •Доверительные интервалы для оценки математического ожидания нормального распределения при неизвестном
- •Доверительные интервалы для оценки среднего квадратического отклонения нормального распределения
- •3. Статистические гипотезы
- •3.1. Основные понятия
- •Критическая область. Область принятия гипотез. Критические точки
- •Проверка гипотезы о нормальном распределении генеральной совокупности. Критерий согласия Пирсона
- •Правило проверки нулевой гипотезы
- •4. Элементы теории корреляции
- •Свойства коэффициента корреляции
- •5. Элементы дисперсионного анализа
2. Точечные и интервальные оценки
Выше были рассмотрены статистические оценки неизвестных параметров, которые определялись одним числом. Такие оценки получили название точечных.
Определение 2.1. Точечной называют оценку, которая определяетсяодним числом.
К ней относятся характеристики выборочной
совокупности (выборочная средняя
,
выборочная дисперсия
,
выборочное среднее квадратическое
отклонение
,
а также мода, медиана и др.), являющиеся
точечными оценками соответствующих
характеристик генеральной совокупности.
Ранее показали, что выборочная средняя является несмещенной и состоятельной оценкой. Выборочная дисперсия является смещенной оценкой. Поэтому в качестве оценки генеральной дисперсии принимают исправленную дисперсию, которая находится по следующей формуле:
.
При выборке малого объема точечная оценка отличается от оцениваемого параметра, что приводит к грубым ошибкам. По этой причине при небольшом объеме выборки следует использовать интервальные оценки.
Определение 2.2. Интервальной называют оценку, которая определяетсядвумя числами– концами интервала. Интервальные оценки позволяют установить точность и надежность оценок.
Пусть найденная по данным выборки,
статистическая характеристика
служит оценкой неизвестного параметра. Будем считатьпостоянным числом (может быть и случайной величиной). Ясно,
что
тем точнее определяет параметр,
чем меньше абсолютная величина разности
.
Другими словами, если
и
,
то чем меньше, тем
оценка точнее. Таким образом, положительное
числохарактеризуетточность оценки.
Однако статистические методы не позволяют
категорически утверждать, что оценка
удовлетворяет неравенству
;
можно лишь говорить о вероятности,
с которой это неравенство осуществляется.
Определение 2.3. Надежностью
(доверительной вероятностью)оценкипоназывают вероятность,
с которой осуществляется неравенство
.
Обычно надежность оценки задается наперед, причем в качестве берут число, близкое к единице. Наиболее часто задают надежность, равную 0,95; 0,99 и 0,999.
Пусть вероятность того, что
равна:
.
Если неравенство
заменить равносильным ему двойным
неравенством
,
или
,
Имеем
.
Это соотношение следует понимать так:
вероятность того, что интервал
заключает в себе (покрывает) неизвестный
параметр, равна.
Определение 2.4. Доверительнымназывают интервал,
который покрывает неизвестный параметр
с заданной надежностью.
Интервал
имеет случайные концы (их называют
доверительными границами). Действительно,
в разных выборках получаются различные
значения.
Следовательно, от выборки к выборке
будут изменяться и концы доверительного
интервала, т.е. доверительные границы
сами являются случайными величинами –
функциями от
.
Так как случайной величиной является
не оцениваемый параметр,
а доверительный интервал, то более
правильно говорить не о вероятности
попаданияв
доверительный интервал, а о вероятности
того, что доверительный интервал покроет.
Метод доверительных интервалов разработан американским статистиком Ю.Нейманом, исходя из идей английского статистика Р.Фишера.
Мы рассмотрим доверительные интервалы для оценки математического ожидания нормального распределения при известном и неизвестном; доверительные интервалы для оценки среднего квадратического отклонениянормального распределения.