- •Раздел 10. Элементы математической статистики
- •10.1. Основы математической статистики.
- •1. Основные задачи математической статистики
- •2. Первичная обработка статистических результатов
- •3. Полигон частот. Выборочная функция распределения и гистограмма
- •4. Статистическое описание и вычисление характеристик двумерного случайного вектора.
- •10.2 Оценки характеристик распределения по данным выборки
- •1. Точечные оценки параметров распределения
- •2. Способы построения оценок.
- •3. Доверительный интервал для оценки математического ожидания нормального распределения при известной дисперсии
- •4. Доверительный интервал для оценки математического ожидания нормального распределения при неизвестной дисперсии.
- •5. Доверительные интервалы для оценки среднего квадратического отклонения
- •10.3. Оценка статистических гипотез
- •1. Нулевая и конкурирующая гипотезы. Статистические критерии
- •2. Критерий для проверки гипотезы о вероятности события.
- •3. Критерий для проверки гипотезы о математическом ожидании.
- •4. Критерий для проверки гипотезы о сравнении двух дисперсий.
- •5. Критерий Пирсона.
- •6. Критерий Колмогорова.
- •Библиографический список
4. Статистическое описание и вычисление характеристик двумерного случайного вектора.
При статистическом исследовании
двумерных случайных величин основной
задачей является обычно выявление связи
между составляющими. Двумерная выборка
представляет собой набор значений
случайного вектора:
…,
Для нее можно определить выборочные
средние составляющих:
и соответствующие выборочные дисперсии
и средние квадратические отклонения.
Кроме того, можно вычислить так называемые
условные средние:
-
среднее арифметическое наблюдавшихся
значений Y, соответствующих
,
и
- среднее значение наблюдавшихся значений
Х, соответствующих
.
Если существует зависимость между составляющими двумерной случайной величины, то она может иметь вид функциональной зависимости, если каждому возможному значению Х соответствует одно значение Y, и статистической зависимости, при которой изменение одной величины приводит к изменению распределения другой. Если при этом в результате изменения одной величины меняется среднее значение другой, то статистическую зависимость между ними называют корреляционной.
10.2 Оценки характеристик распределения по данным выборки
1. Точечные оценки параметров распределения
Получив статистические оценки параметров распределения (выборочное среднее, выборочную дисперсию и т.д.), необходимо убедиться, что они в достаточной степени служат приближением соответствующих характеристик генеральной совокупности. Определим требования, которые должны при этом выполняться.
Пусть
- статистическая оценка неизвестного
параметра
теоретического распределения. Извлечем
из генеральной совокупности несколько
выборок одного и того же объема п и
вычислим для каждой из них оценку
параметра
:
Тогда оценку
можно рассматривать как случайную
величину, принимающую возможные значения
Если математическое ожидание
не равно оцениваемому параметру, будем
получать при вычислении оценок
систематические ошибки одного знака
(с избытком, если
и с недостатком, если
).
Следовательно, необходимым условием
отсутствия систематических ошибок
является требование
.
Определение. Статистическая оценка называется несмещенной, если ее математическое ожидание равно оцениваемому параметру при любом объеме выборки:
.
Смещенной называют оценку, математическое ожидание которой не равно оцениваемому параметру.
Несмещенность не является достаточным условием хорошего приближения к истинному значению оцениваемого параметра. Если при этом возможные значения могут значительно отклоняться от среднего значения, т.е. дисперсия велика, то значение, найденное по данным одной выборки, может значительно отличаться от оцениваемого параметра.
Определение. Статистическая оценка называется эффективной, если она при заданном объеме выборки п имеет наименьшую возможную дисперсию.
При рассмотрении выборок большого объема к статистическим оценкам предъявляется еще и требование состоятельности.
Определение. Статистическая
оценка называется состоятельной,
если она стремится по вероятности, при
,
к оцениваемому параметру (если эта
оценка несмещенная, то она будет
состоятельной, если при
ее дисперсия стремится к 0).
Докажем, что
представляет собой несмещенную оценку
математического ожидания
.
Будем рассматривать
как случайную величину, а значения
исследуемой случайной величины
,
составляющих выборку – как
независимые, одинаково распределенные
случайные величины
,
имеющие математическое ожидание
.
Из свойств математического ожидания
следует, что
так как каждая из величин имеет такое же распределение, что и генеральная совокупность. Что и требовалось доказать.
Выборочное среднее является не только несмещенной, но и состоятельной оценкой математического ожидания. Если предположить, что имеют ограниченные дисперсии, то из теоремы Чебышева следует, что их среднее арифметическое, т.е. , при увеличении п стремится по вероятности к математическому ожиданию каждой их величин, т.е. к . Следовательно, выборочное среднее есть состоятельная оценка математического ожидания.
В отличие от выборочного среднего, выборочная дисперсия является смещенной оценкой дисперсии генеральной совокупности. Можно доказать, что
,
где
– истинное значение дисперсии
генеральной совокупности. Существует
другая оценка дисперсии – исправленная
дисперсию
,
вычисляемая по формуле:
.
Такая оценка является несмещенной. Ей соответствует исправленное среднее квадратическое отклонение:
Определение. Оценка некоторого признака называется асимптотически несмещенной, если для выборки выполняется равенство:
,
где Х – истинное значение исследуемой величины.
