
- •Содержание
- •Введение
- •Глава 3. Элементы математической статистики
- •3.1. Выборочный метод
- •3.1.1 Задачи и методы математической статистики
- •3.1.2 Виды выборки
- •3.2. Графическое представление эмпирических данных
- •3.2.1. Эмпирическая функция распределения. Кумулята
- •3.2.2 Полигон и гистограмма
- •3.3. Числовые характеристики вариационного ряда
- •3.4. Статистические оценки параметров распределения
- •3.4.2 Точечные оценки параметров распределения
- •3.4.3. Метод моментов
- •3.4.4 Метод наибольшего (максимального) правдоподобия
- •3.5. Интервальные оценки параметров распределения
- •3.5.1 Доверительная вероятность. Доверительные интервалы
- •3.5.2 Доверительный интервал для оценки математического ожидания нормального распределения при известном среднем квадратическом отклонении
- •3.5.3 Доверительные интервалы для оценки математического ожидания нормального распределения при неизвестном среднем квадратическом отклонении
- •3.5.4 Доверительный интервал для дисперсии и среднего квадратического отклонения
- •3.5.5 Доверительный интервал для вероятности успеха в схеме Бернулли
- •3.6. Статистическая проверка статистических гипотез
- •3.6.1 Статистические гипотезы. Основные понятия
3.4. Статистические оценки параметров распределения
Виды статистических оценок. Основные требования к точечным оценкам
Пусть некоторая генеральная совокупность исследуется по выборке
{X1,
X2,…,Xn}.
При исследовании генеральной совокупности
по различным выборкам, случайно отобранным
из генеральной совокупности, можно
получить лишь приближенные значения
неизвестного параметра ,
которые служат его оценкой.
Так, анализ дохода (X)
населения нашего города можно осуществить
на основе выборки ограниченного объема,
например, при n=1000.
Тогда числовые характеристики выборки
– средний доход и разброс в доходах для
лиц, попавших в выборку, можно оценить
по формулам соответственно
и
.
Однако неизвестно, можно ли полученные
результаты обобщить и представить как
характеристики дохода жителей всего
города. Очевидно, что значение оценок
могут изменяться о выборки к выборке.
Обозначим через
точечную статистическую оценку некоторого
параметра
теоретического распределения.
Статистической оценкой неизвестного параметра теоретического распределения называется функция f(x, ) от наблюдаемых случайных величин выборки. Задача статистического оценивания неизвестных параметров по выборке заключается в построении такой функции от имеющихся данных статистических наблюдений, которая давала бы наиболее точные приближенные значения истинных неизвестных исследователю значений этих параметров.
Статистическая оценка параметров генеральной совокупности (теоретического распределения) как совокупность методов, позволяющих делать научно обоснованные выводы о значениях числовых параметров генеральной совокупности по случайной выборке из нее, – одна из главных задач математической статистики.
Статистические оценки делятся на точечные и интервальные в зависимости от способа их представления (соответственно, числом или интервалом).
Так,
для нормального закона распределения
с плотностью вероятности
параметрами служат математическое
ожиданиеm
и среднее квадратическое отклонение
σ,
а для равномерно распределенной
генеральной совокупности с плотностью
вероятности
параметрами служат концы интервалаa
и b.
Точечной
называют статистическую оценку параметра
теоретического распределения, определяемую
одним
значением параметра =f(x1,..,хn),
где x1,...,хn
– результаты эмпирических наблюдений
над количественным признаком X
некоторой
выборки. Такие оценки параметров этой
совокупности, полученные по различным
выборкам, чаще всего отличаются друг
от друга. Абсолютную разность
называютошибкой
выборки
(оценивания).
Для того, чтобы статистические оценки давали достоверные представления об оцениваемых параметрах, необходимо выполнение ряда условий (свойств): достоверная оценка статистического параметра должна быть несмещенной, эффективной и состоятельной.
Точечная
оценка, математическое ожидание которой
оцениваемому параметру, называется
.
Т.о., несмещенной называют такую статистическую оценку * параметра , для которой M*=.
Разность M*– называется смещением или систематической ошибкой оценивания. Для несмещенных оценок систематическая ошибка равна нулю.
Эффективной называют такую статистическую оценку *, которая при заданном объеме выборки n имеет наименьшую возможную дисперсию: D[*]|n=constmin. Эффективная оценка имеет наименьший разброс по сравнению с другими несмещенными и состоятельными оценками.
Состоятельной называют такую статистическую оценку * параметра, которая при n стремится по вероятности к оцениваемому параметру , т.е. при увеличении объема выборки n оценка стремится по вероятности к истинному значению неизвестного параметра .
Выполнение условия состоятельности гарантирует отсутствие грубых ошибок в оценке при достаточно больших n.
На практике не всегда удается выполнить все эти требования и получить оценку параметра, вызывающую доверие. Напомним, что стремление по вероятности означает выполнение равенства: при любом >0
.
Это требование согласуется с законом больших чисел: чем больше исходной информации об исследуемом объекте, тем точнее результат свойства состоятельности, проверяемый в первую очередь.
Однако если объем выборки мал, то точечная оценка параметра может привести к серьезным ошибкам.
Наиболее распространенными методами статистического оценивания неизвестных параметров теоретического распределения являются метод моментов (3.4.3), метод максимального правдоподобия (3.4.4) и метод наименьших квадратов.