
- •1. Генеральная совокупность и выборка, вариационный ряд, полигон частот, гистограмма, эмпирическая функция распределения.
- •2. Числовые характеристики выборочного распределения.
- •3. Понятие об оценке параметров. Характеристики оценок.
- •4. Методы нахождения оценок: метод моментов, метод максимального правдоподобия, метод наименьших квадратов.
- •5. Понятие об интервальной оценке параметров. Доверительная вероятность и доверительный интервал.
- •6. Понятие и общая схема проверки статистической гипотезы.
- •7. Проверка гипотез о равенстве средних двух совокупностей.
- •8. Проверка гипотез об однородности выборок.
- •9. Линейная парная регрессия. Коэффициент корреляции.
- •10. Проверка гипотез о зависимости переменных.
- •11. Однофакторный дисперсионный анализ.
3. Понятие об оценке параметров. Характеристики оценок.
Ответ:
Сформулируем задачу оценки параметров в общем виде.
Пусть распределение признака Х - генеральной совокупности - задается функцией вероятности
f(x, θ) = P(X=xi) для дискретной случайной величины или плотностью вероятностей для непрерывной случайной величины, которая содержит неизвестный параметр θ.
Для вычисления параметра θ используют выборку x1, x2, ..., xn, каждая из которых имеет один и тот же закон распределения, что и признак Х.
Оценкой θn параметра θ называют всякую функцию результатов наблюдений (иначе - статистику), с помощью которой делают вывод о значении параметра θ:
θn = θn(x1, x2, ..., xn).
Так как x1, x2, ..., xn - случайные величины, то и оценка θn является случайной величиной, которая зависит от закона распределения и объема выборки n. Оцениваемый параметр θ является постоянной величиной.
Так как θn - случайная величина, то невозможно предсказать индивидуальное значение оценки в данном частном случае. Поэтому о качестве оценки следует судить не по ее индивидуальным значениям, а по распределению ее значений при достаточно большом числе испытаний, т. е. по выборочному распределению оценки.
Оценка θn параметра θ называется несмещенной, если ее математическое ожидание равно оцениваемому параметру, т. е.
M(θn) = θ.
В противном случае оценка называется смещенной. Если это равенство не выполняется, то оценка θn, полученная по разным выборкам, будет либо завышать θ, если M(θn) > θ, либо занижать его, если M(θn) < θ. Таким образом, требование несмещенности гарантирует отсутствие систематических ошибок при оценивании.
Оценка θn параметра θ называется состоятельной, если она удовлетворяет закону больших чисел, т. е. сходится по вероятности к оцениваемому параметру
Если оценка состоятельна, то практически достоверно, что при достаточно большом n θn ≈ θ.
Несмещенная
оценка θn параметра θ является
эффективной, если она имеет
наименьшую дисперсию среди всех возможных
несмещенных оценок параметра θ,
вычисленных по выборкам одного и того
же объема n. Так как для несмещенной
оценки M(θn – θ)2
есть дисперсия
,
то эффективность является решающим
свойством, определяющим качество оценки.
Для
матожидания несмещенной оценкой,
полученной по выборке, является среднее
арифметическое
.
Для
дисперсии σ 2 оценкой, полученной
по выборке, является S 2.
Для устранения смещения в оценке
дисперсии достаточно оценку S 2
домножить на
,
тогда несмещенной оценкой генеральной
дисперсии будет выборочная дисперсия:
Коэффициент особенно важен для выборок малого объема.
Для случайной величины Х, распределенной по нормальному закону, среднее арифметическое является несмещенной, состоятельной и эффективной оценкой для математического ожидания.
Однако на практике не всегда оценки удовлетворяют всем трем требованиям. Может оказаться, что даже если эффективная оценка существует, то формулы для ее вычисления оказываются слишком сложными, и тогда используют оценку, дисперсия которой несколько больше. Иногда, в интересах простоты расчетов, применяются незначительно смещенные оценки. Выбору оценки всегда должно предшествовать ее критическое рассмотрение.