- •Бийский технологический институт (филиал)
- •Теория вероятностей и математическая статистика
- •Введение
- •События. Классификация событий. Классическое определение вероятности
- •Статистическое определение вероятности
- •Геометрическая вероятность
- •Контрольные вопросы
- •Контрольные задания
- •4. Операции над событиями. Соотношения между событиями
- •5.Теорема сложения вероятностей
- •6. Теорема умножения вероятностей
- •Контрольные вопросы
- •Контрольные задания
- •7. Формула полной вероятности
- •8. Теорема гипотез (формула Бейеса)
- •Контрольные вопросы
- •Контрольные задания
- •Литература
- •9. Повторение опытов. Формула Бернулли
- •10. Локальная формула Муавра-Лапласа. Формула Пуассона
- •11. Интегральная формула Муавра-Лапласа. Вероятность отклонения частоты события от его вероятности в n независимых испытаниях
- •Контрольные вопросы
- •Контрольные задания
- •Литература
- •12. Понятие случайной величины. Ряд распределения. Многоугольник распределения
- •13. Функция распределения. Вероятность попадания непрерывной случайной величины в заданный интервал
- •Контрольные вопросы
- •Контрольные задания
- •14. Плотность распределения
- •Контрольные вопросы
- •Контрольные задания
- •15. Числовые характеристики случайных величин. Математическое ожидание и его свойства
- •Свойства математического ожидания
- •16. Дисперсия и ее свойства. Среднее квадратическое отклонение
- •17. Моменты распределения случайной величины
- •Контрольные вопросы
- •Контрольные задания
- •18. Типы распределений дискретных случайных величин
- •Биномиальное распределение
- •18.2 Гипергеометрическое распределение
- •18.3 Геометрическое распределение
- •4. Распределение Пуассона
- •Контрольные вопросы
- •Контрольные задания
- •19. Типы распределений непрерывных случайных величин
- •19.1 Равномерное распределение
- •19.2 Показательное распределение
- •20. Нормальный закон распределения
- •21. Вероятность попадания нормально распределенной случайной величины в заданный интервал. Правило трёх сигма
- •Контрольные вопросы
- •Контрольные задания
- •Литература
- •22. Понятие системы случайных величин
- •23. Закон распределения вероятностей дискретной двумерной случайной величины
- •Контрольные вопросы
- •24. Функция распределения двух случайных величин. Вероятность попадания случайной величины в полуполосу и прямоугольник
- •25. Плотность распределения системы двух случайных величин. Законы распределения отдельных величин, входящих в систему
- •26. Условные законы распределения
- •Контрольные вопросы
- •27. Зависимые и независимые случайные величины
- •28. Числовые характеристики составляющих системы двух случайных величин. Условное математическое ожидание
- •29. Корреляционный момент. Коэффициент корреляции
- •30. Коррелированность и зависимость случайных величин
- •Если величины независимы, то они некоррелированы.
- •31. Линейная регрессия. Прямые линии среднеквадратической регрессии
- •Контрольные вопросы
- •Контрольные задания
- •Литература
- •32. Закон больших чисел
- •33. Центральная предельная теорема
- •Контрольные вопросы
- •Контрольные задания
- •Литература
- •Математическая статистика
- •34. Понятие о выборочном методе. Генеральная и выборочная совокупность
- •35. Статистические данные и их представление
- •36. Статистические аналоги теоретических законов распределения
- •36.1 Эмпирическая функция распределения
- •36.2 Полигон и гистограмма
- •Контрольные вопросы
- •Контрольные задания
- •Литература
- •37. Точечное оценивание параметров распределения
- •38. Свойства статистических оценок
- •Контрольные вопросы
- •Контрольные задания
- •39. Интервальное оценивание параметров распределения
- •40. Интервальное оценивание параметров нормального распределения
- •40.1 Интервальная оценка математического ожидания нормального распределения при известной дисперсии
- •40.2 Интервальная оценка математического ожидания нормального распределения при неизвестной дисперсии
- •Контрольные вопросы
- •Контрольные задания
- •Литература
- •41. Статистические гипотезы
- •42. Критерии проверки гипотез
- •Контрольные вопросы
- •Контрольные задания
- •43.Критерий согласия Пирсона «Хи-квадрат» ( )
- •Контрольные вопросы
- •Контрольные задания
- •Литература
- •44. Элементы теории корреляции. Задачи корреляционного анализа
- •45. Выбор формы зависимости между переменными. Метод наименьших квадратов
- •Контрольные вопросы
- •46. Коэффициент корреляции и проверка его значимости. Линейная регрессия и прогноз
- •Контрольные вопросы
- •Контрольные задания
- •Литература
- •Глоссарий
38. Свойства статистических оценок
Для оценки одного
и того же параметра
можно построить, исходя из выборки
различные оценки. Например, чтобы оценить
математическое ожидание
,
можно рассматривать либо среднее
арифметическое из выборочных данных,
либо полусумму наибольшего и наименьшего
наблюдений, либо какую-нибудь другую
функцию от выборки. В связи с этим
возникает вопрос о требованиях, которые
следует предъявлять к оценкам параметров
распределения, чтобы они были в каком-то
определенном смысле наилучшими. Эти
требования выражаются следующими
свойствами оценок: несмещенностью,
состоятельностью и эффективностью.
Всякая оценка
неизвестного параметра
по выборке является функцией
от выборочных данных
.
Величины
можно рассматривать как случайные
величины. Поэтому и оценка
является случайной величиной. В этой
связи, можно говорить о распределении
и числовых характеристиках как выборочных
данных, так и оценок.
Поскольку наблюдения над случайным признаком Х предполагаются независимыми, то их результаты , рассматриваемые как случайные величины, будут независимыми и одинаково распределенными со случайной величиной Х. Все числовые характеристики случайных величин и Х совпадают. В частности,
,
.
Оценка параметра называется несмещенной, если математическое ожидание оценки совпадает с оцениваемым параметром :
.
В противном случае
оценка называется смещенной. Условие
несмещенности также называют условием
отсутствия систематических ошибок
, и его смысл состоит в том, что при
многократном использовании вместо
параметра
его оценки
среднее значение приближения
равно нулю.
Если оценка является смещенной, то, вычислив ее математическое ожидание и введя поправочный коэффициент, можно получить несмещенную оценку.
Докажем, что
несмещенной
оценкой генеральной (теоретической)
средней является выборочная средняя
.
В самом деле, в силу свойств математического ожидания
.
Теперь рассмотрим выборочную дисперсию
Таким образом,
где
.
Так как
(i
= 1, 2, …, k)
и
,
то по свойствам математического ожидания
и дисперсии получаем
.
В силу независимости
и равенства
имеем
.
Подставляя выражение
для
в выражение для
,
получаем
.
Таким образом,
выборочная дисперсия является смещенной
оценкой для теоретической (генеральной)
дисперсии
.
Несмещенной
оценкой теоретической дисперсии
является величина
,
называемая исправленной выборочной дисперсией.
Докажем, что если известна генеральная средняя а, то несмещенной оценкой теоретической дисперсии является величина
.
В самом деле, используя свойства математического ожидания, определение дисперсии, равенства и , получим
.
Оценка параметра называется состоятельной, если с ростом объема выборки n она сходится по вероятности к оцениваемому параметру :
при любом сколь
угодно малом
.
Имеют место следующие факты:
Выборочная средняя является состоятельной оценкой теоретической средней , поскольку согласно закону больших чисел среднее арифметическое n независимых одинаково распределенных случайных величин сходится по вероятности при
к их общему математическому ожиданию
:
;
При известной теоретической средней выборочная дисперсия является состоятельной оценкой теоретической дисперсии . Действительно, согласно закону больших чисел, среднее арифметическое n независимых одинаково распределенных случайных величин
сходится по вероятности при
к их общему математическому ожиданию
:
;
Требование состоятельности оценки является по существу минимальным требованием, которое обычно предъявляется к оценкам. Условие состоятельности представляется необходимым для того, чтобы оценка имела практический смысл, так как в противном случае увеличение объема исходной информации не будет приближать нас к оцениваемой величине.
Представим себе,
что мы имеем две несмещенные и состоятельные
оценки
и
неизвестного
параметра
.
Разумеется, мы хотели бы выбрать ту из
них, которая ближе к параметру
.
Поскольку величины
и
случайные, то не приходится говорить
об обычной мере «близости»
и
к
:
случайные величины
и
характеризуются множеством возможных
значений. Для того, чтобы оценка
была возможна ближе к параметру
,
необходимо, чтобы разброс значений
величины
около
был возможно меньшим. Наиболее удобной
и распространенной мерой разброса
служит математическое ожидание
,
совпадающая для несмещенных оценок
(для которых
)
с дисперсией
.
Оценка
параметра
называется более
эффективной,
чем
,
если
.
Для несмещенных оценок
и
последнее неравенство перепишется в
виде
.
В силу сказанного выше наилучшей оценкой
параметра
среди всех несмещенных оценок является
та из них, которая обладает минимальной
дисперсией. Такая оценка называется
эффективной.
