Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Конспект лекций по ТВМС.doc
Скачиваний:
119
Добавлен:
23.04.2019
Размер:
5.02 Mб
Скачать

Лекция 13. Понятие о статистических оценках случайных величин Эмпирическая функция распределения

Пусть известно статистическое распределение частот количественного признака X. Обозначим через число наблюдений, при которых наблюдалось значение признака, меньшее x и через n – общее число наблюдений. Очевидно, относительная частота события X < x равна и является функцией x. Так как эта функция находится эмпирическим (опытным) путем, то ее называют эмпирической.

Эмпирической функцией распределения (функцией распределения выборки) называют функцию , определяющую для каждого значения x относительную частоту события X < x. Таким образом, по определению

,

где - число вариант, меньших x, n – объем выборки.

В отличие от эмпирической функции распределения выборки, функцию распределения генеральной совокупности называют теоретической функцией распределения. Различие между этими функциями состоит в том, что теоретическая функция определяет вероятность события X < x, тогда как эмпирическая – относительную частоту этого же события.

При росте n относительная частота события X < x, т.е. стремится по вероятности к вероятности этого события. Иными словами

Свойства эмпирической функции распределения:

  1. Значения эмпирической функции принадлежат отрезку [0,1]

  2. - неубывающая функция

  3. Если - наименьшая варианта, то = 0 при , если - наибольшая варианта, то =1 при .

Эмпирическая функция распределения выборки служит для оценки теоретической функции распределения генеральной совокупности.

Пример. Построим эмпирическую функцию по распределению выборки:

Варианты

2

6

10

Частоты

12

18

30

Найдем объем выборки: 12+18+30=60. Наименьшая варианта равна 2, поэтому =0 при x  2. Значение x<6, т.е. , наблюдалось 12 раз, следовательно, =12/60=0,2 при 2< x 6. Аналогично, значения X < 10, т.е. и наблюдались 12+18=30 раз, поэтому =30/60 =0,5 при 6< x 10. Так как x=10 – наибольшая варианта, то =1 при x> 10. таким образом, искомая эмпирическая функция имеет вид:

Важнейшие свойства статистических оценок

Пусть требуется изучить некоторый количественный признак генеральной совокупности. Допустим, что из теоретических соображений удалось установить, какое именно распределение имеет признак и необходимо оценить параметры, которыми оно определяется. Например, если изучаемый признак распределен в генеральной совокупности нормально, то нужно оценить математическое ожидание и среднее квадратическое отклонение; если признак имеет распределение Пуассона – то необходимо оценить параметр .

Обычно имеются лишь данные выборки, например значения количественного признака , полученные в результате n независимых наблюдений. Рассматривая как независимые случайные величины можно сказать, что найти статистическую оценку неизвестного параметра теоретического распределения – значит найти функцию от наблюдаемых случайных величин, которая дает приближенное значение оцениваемого параметра. Например, для оценки математического ожидания нормального распределения роль функции выполняет среднее арифметическое

Для того чтобы статистические оценки давали корректные приближения оцениваемых параметров, они должны удовлетворять некоторым требованиям, среди которых важнейшими являются требования несмещенности и состоятельности оценки.

Пусть - статистическая оценка неизвестного параметра теоретического распределения. Пусть по выборке объема n найдена оценка . Повторим опыт, т.е. извлечем из генеральной совокупности другую выборку того же объема и по ее данным получим другую оценку . Повторяя опыт многократно, получим различные числа . Оценку можно рассматривать как случайную величину, а числа - как ее возможные значения.

Если оценка дает приближенное значение с избытком, т.е. каждое число больше истинного значения то, как следствие, математическое ожидание (среднее значение) случайной величины больше, чем :

.

Аналогично, если дает оценку с недостатком, то .

Таким образом, использование статистической оценки, математическое ожидание которой не равно оцениваемому параметру, привело бы к систематическим (одного знака) ошибкам. Если, напротив, , то это гарантирует от систематических ошибок.

Несмещенной называют статистическую оценку , математическое ожидание которой равно оцениваемому параметру при любом объеме выборки

.

Смещенной называют оценку, не удовлетворяющую этому условию.

Несмещенность оценки еще не гарантирует получения хорошего приближения для оцениваемого параметра, так как возможные значения могут быть сильно рассеяны вокруг своего среднего значения, т.е. дисперсия может быть значительной. В этом случае найденная по данным одной выборки оценка, например , может оказаться значительно удаленной от среднего значения , а значит, и от самого оцениваемого параметра.

Эффективной называют статистическую оценку, которая, при заданном объеме выборки n, имеет наименьшую возможную дисперсию.

При рассмотрении выборок большого объема к статистическим оценкам предъявляется требование состоятельности.

Состоятельной называется статистическая оценка, которая при n стремится по вероятности к оцениваемому параметру. Например, если дисперсия несмещенной оценки при n стремится к нулю, то такая оценка оказывается и состоятельной.

Выборочные среднее и дисперсия

Пусть для изучения генеральной совокупности относительно количественного признака X извлечена выборка объема n.

Выборочным средним называют среднее арифметическое значение признака выборочной совокупности. Если все значения признака выборки объема n различны, то

.

Если значения признака имеют частоты соответственно, причем , то

.

Выборочное среднее, найденное по данным одной выборки, равно определенному числу. При извлечении других выборок того же объема выборочное среднее будет меняться от выборки к выборке. То есть выборочное среднее можно рассматривать как случайную величину и говорить о его распределениях (теоретическом и эмпирическом) и о числовых характеристиках этого распределения (например, о математическом ожидании и дисперсии).

Для охарактеризования рассеяния наблюдаемых значений количественного признака выборки вокруг среднего значения вводится выборочная дисперсия. Выборочной дисперсией называют среднее арифметическое квадратов отклонения наблюдаемых значений признака от их среднего значения . Если все значения признака выборки объема n различны, то

.

Если значения признака имеют частоты соответственно, причем , то

.

Аналогично выборочным среднему и дисперсии определяются генеральные среднее и дисперсия, характеризующие генеральную совокупность в целом. Для расчета этих характеристик достаточно в вышеприведенных соотношениях заменить объем выборки n на объем генеральной совокупности N.

Фундаментальное значение для практики имеет нахождение среднего и дисперсии признака генеральной совокупности по соответствующим известным выборочным параметрам. Можно показать, что выборочное среднее является несмещенной состоятельной оценкой генерального среднего. В то же время, несмещенной состоятельной оценкой генеральной дисперсии оказывается не выборочная дисперсия , а так называемая “исправленнаявыборочная дисперсия, равная

.

Таким образом, в качестве оценок генерального среднего и дисперсии в математической статистике принимают выборочнее среднее и исправленную выборочную дисперсию.