Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
1_18_19_22_25_24.docx
Скачиваний:
4
Добавлен:
24.09.2019
Размер:
75.93 Кб
Скачать

22. Эмпирическая функция распределения

Поскольку неизвестное распределение   можно описать, например, его функцией распределения  , построим по выборке «оценку» для этой функции.

Определение 1.  

Эмпирической функцией распределения, построенной по выборке   объема  , называется случайная функция  , при каждом   равная

Напоминание:    Случайная функция

называется индикатором события  . При каждом   это — случайная величина, имеющая распределение Бернулли с параметром  .  почему? 

Иначе говоря, при любом   значение  , равное истинной вероятности случайной величине   быть меньше  , оценивается долей элементов выборки, меньших  .

Если элементы выборки  ,   упорядочить по возрастанию (на каждом элементарном исходе), получится новый набор случайных величин, называемый вариационным рядом:

Здесь

Элемент  , называется  -м членом вариационного ряда или  -й порядковой статистикой.

25И 24 выборочное среднее и выборочная дисперсия

Иногда исследователь ставит перед собой более конкретную проблему: как, основываясь на выборке, оценить интересующие его числовые характеристики неизвестного распределения, не прибегая к приближению этого распределения как такового, то есть без построения выборочных функций распределения, гистограмм и т.п.

В данном параграфе мы обсудим простые (но, как увидим в дальнейшем, весьма хорошие) выборочные аппроксимации для математического ожидания и дисперсии. Замечательно то, что они применимы в очень общей ситуации. Мы будем предполагать, что независимая выборка   взята из неизвестного распределения, у которого существует математическое ожидание и дисперсия (обозначим эти неизвестные значения через   и   соответственно).

Определение 6.2  

Величины, вычисляемые по выборке,

(29)

и

(30)

называются выборочным средним и выборочной дисперсией.

Следует особо подчеркнуть, что определенные выше величины зависят только от выборки. Следующее предложение объясняет, почему естественно считать   выборочным аналогом математического ожидания, а   -- выборочным аналогом дисперсии.

Предложение 6.1  

Математические ожидания   и   совпадают с оцениваемыми неизвестными величинами:

(31)

Дисперсия   стремится к нулю при росте объема выборки.

Доказательство.

Используя линейность математического ожидания, получим

Так как выборка независимая, то  . Следовательно,  при  .

Покажем теперь, что  . Первое замечание состоит в том, что   не зависит от сдвига всех элементов выборки на одну и ту же константу, то есть, значения выражения (30) для выборок   и   одинаковы. Поэтому без ограничения общности мы будем считать, что  . При этом предположении

Теперь, проводя очевидные преобразования и применяя свойства математического ожидания, легко получаем необходимое утверждение 

 

 

 

 

(32)

 

Это утверждение свидетельствует о том, что   и   являются ``качественными приближениями'' для неизвестных величин   и  . Свойство (31) называетсянесмещенностью. Тот факт, что дисперсия   исчезает с увеличением объема выборки дает основание для вывода о том, что, чем больше данных измерений мы возьмем для статистической обработки, тем точнее будут наши выводы.

Замечание 6.4  

Для оценивания дисперсии по выборке может быть использована также функция

Формально ее можно получить, заменив в определении дисперсии  оператор математического ожидания средним арифметическим. Ясно, что величина   в отличие от   является смещенной:  . Хотя для больших выборок эта смещенность не очень существенна.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]