Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Толи лекции, толи шпоры.doc
Скачиваний:
65
Добавлен:
20.05.2014
Размер:
1.39 Mб
Скачать

Критерий факторизации.

Теорема.

Для того чтобы статистикаявлялась достаточной статистикой для семейства, необходимо и достаточно, чтобы существовали измеримые по первой координате, неотрицательные функцииитакие, что почти наверное

,

где функция зависит, а функцияне зависит от.

Доказательство.

Доказательство теоремы проведем лишь для случая, когда все меры семейства дискретны.

Необходимость.

Пусть - достаточная статистика. Тогда для любого множества

т.к. в сумме полишь один член отличен от нуля (тот, для которого). Следовательно,

является плотностьюотносительно мерыи очевидно, имеет вид

Достаточность.

Пусть, тогда

не зависит от , следовательно- достаточная статистика.

Полная достаточная статистика

Определение.

Достаточная статистика называется полной, если из выполнения для некоторой действительной функцииусловия

следует, что

почти наверное для всех мериз семейства.

Выборка и эмпирическая мера

Содержательные выводы о семействе по статистическим данным можно сделать, только если данные содержат в себе достаточно информации о. Идея последовательного накопления данных оприводит к понятиювыборки.

Пусть - измеримое пространство,- некоторое семейство вероятностных мер на.

Рассмотрим - кратное произведение измеримых пространстви семейство

вероятностных мер на нем. При фиксированном , с точки зрения теории вероятностей, данная вероятностная модель описывает последовательностьнезависимых одинаковых опытов, каждый из которых представляет собой независимое повторение исходного опыта. С точки зрения математической статистики данная модель описывает ситуацию, когда априорно известно, что исходные данные

представляют собой независимые наблюдения одного и того же случайного объекта с неизвестным распределением . Такие исходные данные называютсявыборкой(иногда, для определенности, добавляют «из генеральной совокупности с распределением»). Заметим, что в случаеполучаем исходную статистическую модель. Значениеназывают размером или объемом выборки. Будем в дальнейшем обозначатьпространство выборок.

Если семейство параметрическое, то будем в дальнейшем обозначать- плотность распределения одного наблюдения,- меру в исходном пространстве относительно которой считается плотность.

Если данные представляют собой выборку, то нетрудно построить разумную оценку неизвестной вероятности .

Определение.

Эмпирической мерой называется случайная величина

Эмпирическая мера обладает следующими свойствами

  1. Для любого фиксированного набора данных она является вероятностной мерой по. Действительно, эта мера есть среднее арифметическое вырожденных в точкахвероятностных мер.

  2. Среднее значение данной меры для любого , вычисленное в предположении, что неизвестная мера равна, равноЭто следует из соотношения

  3. для любой меры. Это свойство является следствием закона больших чисел в форме Хинчина.

Со статистической точки зрения свойство 2) означает, что эмпирическая мера оценивает неизвестную меру в среднем точно, а свойство 3) – что точность оценки с увеличением размера выборки возрастает.

Свойство 2) называют несмещенностью, а 3) – состоятельностью оценки

«Идея подстановки».

Если - некоторая характеристика распределения данных, например, математическое ожидание некоторой функции от данных, то кажется разумным выбрать в качестве оценки длявеличину(подставитьв). Эта идея реализована в дальнейшем в методе подстановки.