Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
2 курс. Лето. Теория вероятности. Щекунских. Шп....doc
Скачиваний:
30
Добавлен:
21.07.2019
Размер:
898.56 Кб
Скачать
  1. Статистическое распределение выборки. Эмпирическая функция распределения. Полигон и гистограмма.

Поскольку неизвестное распределение можно описать, например, его функцией распределения F, построим по выборке «приближение» для этой функции.

Определение 1. Эмпирической функцией распределения, построенной по выборке объема п называется случайная функция , при каждом «/el равная

Напоминание: функция

называется индикатором события {Xi < у}. Это — случайная величина, имеющая распределение Бер-нулли с параметромр = P(Xj < у) = F(y) (почему?).

Если элементы выборки Х\,..., Хп упорядочить по возрастанию (на каждом элементарном исходе), получится новый набор случайных величин, называемый вариационным рядом:

Здесь X(i) = min{Xi,..., Хп}, Х^ = max{Xi,..., Хп}. Элемент Х^, к = 1,..., п, называется к-м членом вариационного ряда или к-й порядковой статистикой.

Пример 1. Выборка, п = 15: X = (0; 2; 1; 2,6; 3,1; 4,6; 1; 4,6; 6; 2,6; 6; 7; 9; 9; 2,6). Вариационный ряд: (0; 1; 1; 2; 2,6; 2,6; 2,6; 3,1; 4,6; 4,6; 6; 6; 7; 9; 9).

Эмпирическая функция распределения имеет скачки в точках выборки, величина скачка в точке Х^ равна т/п, где т — количество элементов выборки, совпадающих с Xi.

Рис. 1: Пример 1 Можно изобразить эмпирическую функцию распределения так:

Другой характеристикой распределения является таблица (для дискретных распределений) или плот­ность (для абсолютно непрерывных). Эмпирическим, или выборочным аналогом таблицы или плотности является так называемая гистограмма. Гистограмма строится по группированным данным.

  1. Оценка параметров генеральной совокупности. Свойства оценок.

Основными параметрами генеральной совокупности являются математическое ожидание (генеральная средняя) М(Х) и среднее квадратическое отклонение  . Это постоянные величины, которые можно оценить по выборочным данным. Оценка генерального параметра, выражаемая одним числом, называется точечной.

Точечной оценкой генеральной средней  является выборочное среднее . Выборочным средним называется среднее арифметическое всех значений величины, встречающихся в выборке.

Если выборочное среднее вычисляется по несгруппированным данным, то для его определения сумму всех значений делят на количество элементов в выборке:

Пример: Вычислить среднее значение массы тела девочек 6 лет.

Если выборочное среднее вычисляется по вариационному ряду, то находят сумму произведений вариант на соответствующие частоты, и делят на количество элементов в выборке.

Пример: Вычислить среднее значение массы тела девочек 6 лет(ранжированный ряд – 22 23 23 24 24 25 25 25 26 27).

В том случае, когда статистические данные представлены в виде интервального вариационного ряда, при вычислении выборочного среднего значениями вариант считают середины интервалов.

Пример: вычислить среднее значение массы тела женщин 30 лет.

Выборочное среднее является основной характеристикой положения, показывает центр распределения совокупности, позволяет охарактеризовать исследуемую совокупность одним числом, проследить тенденцию развития, сравнить различные совокупности.

Непараметрическими характеристиками положения являются мода и медиана. Модой называется варианта, имеющая наибольшую частоту (для последнего примера мода равна 67,5).

Медианой называется варианта, расположенная в центре ранжированного ряда. Если ряд состоит из четного числа вариант, то медианой считают среднее арифметическое двух вариант, расположенных в центре ранжированного ряда.

Пример: найти моду и медиану выборочной совокупности по массе тела девочек 6 лет

Мо = 25; Ме = 24,5

1. Состоятельность. Точечная оценка В называется состоятельной, если при неограниченном увеличении объема выборки ( ) она стремится к истинному значению параметра .

В математической статистике показывается, что состоятельной оценкой генерального среднего значения , является выборочное среднее арифметическое , а состоятельной оценкой генеральной дисперсии  — выборочная дисперсия . Методы вычисления этих выборочных характеристик были рассмотрены в гл. 3.

2. Несмещенность. Оценка В называется несмещенной, если она не содержит систематической ошибки, т. е. среднее значение оценки, определенное по многократно повторенной выборке объема n из одной и той же генеральной совокупности, стремится к истинному значению соответствующего генерального параметра .

Выборочное среднее арифметическое  является несмещенной оценкой генерального среднего .

Несмещенной оценкой генеральной дисперсии  является исправленная выборочная дисперсия, вычисляемая по формуле:

 для несгруппированных данных,

 для сгруппированных данных,

 

Замечание 1

Одним из свойств выборочного среднего арифметического является то, что сумма квадратов отклонений значений признака от среднего арифметического меньше, чем сумма квадратов отклонений от любой другой величины (в том числе и от генерального среднего ), т.е.  для любой выборки. Поэтому вычисление оценки дисперсии по формуле  будет содержать систематическую ошибку, и такая оценка будет смещенной.

Можно показать, что если использовать , то она будет несмещенной, т.е. при неограниченном повторении выборки из генеральной совокупности и усреднении выборочной дисперсии, полученной на основании этой формулы, по всем выборкам получается истинное значение генеральной дисперсии.

3. Эффективность. Несмещенная оценка является эффективной, если она имеет наименьшую дисперсию по сравнению с другими несмещенными оценками того же параметра генеральной совокупности.

Это надо понимать так: полученные по выборке оценки  и S2 — случайные величины, так как случайны сами выборочные значения. Поэтому можно говорить о математическом ожидании и дисперсии оценок  и S2. Эффективность этих оценок означает, что их дисперсии D( ) и D(S2) меньше дисперсий любых других несмещенных оценок среднего значения и дисперсии генеральной совокупности.

Итак, наилучшими в указанном смысле оценками генерального среднего значения и генеральной дисперсии являются выборочные характеристики , .