- •Математическая статистика
- •1. Статистическая модель и задачи математической статистики
- •2. Способы представления статистических данных.
- •3. Эмпирическая функция распределения и ее свойства.
- •4. Гистограмма и полигон частот.
- •5. Выборочные (эмпирические) числовые характеристики
- •6. Оценивание неизвестных параметров распределений
- •6.1. Точечные оценки неизвестных параметров распределений и требования, предъявляемые к ним
- •Несмещенность
- •Состоятельность
- •6.2. Свойства выборочного среднего и выборочной дисперсии
- •6.3. Методы нахождения точечных оценок
- •6.3.1. Метод моментов
- •6.3.2. Метод максимального правдоподобия
2. Способы представления статистических данных.
Пусть - выборка объема n из генеральной совокупности, имеющей функцию распределения . Она является исходной информацией для статистического анализа и принятия решений.
В зависимости от дальнейших целей существует несколько способов представления статистических данных. Простейший из них - в виде статистического ряда:
-
Номер наблюдения
1 2 …
Результат наблюдения
…
Если среди выборочных значений имеются совпадающие, то статистический ряд удобнее записывать в виде таблицы, называемой таблицей частот:
-
Выборочные значения
…
Частоты
…
Относительные частоты
…
где
- различные значения среди
;
- частота значения
;
- относительная частота значения
.
Очевидно,
что
.
Поэтому совокупность
пар
называют эмпирическим
законом распределения.
Выборочные значения , упорядоченные по возрастанию, носят название вариационного ряда:
,
где
,
.
Такая форма представления выборочных
значений оказывается особенно полезной
при графических иллюстрациях. Часто
упорядоченность выборочных значений
предполагается по умолчанию.
Величина
называется размахом
выборки.
Способом представления статистических данных, позволяющим делать выводы о неизвестном распределении наблюдаемой случайной величины , является эмпирическая функция распределения.
3. Эмпирическая функция распределения и ее свойства.
Пусть - выборка объема n из генеральной совокупности, имеющей функцию распределения .
Эмпирической функцией распределения, соответствующей выборке , называется функция
,
где
- индикатор множества
,
а
- число выборочных значений, не
превосходящих
.
Неизвестную функцию распределения наблюдаемой случайной величины при этом называют теоретической функцией распределения.
Для
заданной выборки
эмпирическая функция распределения
определена на всей числовой прямой и
обладает всеми свойствами обычной
функции распределения:
для
любого
;является функцией неубывающей;
является функцией непрерывной слева;
является кусочно-постоянной функцией и возрастает только в точках, являющихся значениями случайной величины , причем:
если
все значения
различны, то
при
,
,
;
если
- различные
значения среди
,
то
,
где
-
частота значения
,
.
График
эмпирической функции распределения
в общем случае имеет в
ид:
Другими
словами, эмпирическая функция распределения
является функцией распределения
выборочной дискретной случайной величины
,
имеющей закон распределения:
|
|
|
… |
|
|
|
|
… |
|
Принципиальное отличие эмпирической функции распределения от обычной функции распределения состоит в том, что она может изменяться от выборки к выборке, являясь при любом фиксированном х реализацией случайной функции
,
где - копии случайной величины .
Важнейшим
свойством эмпирической функции
распределения
,
как случайной функции, является то, что
она для любого
при увеличении объема выборки
сближается (в смысле сходимости по
вероятности) с теоретической функцией
распределения
.
Теорема
1.
Пусть
- эмпирическая функция распределения,
соответствующая выборке из генеральной
совокупности, имеющей теоретическую
функцию распределения
.
Тогда для любого
.
▲ Рассмотрим
случайную величину
и обозначим
(при фиксированном
x).
Случайные величины
принимают два значения 0 и 1 с вероятностями
и
,
соответственно. Поскольку все случайные
величины
- копии наблюдаемой случайной величины
,
то
.
При этом
,
.
Следовательно,
последовательность независимых одинаково
распределенных случайных величин
подчиняется закону больших чисел, то
есть
■.
Таким образом, при больших n эмпирическая функция распределения в каждой точке х может служить приближенным значением (оценкой) неизвестной теоретической функции распределения в этой точке. Эмпирическую функцию распределения при этом также называют статистическим аналогом неизвестной функции распределения .
Справедлив и следующий гораздо более сильный результат, принадлежащий В.И. Гливенко (1933г.).
Теорема 2. (без доказательства). В условиях теоремы 1
Утверждение теоремы 2 означает, что отклонение
эмпирической функции распределения на всей числовой прямой с вероятностью 1 будет сколь угодно мало при достаточно большом объеме выборки.
Приведем
еще один результат, принадлежащий А.Н.
Колмогорову (1933г.), который позволяет
для больших n
оценивать
вероятности заданных отклонений
случайной величины
от
нуля.
Теорема
3
(без доказательства).
Если теоретическая функция распределения
непрерывна, то для любого фиксированного
.
При
этом предельную функцию
можно с хорошим приближением использовать
для практических расчетов уже при
.
Функция
является функцией распределения, если
положить
при
и называется функцией Колмогорова. Она
играет большую роль в математической
статистике, значения функции
табулированы.
