
Статистическое распределение выборки
Пусть
из генеральной совокупности извлечена
выборка, причем
наблюдалось
раз,
–
раз,
–
раз и
– объем выборки. Наблюдаемые значения
называют вариантами,
а последовательность вариант, записанных
в возрастающем порядке – вариационным
рядом.
Числа наблюдений называют частотами,
а их отношения к объему выборки
– относительными
частотами.
Статистическим распределением выборки называют перечень вариант и соответствующих им частот или относительных частот. Статистическое распределение можно задать также в виде последовательности интервалом и соответствующих им частот (в качестве частоты, соответствующей интервалу, принимают сумму частот, попавших в этот интервал).
Заметим, что в теории вероятностей под распределением понимают соответствие между возможными значениями случайной величины и их вероятностями, а в математической статистике – соответствие между наблюдаемыми вариантами и их частотами, или относительными частотами.[5]
Пример.
Задано распределение частот выборки
объема
:
|
2 |
6 |
12 |
|
3 |
10 |
7 |
|
|
|
|
Написать распределение относительных частот.
Решение.
Найдем относительные частоты, для чего
разделим частоты на объем выборки:
,
,
.
Напишем распределение относительных частот:
|
2 |
6 |
12 |
|
0.15 |
0.5 |
0.35 |
Проверка:
.
[6]
Эмпирическая функция распределения
Пусть
известно статистическое распределение
частот количественного признака
.
Введем обозначения:
– число наблюдений, при которых
наблюдалось значение признака, меньшее
;
– общее число наблюдений (объем выборки).
Ясно, что относительная частота события
равна
.
Если
изменяется, то, вообще говоря, изменяется
и относительная частота, то есть
относительная частота
есть функция от
.
Так как эта функция находится эмпирическим
(опытным) путем, то ее называют эмпирической.
Эмпирической
функцией распределения
(функцией распределения выборки) называют
функцию
,
определяющую для каждого значения
относительную частоту события
.
[3]
Итак, по определению,
,
где
– число вариант, меньших
;
– объем выборки.
Таким
образом, для того, чтобы найти, например,
,
надо число вариант, меньших
,
разделить на объем выборки:
.
В
отличие от эмпирической функции
распределения выборки, функцию
распределения
генеральной совокупности, называют
теоретической
функцией распределения.
Различие между эмпирической и теоретической
функциями состоит в том, что теоретическая
функция
определяет вероятность события
,
а эмпирическая функция
определяет относительную частоту этого
же события. Из теоремы Бернулли следует,
что относительная частота события
,
то есть
,
стремится по вероятности, к вероятности
этого события. Другими словами, при
больших
,
числа
и
мало отличаются одно от другого, в том
смысле, что
,
.
Уже отсюда следует целесообразность
использования эмпирической функции
распределения выборки для приближенного
представления теоретической (интегральной)
функции распределения генеральной
совокупности. [3]
Такое
заключение подтверждается и тем, что
обладает всеми свойствами
.
Действительно, из определения функции
вытекают следующие свойства:
-
значения эмпирической функции принадлежат отрезку
;
-
– неубывающая функция;
-
если
– наименьшая варианта, то
при
; если
– наибольшая варианта, то
при
.
Итак, эмпирическая функция распределения выборки служит для оценки теоретической функции распределения генеральной совокупности.
Пример. Построить эмпирическую функцию по данному распределению выборки:
варианты
|
2 |
6 |
10 |
частоты
|
12 |
18 |
30 |
|
|
|
|
Решение.
Найдем объем выборки:
.
Наименьшая варианта равна 2, следовательно,
при
.
Значение
,
а именно
,
наблюдалось 12 раз, следовательно,
,
при
.
Значения
,
а именно
и
,
наблюдались
раз, следовательно
,
при
.
Так
как
– наибольшая варианта, то
при
.
Искомая
эмпирическая функция:
[6]