
- •Оглавление
- •Предисловие
- •Задачи математической статистики
- •Генеральная и выборочная совокупности
- •Статистическое распределение выборки
- •Графическое изображение статистического распределения выборки
- •Эмпирическая функция распределения
- •Числовые характеристики статистического распределения выборки
- •Точечные оценки параметров распределения
- •Свойства статистических оценок
- •Доверительные интервалы
- •Доверительный интервал для математического ожидания нормально распределенной генеральной совокупности при известном среднем квадратическом отклонении
- •Доверительный интервал для математического ожидания нормально распределенной генеральной совокупности при неизвестном среднем квадратическом отклонении
- •Понятие о проверке статистических гипотез о законе распределения генеральной совокупности
- •Корреляционная зависимость. Выборочный коэффициент корреляции. Линейная корреляция. Выборочное линейное уравнение регрессии
- •Сборник задач по курсу «Теория вероятностей и математическая статистика»
- •Примерный список вопросов для подготовки к зачету
- •Список литературы (обязательной и дополнительной) Основная литература
- •Дополнительная литература
- •Справочные издания
- •Интернет-ресурсы
- •Электронные издания
- •Словарь терминов
Графическое изображение статистического распределения выборки
Для большей наглядности статистическое распределение выборки обычно изображают в виде так называемых полигона и гистограммы. Полигон часто (или относительных частот) строят в основном для дискретного статистического ряда. Пусть дано статистическое распределение выборки для частот или относительных частот:
xi |
x1 |
x2 |
… |
xk |
ni |
n1 |
n2 |
… |
nk |
xi |
x1 |
x2 |
… |
xk |
wi |
w1 |
w2 |
… |
wk |
Полигоном частот называется ломаная, соединяющая точки с координатами (x1, n1), (x2, n2), … ,(xk, nk). При этом варианты х1, х2, … , хk откладываются на оси абсцисс, а частоты n1, n2, … , nk на оси ординат.
Полигоном относительных частот называется ломаная, соединяющая точки с координатами (x1, w1), (x2, w2), … ,(xk, wk).
Для непрерывных с.в. , статистическое распределение выборки которых представлено в виде интервального статистического ряда
xi |
[a0,a1) |
[a1,a2) |
… |
[ak−1,ak] |
ni |
n1 |
n2 |
… |
nk |
xi |
[a0,a1) |
[a1,a2) |
… |
[ak−1,ak] |
wi |
w1 |
w2 |
… |
wk |
тоже можно строить
полигоны частот и относительных частот,
если в качестве чисел х1,
… , хk
взять середины интервалов:
,
… ,
.
Но для интервальных статистических
рядов более употребительна так называемая
гистограмма.
Пусть дан интервальный
статистический ряд для некоторой
выборки. Гистограммой
частот (относительных частот)
называется ступенчатая фигура, состоящая
из прямоугольников, в основании которых
лежат числовые отрезки длины h
: [a0
, a1),
[a1
, a2),
… , [ak-2
, ak−1),
[ak−1
, аk],
а высоты равны
(
)
. Отметим, что площади таких прямоугольников
равны соответствующим частотам
(относительным частотам), а площадь всей
фигуры равна объему выборкиn
(равна 1)
. Ступенчатая линия, образованная
верхними основаниями прямоугольников
в гистограмме для относительных частот,
является приближением графика плотности
вероятности рассматриваемой н.с.в. Х.
Пример. Построить полигон и гистограмму относительных частот по статистическому распределению выборки :
xi |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
ni |
4 |
13 |
14 |
24 |
16 |
3 |
3 |
2 |
Решение. По данному
статистическому ряду частот строим
статистический ряд относительных
частот. Для это складываем все частоты
и получаем, что объем данной выборки
n=79.
Далее, деля частоты на объем выборки в
соответствии с формулой
,
вычисляем значения относительных частот
и оформляем таблицей статистический
ряд относительных частот:
xi |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
wi= ni /n |
0.0506 |
0.1646 |
0.1772 |
0.3038 |
0.2025 |
0.0380 |
0.0380 |
0.0253 |
Теперь строим требуемую гистограмму и полигон по описанным выше правилам (рисунки).
Эмпирическая функция распределения
В теории вероятностей универсальной характеристикой случайной величины Х (дискретной и непрерывной) являлась ее функция распределения F(x). Напомним, что для любого числа х эта функция выражала вероятность того, что с.в. Х примет значение, меньшее этого числа Х (т.е. примет значение из интервала (−∞,х) ) : F(x)=Р(X<x). Как по выборке найти приближение к F(x)? Из статистического определения вероятности следует, что при большом числе испытаний n вероятность события приближенно равна его частоте. Пусть nx обозначает число испытаний (из их общего количества n), в которых с.в. Х приняла значение, меньшее х. Тогда относительная частота события (X<x) в этих n испытаниях по определению Wn(X<x)= nx /n . Поэтому получаем, что F(x)=Р(X<x) ≈ Wn(X<x)= nx /n . Таким образом, функция распределения F(x) ≈ nx /n.
Из сказанного
понятно введение следующего определения.
Эмпирической функцией распределения
(для данной выборки объема n)
называется функция, обозначаемая
и определяющая для каждого числах
относительную частоту события (X<x)
в проведенных при получении выборки
испытаниях:
,
где nx обозначает число испытаний (из их общего количества n), в которых с.в. Х приняла значение, меньшее х. Если построено статистическое распределение выборки для частот или относительных частот:
xi |
x1 |
x2 |
… |
xk |
ni |
n1 |
n2 |
… |
nk |
xi |
x1 |
x2 |
… |
xk |
wi |
w1 |
w2 |
… |
wk |
то можно конструктивно
построить эмпирическую функцию
распределения
.
Для заданного значениях
определяем интервал, в который попало
это значение: (−∞,х1]
или (х1,
х2]
или (х2,
х3]
или …. или (xk,
+∞) . Если х
попадает в первый из этих интервалов,
то, очевидно, nx=0,
а потому и
.
Еслих
попадает в последний из этих интервалов,
то, очевидно, nx=n1+n2+
… +nk=n,
а потому
.
Если жех
попадает в (хm
, хm+1]
, то, очевидно, nx=n1+n2+
… +nm
, а потому
.
Выпишем получившийся общий вид
эмпирической функции распределения:
Из сказанного выше
следует, что эмпирическая функция
распределения
является
приближением истинной (или, говорят,
теоретической) функции распределенияF(x)
исследуемой случайной величины Х
:
≈
F(x).
Строгим обоснованием этого факта служит
одна из теорем так называемого закона
больших чисел.
Теорема.
Функция
сходится к функцииF(x)
по вероятности.
Это означает, что для любого
(или, что то же самое,
)
.
Пример. Пользуясь статистическим рядом относительных частот для выборки объема n=10 :
xi |
0 |
1 |
2 |
3 |
4 |
5 |
wi |
0.1 |
0.2 |
0.1 |
0.1 |
0.2 |
0.3 |
найти эмпирическую функцию распределения и построить ее график.
Решение. Пользуясь указанным выше общим видом эмпирической функции распределения, получаем:
Ниже приведен график этой функции.