Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Основы математики и ее приложения в экономическом образовании_Красс М.С., Чупрынов Б.П_2001 -688с.doc
Скачиваний:
1528
Добавлен:
23.03.2016
Размер:
12.97 Mб
Скачать

Эмпирическая функция распределения

Пусть nх число наблюдений, при которых значение при­знака Х меньше х. При объеме выборки, равном п, относитель­ная частота события Х < х равна nx/n.

Определение 8. Функция

определяющая для каждого значения х относительную частоту события Х < х, называется эмпирической функцией распреде­ления, или функцией распределения выборки.

В отличие от эмпирической функции распределения F*(x) выборки функция распределения F(x) генеральной совокупнос­ти называется теоретической функцией распределения. Раз­личие между ними состоит в том, что функция F(x) опреде­ляет вероятность события Х < х, a F*(x) — относительную частоту этого события. Из теоретических результатов общей теории вероятностей (закон больших чисел) следует, что при больших п вероятность отличия этих функций друг от друга близка к единице:

Нетрудно видеть, что F*(x) обладает всеми свойствами F(x), что вытекает из ее определения (18.49):

1) значения F*(x) принадлежат отрезку [0, 1];

2) F*(x) является неубывающей функцией;

3) если х1 наименьшая варианта, то F*(x) = 0 при хх1; если xk — максимальная варианта, то F*(x) = 1 при x > xk.

Сама же функция F*(x) служит для оценки теоретической функции распределения F(x) генеральной совокупности.

Пример 3. Построить эмпирическую функцию по заданному распределению выборки:

Решение. Находим объем выборки: п = 10 + 15 + 25 = 50. Наименьшая варианта равна 2, поэтому F*(x) = 0 при х ≤ 2. Значение Х < 4 (или x1 = 2) наблюдалось 10 раз, значит, F*(x) = 10/50 = 0,2 при 2 < х < 4. Значения X < 6 (а именно x1 = 2 и x2 = 4) наблюдались 10 + 15 = 25 раз, значит, при 4 < х < 6 функция F*(x) = 25/50 = 0,5. Поскольку x = 6 — максимальная варианта, то F*(x) = 1 при х > 6. Напишем формулу искомой эмпирической функции:

График этой функции показан на рис. 18.8.

Полигон и гистограмма

Каждую пару значений (xi, ni) из распределения выборки можно трактовать как точку на координатной плоскости. Точ­но так же можно рассматривать и пары значений i, Wi) отно­сительного распределения выборки. Ломаная, отрезки которой соединяют точки (xi, ni), называется полигоном частот. Ло­маная, соединяющая на координатной плоскости точки (xi, Wi), называется полигоном относительных частот. На рис. 18.9 показан полигон относительных частот для распределения, приведенного в примере 2.

Для случая непрерывного признака Х удобно разбить ин­тервал (xmin, xmax) его наблюдаемых значений на несколько частичных интервалов длиной h каждый и найти для каждого из этих интервалов сумму частот nj, попавших в него. Ступен­чатая фигура, состоящая из прямоугольников с основаниями длиной h и высотами nj/h (плотность частоты), называется гистограммой частот. Геометрический смысл гистограммы: нетрудно видеть, что площадь ее равна сумме всех частот или объему выборки. На рис. 18.10 изображена гистограмма объ­ема n = 100.

Аналогичным образом определяется и гистограмма от­носительных частот: в этом случае высоты прямоугольни­ков, составляющих ступенчатую фигуру, определяются отно­шениями сумм относительных частот, попадающих в интервал (xmin + (j 1)h, xmin + jh), к длине интервала h, т.е. величина­ми Wj/h. Нетрудно видеть, что площадь гистограммы относи­тельных частот равна единице (сумме относительных частот выборки).