Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
МАТ.СТАТИСТ.1.doc
Скачиваний:
171
Добавлен:
07.11.2018
Размер:
2.75 Mб
Скачать

1. 2. Полигон частот. Выборочная функция распределения и гистограмма

Для наглядного представления о поведении исследуемой случайной величины в выборке можно строить различные графики. Один из них – полигон частот: ломаная, отрезки которой соединяют точки с координатами (x1, n1), (x2, n2),…, (xk, nk), где xi откладываются на оси абсцисс, а ni – на оси ординат. Если на оси ординат откладывать не абсолютные (ni), а относительные (wi) частоты, то получим полигон относительных частот (рис.1). Рис. 1.

В теории вероятностей для характеристики распределения случайной величины служит функция распределения

,

равная вероятности события , где – любое действительное число.

Одной из основных характеристик выборки является выборочная (эмпирическая) функция распределения

,

где – количество элементов выборки, меньших чем . Другими словами, есть относительная частота появления события в независимых испытаниях. Главное различие между и состоит в том, что определяет вероятность события , а выборочная функция распределения – относительную частоту этого события.

Из определения имеем следующие свойства функции :

1. .

2.– неубывающая функция.

3.

Напоминаем, что такими же свойствами обладает и функция распределения (вспомните эти свойства и сравните).

Функция является "ступенчатой", имеются разрывы в точках, которым соответствуют наблюдаемые значения вариантов. Величина скачка равна относительной частоте варианта.

Аналитически задается следующим соотношением:

где – соответствующие относительные частоты; – элементы вариационного ряда (варианты).

Замечание. В случае интервального вариационного ряда под понимается середина i-го частичного интервала.

Перед вычислением полезно построить дискретный или интервальный вариационный ряд.

Пример. Построить выборочную функцию распределения по наблюдаемым данным, приведенным в примере 2.1.

Решение. Используя соответствующий этим данным дискретный вариационный ряд (см. табл. 2.1), вычислим значения и занесем их в табл. 2.3.

Таблица 2.3

x

x  1

0

0 < x  1

1 < x  2

2 < x  3

3 < x  4

4 < x  5

5 < x  7

x > 7

Из графика (рис. 2.1) видно, что удовлетворяет свойствам функции .

Напомним, что равна относительной частоте появления события и, следовательно, при любом значении величина является случайной. Тогда конкретной выборке объема соответствует функция распределения , которая в силу своей случайности будет отличаться от , построенной по другой выборке из той же генеральной совокупности.

Рис. 2.1. График выборочной функции распределения (пример 2.4)

По аналогии с функцией распределения случайной величины можно задать некоторую функцию, относительную частоту события X < x.

В качестве оценки плотности распределения вероятности непрерывной случайной величины используют гистограмму относительных частот.

Гистограммой относительных частот называется система прямоугольников, каждый из которых основанием имеет i-й интервал интервального вариационного ряда; площадь, равную относительной частоте , а высота определяется по формуле

,

где – длина i-го частичного интервала. Если длина частичных интервалов одинакова, то .

Очевидно, что сумма площадей всех прямоугольников равна 1.

График плотности распределения генеральной совокупности проходит вблизи верхних границ прямоугольников, образующих гистограмму. Поэтому при больших объемах выборок и удачном выборе длины частичных интервалов гистограмма напоминает график плотности распределения .

Пример 2.5. Построим гистограмму относительных частот выборочной совокупности из примера 2.3.

Решение. Используя интервальный вариационный ряд (см. табл. 2.2), находим высоты по формуле . График построенной гистограммы приведен на рис. 2.2. Здесь же штриховой линией отмечен предполагаемый график неизвестной плотности .

0.10

0.05

Рис. 2.2. График гистограммы частностей (пример 2.5)

Для непрерывного признака графической иллюстрацией служит гистограмма, то есть ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат частичные интервалы длиной h, а высотами отрезки длиной ni /h (гистограмма частот) или wi /h (гистограмма относительных частот). В первом случае площадь гистограммы равна объему выборки, во втором –

единице. Рис.2.

Пример. Дана выборка, вариационный ряд которой имеет вид:

10,8; 11,1; 11,7; 12,2; 13,1; 13,4; 13,9; 14,3; 14,3; 14,4; 14,8; 16,5; 17,7; 18,2; 19,9; 20,0; 20,3; 20,8; 23,1; 24,2; 25,1; 25,1; 25,7; 28,4; 28,5; 29,3; 29,8; 29,9; 30,2; 30,4.

Составить статистический ряд распределения абсолютных и относительных частот, состоящий из пяти интервалов, и построить гистограмму относительных частот.

Объем выборки п = 30. Выберем в качестве границ интервала а = 10,5 и b = 30,5. Тогда и (a, b) разбивается на части (10,5; 14,5), (14,5; 18,5), (18,5; 22,5), (22,5; 26,5) и (26,5; 30,5). Статистический ряд при этом имеет вид:

Номер интервала

Границы

интервала

Абсолютные

частоты

Относительные

частоты

1

10,5; 14,5

10

2

14,5; 18,5

4

3

18,5; 22,5

4

4

22,5; 26,5

5

5

26,5; 30,5

7

Построим гистограмму:

x

Пример. Выборочно обследовано 26 предприятий лёгкой промышленности по валовой продукции. Получены следующие результаты в млн. руб.: 15,0; 16,4; 17,8; 18,0; 18,4; 19,2; 19,8; 20,2; 20,6; 20,6; 20,6; 21,3; 21,4; 21,7; 22,0; 22,2; 22,3; 22,7; 23,0; 24,2; 24,2; 25,1; 25,3; 26,0; 26,5; 27,1. Составить интервальное распределение выборки с началом х1=15 и длинами частичных интервалов h=2,5. Построить гистограмму частот.

Для составления интервального распределения составим таблицу. В первой строке расположим в порядке возрастания интервалы, длина каждого из которых h=2,5. Во второй строке запишем количество значений признака в выборке, попавших в этот интервал (т.е. сумму частот вариант, попавших в соответствующий интервал). Интервальный статистический ряд таков:

(xi, xi+1)

15–17,5

17,5–20

20–22,5

22,5–25

25–27,5

ni

2

5

10

4

5

Объем выборки n=2+5+10+4+5=26. Для построения гистограммы частот на оси абсцисс откладываем частичные интервалы; на каждом из них строим прямоугольники высотой

10/2,5

5/2,5

2/2,5

хi – xi+1

15 17,5 20 22,5 25 27,5

Площадь каждого прямоугольника равна частоте интервала, на котором он построен. Сумма площадей этих прямоугольников равна объёму выборки. ◄

Вопросы для самопроверки

1. Что понимается под генеральной сово­купностью?

2. Что такое выборка, размах выборки, объем выборки? Как обеспечивается представительность ее?

3. Объясните, как получают повторную и бесповторную выборки?

4. Что называют ошибкой репрезентативности?

5. Что такое частота появления варианты в выборке?

6. Как получают относительную частоту варианты в выборке?

7. Объясните, как получают вариационный ряд, статистический ряд распределения.

8. Что мы называем функцией распределения и статистической функцией распределения?

Какими свойствами обладает статистическая функция распределения?

9. Дайте определение группированного статистического ряда. Как строится гистограмма?

10. Что такое гамма-функция?

11. Запишите формулы плотности распределения для нормального, и распределения Стьюдента.

12. Как выполняется чертеж многоугольника распределения относительных частот?

13. Как выполняется чертеж гистограммы распределения плотности относи­тельных частот?