Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
МЕТОДИЧКА ПО ОЭД исп 5.04.12doc.doc
Скачиваний:
4
Добавлен:
01.04.2025
Размер:
934.4 Кб
Скачать

1.2 Построение эмпирических функций распределения и плотности на примере

Пример: Дана выборка n=20 (Таблица 1.1). Построить графики эмпирических функций распределения и плотности.

Таблица 1.1 – Таблица значений выборки

№ значения выборки

Значения выборки (х)

№ значения выборки

Значения выборки (х)

1

9,81

11

6,72

2

2,34

12

5,15

3

6,55

13

0,34

4

0,15

14

2,23

5

8,63

15

4,85

6

7,11

16

5,01

7

1,57

17

4,15

8

2,34

18

1,11

9

5,55

19

2,48

10

0,99

20

4,44

  1. Представим выборку в виде вариационного ряда, где Cn ≤ Cn+1:

Таблица 1.2 – Таблица значений выборки в виде вариационного ряда

№ значения выборки

Значения выборки (х)

№ значения выборки

Значения выборки (х)

1

0,15

11

4,44

2

0,34

12

4,85

3

0,99

13

5,01

4

1,11

14

5,15

5

1,57

15

5,55

6

2,23

16

6,55

7

2,34

17

6,72

8

2,34

18

7,11

9

2,48

19

8,63

10

4,15

20

9,81

  1. Используя значения выборки, построим группированный ряд наблюдений.

    1. Определим min и max значения выборки:

хmin = 0,15 хmax = 9,81

2.2 Разобьем весь диапазон [хmin, хmax] на k равных интервалов, где количество интервалов рассчитывается по формуле (1.1). Результат округляем до ближайшего целого числа.

, (1.1)

где n – число элементов в выборке.

Получаем:

    1. Определим ширину интервала по формуле (1.2). Результат вычисления округляем до ближайшего целого.

, (1.2)

где хmin – минимальное значение выборки;

хmax – максимальное значение выборки;

k – количество интервалов.

Получаем:

    1. Определим крайние точки каждого интервала C0, C1, C2…, при этом можно пользоваться различными способами, например:

  1. если C0 = хmin, тогда:

C1= хmin+∆ C2= хmin+2·∆ и т.д.

2) если C0= хmin - ∆/2, получаем:

C0= хmin - ∆/2 C1= C0+∆ C2= C1+∆ и т. д.

  1. по формуле (1.3) находим середину интервала [хmin, хmax]

(1.3)

Затем от точки С откладываем в обе стороны значение, равное величине ∆.

Воспользуемся первым способом и определим крайние точки каждого интервала:

C0= хmin= 0,15

C1= хmin+∆ = 0,15+2 = 2,15

C2= хmin+2·∆ = 0,15+2·2 = 4,15

C3= хmin+3·∆ = 0,15+3·2 = 6,15

C4= хmin+4·∆ = 0,15+4·2 = 8,15

C5= хmin+5·∆ = 0,15+5·2 = 10,15

C6= хmin+6·∆ = 0,15+6·2 = 12,15

    1. Зная крайние точки каждого интервала, определим их середину по формуле (1.4)

, (1.4)

где n – номер интервала.

Получаем:

    1. Определим частоту для каждого интервала (число выборочных данных попавших в каждый из интервалов).

Так как значения могут совпадать с границами интервалов, условимся в каждый k-ый интервал включать наблюдения большие или равные, чем нижняя граница интервала и меньше верхней границы, т,е. Ck-1 ≤ х < Ck.

Общее число наблюдений, отнесённое к k-му интервалу равно частоте νk данного интервала. Причём сумма частот всех интервалов ( ) не должна превышать общего числа элементов в выборке.

Накопленная частота для каждого интервала равна сумме частот (k – 1) и k интервалов.

Подсчитаем частоту и накопленную частоту для каждого интервала. Все расчеты сведем в таблицу 1.3.

Таблица 1.3 – Расчет частот для каждого интервала

k

(Ck, - Ck+1)

1

(0,15 – 2,15)

1.15

5

5

2

(2,15 – 4,15)

3.15

4

9

3

(4,15 – 6,15)

5.15

6

15

4

(6,15 – 8,15)

7.15

3

18

5

(8,15 – 10,15)

9.15

2

20

6

(10,15 – 12,15)

11.15

0

20

2.7 Вычислим эмпирический аналог функции плотности для каждого из интервалов (Ck,Ck+1) по формуле (1.5)

, (1.5)

где - ширина интервала,

n - число элементов в выборке,

- частота k интервала.

Для нашего примера:

  1. Вычислим эмпирическую функцию распределения для каждого из интервалов (Ck, Ck+1) по формуле (1.6).

, (1.6)

где - накопленная частота k интервала

Для нашего случая:

  1. Для дальнейшего удобства построения гистограммы и для всеобщей наглядности сведём все полученные нами ранее расчеты в сводную таблицу (Таблица 1.4)

Таблица 1.4 – Сводная таблица полученных данных

k

(Ck - Ck+1)

1

(0,15 – 2,15)

1,15

5

5

0,125

0,25

2

(2,15 – 4,15)

3,15

4

9

0,1

0,45

3

(4,15 – 6,15)

5,15

6

15

0,15

0,75

4

(6,15 – 8,15)

7,15

3

18

0,075

0,9

5

(8,15 – 10,15)

9,15

2

20

0,05

1

6

(10,15 – 12,15)

11,15

0

20

-

1

  1. Для построения гистограммы (рисунок 1.1) на оси абсцисс откладываем крайние точки каждого из интервалов C0, C1, C2…, а по оси ординат – эмпирический аналог функции плотности , тогда k-му интервалу будет соответствовать прямоугольник, основанием которого является замкнутый слева интервал [ Сk-1,Ck), а высота равна .

Если на верхних гранях полученных прямоугольных областей отложить точку середины каждого интервала и соединить полученные точки, то получим ломаную линию называемую полигоном.

  1. Геометрическое представление эмпирической функции распределения называют кумулятивной прямой или кумулятой.

Для этого на оси абсцисс откладывают границы интервалов C0, C1, C2…, а по оси ординат – значения функции распределения . Причём, значение функции распределения относят к верхней Ck границе k-ого интервала (рисунок 1.2).

Рисунок 1.1 – Гистограмма и полигон распределения признака

Рисунок 1.2 – Эмпирическая функция распределения