Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

3645

.pdf
Скачиваний:
1
Добавлен:
08.01.2021
Размер:
612.17 Кб
Скачать

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ

УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ «ВОРОНЕЖСКИЙ ГОСУДАРСТВЕННЫЙ ЛЕСОТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ ИМЕНИ Г.Ф. МОРОЗОВА»

Кафедра вычислительной техники и информационных систем

Логика и методология науки

Методические указания к практическим занятиям для студентов по направлению подготовки 09.04.02 – Информационные системы и технологии

Воронеж 2016

1

УДК 004.43

Лапшина, М.Л. Логика и методология науки [Текст]: методические указания к практическим занятиям для студентов по направлению подготовки 09.04.02 – Информационные системы и технологии / М.Л. Лапшина; М-во образования и науки РФ, ФГБОУ ВО «ВГЛТУ им. Г.Ф. МОРОЗОВА». – Воронеж, 2016. – 21 с.

1

Рассматриваются следующие задачи:

1.Определение закона распределения случайной величины по статистическим данным

2.Критерии согласия эмпирического и теоретического законов распределения.

3.Оценка числовых характеристик и неизвестных параметров распределения.

1.Определение закона распределения случайной величины по статистическим данным

1.1.В разнообразных видах практической деятельности встречается такая задача. Наблюдается некоторая случайная величина X , закон распределения которой не известен. Требуется определить этот закон из опыта или проверить гипотезу о том, что эта случайная величина подчинена определенному закону распределения.

Врезультате наблюдений (эксперимента, исследований) имеем ряд значений случайной величины:

1

2

3

n

x1

x2

x3

 

xn

 

 

 

 

 

Такой ряд называется первичным (простым) рядом наблюдений или

выборкой значений случайной величины, при этом число наблюденных

значений n называется объемом (размером) выборки.

 

 

Для заданной

выборки может быть построена статистическая

(эмпирическая)

функция

 

распределения случайной величины

Х -

F (x) .

 

 

 

 

 

 

 

n

Значение функции F (x)

для каждого действительного числа x

полагается

 

n

 

 

 

 

 

 

равным частоте события X x в данной выборке:

 

 

 

F (x) P ( X x)

nx

,

 

(1)

 

 

 

 

 

n

 

n

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

где nx - число наблюдений в выборке, меньших x,

x .

 

 

 

1.2. Чтобы описать свойства статистической функции распределения

расположим наблюдения в порядке возрастания значений:

 

 

 

 

 

 

x(1) x(2)

x(3)

 

x(n)

 

 

 

 

 

 

Такой ряд

называется

вариационным

 

рядом.

Основные

свойства

 

F (x)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

следующие:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1) Функция F (x) не убывает:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

F (x ) F (x ) ,

 

для x x

 

 

 

 

 

 

 

n

1

 

 

 

 

 

n

2

 

 

 

1

2

 

 

 

 

 

2) Если x(k )

x(k 1) , то слева от любого

x

из промежутка x(k )

x x(k 1)

лежит

одно и то

же число наблюдений

(именно k ). Поэтому

функция

 

F (x)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

сохраняет постоянное значение

 

k

 

во всех точках этого промежутка, включая

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

точку x(k 1) :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

F (x)

k

 

,

 

для x

x x

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

n

 

 

 

 

(k )

(k 1)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В самой же точке x

функция

 

F

(x) совершает скачок на величину

 

n(k 1)

,

 

 

 

 

(k 1)

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где n(k 1) - число наблюдений в ряду, в точности равных x(k 1) .

 

 

 

 

3) Слева от наименьшего наблюденного значения, включая и само это

 

 

 

значение, функция F (x) равна 0:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

F (x) 0 ,

для

x x

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

(1)

 

 

 

 

 

 

4) Справа от наибольшего наблюденного значения функция F

(x) равна 1:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

F

(x) 1

, для

x x

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

(n)

 

 

 

 

 

 

Но самые важные свойства F (x)

следующие:

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5) Согласно закону больших чисел (теореме Бернулли) при каждом x

 

F (x)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

сходится к F (x) по вероятности:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для каждого x и каждого 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

) 0

 

 

 

 

 

 

 

 

lim P(

F (x) F(x)

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

6) Более того, с вероятностью единица имеет место равномерная по

x сходимость F (x) к

F (x) при n (теорема Гливенко):

 

0 с вероятностью 1,

sup

F* (x) F(x)

x

n

 

n

 

 

 

где значок sup означает точную верхнюю грань (максимальное значение)

модуля разности между Fn (x) и F (x) , а оговорка « с вероятностью 1»

означает, что для любой наблюденной последовательности значений случайной величины указанный предел будет равен 0.

Благодаря свойствам 5 и 6 построение эмпирической функции распределения решает в принципе задачу определения закона распределения случайной величины.

1.3. Рассмотрим построение функции Fn (x) на примере.

Задача 1.

10 раз повторяли серию из 100 подбрасываний монеты и подсчитывали число выпадений герба в каждой серии. Получили следующую выборку:

1

2

3

4

5

6

7

8

9

10

 

 

 

 

 

 

 

 

 

 

53

39

46

46

53

43

50

61

53

52

 

 

 

 

 

 

 

 

 

 

Требуется построить статистическую функцию распределения.

Решение.

Построим вариационный ряд наблюдений:

39 43 46 46 50 52 53 53 53 61

Составим таблицу (1):

В первый столбец последовательно выпишем различные значения вариационного ряда (zi ) ;

Во втором столбце для каждого значения укажем число повторений этого значения в выборке, так называемую абсолютную частоту (ni ) ;

4

 

В третьем столбце вычислим относительные частоты наблюдений,

т.е.

результат деления абсолютных частот на общее число наблюдений

p n / n ;

i

i

 

В четвертом столбце относительные частоты представим нарастающим

итогом, причем для первого значения укажем ноль. Это и есть значения

статистической функции распределения в каждой точке скачка F (z ) .

 

 

 

 

 

 

 

 

n i

 

 

 

Таблица (1) позволяет выписать формулы (1), определяющие

статистическую функцию распределения F (x) .

 

 

 

 

 

 

 

 

n

 

 

Таблица 1

 

 

 

 

 

zi

ni

 

pi

F (zi )

 

0

x 39

 

 

 

 

 

 

 

 

39 x 43

 

 

 

 

 

 

 

 

39

1

 

0,1

0

 

0,1

 

43

1

 

0,1

0,1

 

 

 

 

 

0, 2

43 x 46

 

46

2

 

0,2

0,2

 

 

46 x 50

 

 

 

 

 

 

 

0, 4

 

 

 

 

 

 

 

 

50

1

 

0,1

0,4

 

F (x)

50 x 52

(2)

52

1

 

0,1

0,5

 

0, 5

 

53

3

 

0,3

0,6

 

0, 6

52 x 53

 

 

 

 

 

 

 

 

 

 

61

1

 

0,1

0,9

 

53 x 61

 

 

 

0, 9

 

 

10

 

1

1

 

 

 

 

 

1

61 x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

График функции

F (x) приведен на рис.1. Он имеет вид ступенчатой

 

 

 

 

 

 

n

 

 

возрастающей функции, причем в каждой точке скачка функция непрерывна слева: на рисунке 1 значение 0,2 в точке 46 выделено жирной точкой, предел справа в это точке равен 0,4.

1,2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,9

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,2

 

 

 

 

 

 

 

 

 

 

 

 

 

0,2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

38

40

42

44

46

48

50

52

54

56

58

60

62

Рисунок 1

5

1.4 Статистическая функция распределения имеет ступенчатый характер как для дискретной, так и для непрерывной случайной величины.

Для дискретной случайной количество скачков будет сохраняться или медленно возрастать при увеличении числа наблюдений, а величины этих скачков будут стремиться к истинным вероятностям соответствующих значений.

Так в рассмотренном примере выборка размером 10 имела 9 скачков. Были смоделированы выборки объемом 50 и 100 наблюдений из данного распределения вероятностей. Для 50 получили 16 скачков, для 100 – 19

скачков. Но вообще-то в рассмотренном примере количество скачков может достигнуть 100.

Если количество различных значений дискретной случайной величины невелико, то построение функции Fn (x) можно выполнять описанным выше способом. На самом деле для дискретной случайной величины нужны статистические частоты наблюденных значений, т.е. статистический ряд распределения.

Для непрерывной случайной величины количество скачков будет мало отличаться от n , поэтому построение Fn (x) описанным способом в этом случае возможно лишь при небольшом объеме выборки. При больших n

построение Fn (x) описанным способом становится чрезвычайно трудоемким,

да и сама функция, содержащая сотни скачков, оказывается недостаточно наглядной. Эти проблемы устраняются путем преобразования первичного ряда наблюдений в так называемый группированный статистический ряд.

1.5. Группированный статистический ряд можно построить следующим способом.

Первичная выборка преобразуется в вариационный ряд. Далее определяется

размах выборки:

R x(n) x(1)

6

Определяется количество разрядов, интервалов, на которые будут разделены наблюденные значения. Количество таких интервалов, как правило, от 10 до 20. При этом желательно, чтобы эти интервалы были равной длины. Но иногда отдельные интервалы приходится объединять, если они содержат слишком мало значений. При высокой же частоте изменения значений X в некоторых областях исходные интервалы приходится разбивать на более мелкие интервалы.

Будем считать, что область значений случайной величины разбивается на k

разрядов длины h :

h Rk .

При вычислении h удобно округлить до одного-двух знаков после запятой в большую сторону, чтобы наблюдение x(n) попало внутрь

последнего разряда. Границы i - го разряда будем обозначать через ai и ai 1 .

Так что вся область изменения случайной величины разлагается в сумму k

непересекающихся разрядов:

 

 

 

[a1, a2 ),[a2 , a3 ),

[ak 2 , ak 1),[ak 1, ak ]

 

 

 

Далее подсчитываем количество наблюдений, попавших в i -ый

разрядов, так называемые абсолютные частоты - mi ,

относительные частоты

p m / n и накопленные частоты:

 

 

 

 

 

i

i

 

 

 

 

 

 

 

 

 

 

F (a ) 0, F (a ) F

(a ) p ,

F (a

) F (a ) p 1 .

 

n

1

n 2

n

1

1

n k 1

n

k

k

При

построении

графика

F (x)

полученные

значения

F (a ) соединяют

 

 

 

 

n

 

 

 

 

 

n i

отрезками прямой или плавной линией, что вполне оправдано, так как предельная функция F (x) является непрерывной.

1.5 Выполним описанный расчет на данных конкретной задачи.

Задача 2.

Дана выборка размера 100 из нормальной совокупности с математическим ожиданием 0 и дисперсией 1. Данные размещены по

7

столбцам в таблице (2). Построить статистическую функцию распределения

и сравнить ее с функцией стандартного нормального распределения.

Таблица 2

№ п/п

1

2

3

4

5

6

7

8

9

10

1

-0,1116

-2,0578 -0,6008

1,5535

-0,1615 -2,4063

0,5496

-0,4507

-2,2961

1,5484

32

-0,7394

-0,2984

1,3807

-1,0874

-0,4740

0,3993

0,6486

-0,1383

-0,7128 -0,8536

43

0,6354

0,6409

-0,6593

-0,6599

-0,9447

1,2911

-0,7125 -0,8667

-0,2884 -1,3493

54

-1,0073

0,7695

1,1176

1,2506

-0,2533 -0,5885

2,7876

0,6535

-1,2660

0,9677

65

-0,6055

-0,0093 -0,3430

-1,0980

1,8154

-0,6324

-0,3313

1,1891

-2,2253

0,2445

76

0,5294

0,9830

0,4903

-1,6584

-1,0040 -1,4356

0,2834

-1,4466

1,9075

-1,7894

87

1,2392

0,9453

-0,5459

0,0924

0,0470

-0,0108

-0,3276 -0,7358

1,4536

1,0812

98

1,8320

1,0247

-0,7933

-0,0492

-0,4918

0,4732

-0,1317 -0,2844

-0,3376 -0,1067

9

-1,5434

-0,7626 -0,2553

0,4369

0,6216

-0,7125

-0,7496 -1,4501

-0,7563 -0,0888

10

0,1474

-1,4730 -1,8222

0,8957

-0,5583 -0,3553

-1,0774

1,4407

-0,4736

0,1044

Решение.

Вычисления удобно выполнять в Excel. Там сгенерированные исходные данные располагаются в одном столбце. Их легко отсортировать по возрастанию и найти минимальное и максимальное значение, размах и длину разряда при числе разрядов, равном 10:

xmin

-2,4063

xmax

2,7876

R

5,1939

k

10

h

0,52

Теперь заполняем таблицу (3) группированного статистического ряда Таблица 3

i

a

 

m

F

(a )

(a )

D(a )

 

i

 

i

100

i

i

i

1

-2,4063

4

 

0,00

 

0,008057

0,008057

2

-1,8863

8

 

0,04

 

0,029625

0,010375

3

-1,3663

10

 

0,12

 

0,085916

0,034084

4

-0,8463

26

 

0,22

 

0,198681

0,021319

5

-0,3263

18

 

0,48

 

0,372083

0,107917

6

0,1937

13

 

0,66

 

0,576779

0,083221

7

0,7137

9

 

0,79

 

0,762281

0,027719

8

1,2337

8

 

0,88

 

0,891335

0,011335

9

1,7537

3

 

0,96

 

0,960256

0,000256

10

2,2737

1

 

0,99

 

0,988507

0,001493

11

2,7937

 

 

1,00

 

0,997394

0,002606

 

 

100

 

 

 

D

0,107917

Здесь использованы следующие обозначения:

i - номер разряда и его левой границы;

8

ai - значение левой границы разряда;

ni - число наблюдений, удовлетворяющих неравенству ai 1 xj ai ;

(x) - функция стандартного нормального распределения;

Di F100 (ai ) (ai ) ;

D max Di .

i

Подсчет чисел ni выполнен с помощью функции Excel СЧЁТ ЕСЛИ

(диапазон; условие). При большом n такой подсчет затруднительно сделать без компьютера.

На рисунке 2 показаны функции F100 (x) и (x) для сравнения. Видно достаточно хорошее соответствие. Более точное заключение сделаем несколько позже, когда будем рассматривать критерии согласия.

1.6. На практике часто группированный статистический ряд

представляют в виде графика гистограммы.

Чтобы построить гистограмму, нужно по оси абсцисс отложить границы разрядов, и на каждом разряде как на основании построить

прямоугольник с площадью, равной частоте разряда.

Для этого нужно частоту разряда разделить на длину разряда и полученное число взять в качестве высоты прямоугольника. Для i -го разряда получаем формулу:

y

 

p

 

i

 

,

 

 

 

h

 

i

 

 

 

 

 

 

 

 

 

 

 

где y - высота прямоугольника, а

p*

 

ni

- относительная частота i -го

 

i

 

i

 

 

n

 

 

 

 

 

разряда.

9

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]