Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Эконометрика, лекции

.pdf
Скачиваний:
64
Добавлен:
01.06.2015
Размер:
1.34 Mб
Скачать

Generated by Foxit PDF Creator © Foxit Software

http://www.foxitsoftware.com For evaluation only.

б) Практически достоверно, что рост мужчин данной возрастной группы заключен в гра-

ницах от а – 3σ = 173 – 3 6 = 155 см до а + 3σ = 173 + 3 6 = 191см.

 

 

3. Распределение 2

 

2

(или распределение

Пирсона) имеет сумма квадратов n независимых СВ

 

 

 

n

Zi (0,1)

(имеющих стандартное нормальное распределение): 2

Zi2 .

 

 

 

i 1

Стандартная нормально распределенная СВ Z 2 (1) .

 

Число степеней свободы СВ 2 равно n .

 

Число степеней свободы

равно числу СВ, её составляющих, уменьшенному на число

линейных связей между ними. 2

определяется одним числом n – числом степеней свобо-

ды ( 2 n2 ).

График плотности вероятности СВ, имеющей 2 - распределение лежит только в первой координатной четверти и имеет асимметричный вид с вытянутым правым «хвостом». Однако с увеличением числа степеней свободы распределение 2 приближается к нормальному.

f(x)

Распределение 2 применяется для нахождения

1

интервальных оценок и проверки статистиче-

 

ских гипотез. При этом используется таблица

6

критических точек 2 - распределения.

 

10

 

 

 

 

 

 

 

x

 

 

 

 

4. Распределение Стьюдента(t – распределение)

Пусть СВ Z (0,1) , СВ 2 - независимая от Z величина, имеющая распределение 2 .

Тогда величина

T

 

 

Z

 

 

имеет распределение Стьюдента (t – распределение) с n сте-

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

пенями свободы (записывают T ~ Tn ).

Распределение Стьюдента определяется только одним параметром n – числом степеней свободы.

f(t)

n

n 5

t

График функции плотности вероятности распределения Стьюдента имеет симметричный относительно оси ординат колоколообразный вид.

При увеличении числа степеней свободы распределение приближается к стандартизированному нормальному. При n 30распределение Стьюдента практически можно заменить нормальным распределением. t – распределение применяется для нахождения интервальных оценок, а также при проверке статистических гипотез. При этом используется таблица критических точек распределения Стьюдента.

11

Generated by Foxit PDF Creator © Foxit Software

http://www.foxitsoftware.com For evaluation only.

5. Распределение Фишера (F – распределение)

Пусть V и W – независимые СВ, имеющие2 - распределение (V ~ m2 , W ~ n2 ).

 

V

Тогда СВ

F

m

W

n

имеет распределение Фишера (F – распреде-

ление) со степенями свободы m и n (записывают F~ F(m;n) .

Оно определяется двумя параметрами m и

n.

При больших m и n оно приближается к нормальному. А также Тn2 F(1;n) .

f(F)

m 1,n 1

m 6,n 60

m 10,n 10

F

 

 

 

 

Таблица критических значений t-критерия Стьюдента

 

 

 

 

 

 

( число степеней свободы)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

v

Уровень значимости-

v

Уровень значимости-

 

 

0,1

0,05

 

0,01

0,001

 

0,1

0,05

0,01

0,001

 

 

1

6,314

12,71

 

63,657

636,62

23

1,714

2,069

2,807

3,768

 

 

2

2,920

4,303

 

9,925

31,599

24

1,711

2,064

2,797

3,745

 

 

3

2,353

3,182

 

5,841

12,924

25

1,708

2,060

2,787

3,725

 

 

4

2,132

2,776

 

4,604

8,610

26

1,706

2,056

2,779

3,707

 

 

5

2,015

2,571

 

4,032

6,869

27

1,703

2,052

2,771

3,690

 

 

6

1,943

2,447

 

3,707

5,959

28

1,701

2,048

2,763

3,674

 

 

7

1,895

2,365

 

3,499

5,408

29

1,699

2,045

2,756

3,656

 

 

8

1,860

2,306

 

3,355

5,040

30

1,697

2,042

2,750

3,646

 

 

9

1,833

2,262

 

3,250

4,781

35

1,689

2,031

2,726

3,598

 

 

10

1,812

2,228

 

3,169

4,587

40

1,684

2,021

2,704

3,554

 

 

11

1,796

2,201

 

3,106

4,437

45

1,680

2,014

2,690

3,527

 

 

12

1,782

2,179

 

3,055

4,318

50

1,676

2,009

2,678

3,505

 

 

13

1,771

2,160

 

3,012

4,221

60

1,670

2,000

2,660

3,505

 

 

14

1,761

2,145

 

2,977

4,140

70

1,664

1,994

2,649

3,458

 

 

15

1,753

2,131

 

2,947

4,073

80

1,662

1,990

2,639

3,416

 

 

16

1,746

2,120

 

2,921

4,015

90

1,661

1,987

2,632

3,402

 

 

17

1,740

2,110

 

2,898

3,965

100

1,660

1,984

2,626

3,391

 

 

18

1,734

2,101

 

2,878

3,922

120

1,658

1,980

2,617

3,373

 

 

19

1,729

2,093

 

2,861

3,883

150

1,656

1,978

2,612

3,359

 

 

20

1,725

2,086

 

2,845

3,850

200

1,653

1,972

2,501

3,340

 

 

21

1,721

2,080

 

2,831

3,819

500

1,648

1,965

2,586

3,210

 

 

22

1,717

2,074

 

2,819

3,792

 

1,645

1,960

2,580

3,291

 

 

 

 

 

 

 

 

 

 

 

 

 

 

12

Generated by Foxit PDF Creator © Foxit Software http://www.foxitsoftware.com For evaluation only.

Таблица значений F -критерия Фишера при уровне значимости 0,05

m

1

2

3

4

5

6

8

12

24

 

n

 

 

 

 

 

 

 

 

 

 

1

161,5

199,5

215,7

224,6

230,2

233,9

238,9

243,9

249,0

254,3

2

18,51

19,00

19,16

19,25

19,30

19,33

19,37

19,41

19,45

19,50

3

10,13

9,55

9,28

9,12

9,01

8,94

8,84

8,74

8,64

8,53

4

7,71

6,94

6,59

6,39

6,26

6,16

6,04

5,91

5,77

5,63

5

6,61

5,79

5,41

5,19

5,05

4,95

4,82

4,68

4,53

4,36

6

5,99

5,14

4,76

4,53

4,39

4,28

4,15

4,00

3,84

3,67

7

5,59

4,74

4,35

4,12

3,97

3,87

3,73

3,57

3,41

3,23

8

5,32

4,46

4,07

3,84

3,69

3,58

3,44

3,28

3,12

2,93

9

5,12

4,26

3,86

3,63

3,48

3,37

3,23

3,07

2,90

2,71

10

4,96

4,10

3,71

3,48

3,33

3,22

3,07

2,91

2,74

2,54

11

4,84

3,98

3,59

3,36

3,20

3,09

2,95

2,79

2,61

2,40

12

4,75

3,88

3,49

3,26

3,11

3,00

2,85

2,69

2,50

2,30

13

4,67

3,80

3,41

3,18

3,02

2,92

2,77

2,60

2,42

2,21

14

4,60

3,74

3,34

3,11

2,96

2,85

2,70

2,53

2,35

2,13

15

4,54

3,68

3,29

3,06

2,90

2,79

2,64

2,48

2,29

2,07

16

4,49

3,63

3,24

3,01

2,85

2,74

2,59

2,42

2,24

2,01

17

4,45

3,59

3,20

2,96

2,81

2,70

2,55

2,38

2,19

1,96

18

4,41

3,55

3,16

2,93

2,77

2,66

2,51

2,34

2,15

1,92

19

4,38

3,52

3,13

2,90

2,74

2,63

2,48

2,31

2,11

1,88

20

4,35

3,49

3,10

2,87

2,71

2,60

2,45

2,28

2,08

1,84

21

4,32

3,47

3,07

2,84

2,68

2,57

2,42

2,25

2,05

1,81

22

4,30

3,44

3,05

2,82

2,66

2,55

2,40

2,23

2,03

1,78

23

4,28

3,42

3,03

2,80

2,64

2,53

2,38

2,20

2,00

1,76

24

4,26

3,40

3,01

2,78

2,62

2,51

2,36

2,18

1,98

1,73

25

4,24

3,38

2,99

2,76

2,60

2,49

2,34

2,16

1,96

1,71

26

4,22

3,37

2,98

2,74

2,59

2,47

2,32

2,15

1,95

1,69

27

4,21

3,35

2,96

2,73

2,57

2,46

2,30

2,13

1,93

1,67

28

4,20

3,34

2,95

2,71

2,56

2,44

2,29

2,12

1,91

1,65

29

4,18

3,33

2,93

2,70

2,54

2,43

2,28

2,10

1,90

1,64

30

4,17

3,32

2,92

2,69

2,53

2,42

2,27

2,09

1,89

1,62

35

4,12

3,26

2,87

2,64

2,48

2,37

2,22

2,04

1,83

1,57

40

4,08

3,23

2,84

2,61

2,45

2,34

2,18

2,00

1,79

1,51

45

4,06

3,21

2,81

2,58

2,42

2,31

2,15

1,97

1,76

1,48

50

4,03

3,18

2,79

2,56

2,40

2,29

2,13

1,95

1,74

1,44

60

4,00

3,15

2,76

2,52

2,37

2,25

2,10

1,92

1,70

1,39

70

3,98

3,13

2,74

2,50

2,35

2,23

2,07

1,89

1,67

1,35

80

3,96

3,11

2,72

2,49

2,33

2,21

2,06

1,88

1,65

1,31

90

3,95

3,10

2,71

2,47

2,32

2,20

2,04

1,86

1,64

1,28

100

3,94

3,09

2,70

2,46

2,30

2,19

2,03

1,85

1,63

1,26

125

3,92

3,07

2,68

2,44

2,29

2,17

2,01

1,83

1,60

1,21

150

3,90

3,06

2,66

2,43

2,27

2,16

2,00

1,82

1,59

1,18

200

3,89

3,04

2,65

2,42

2,26

2,14

1,98

1,80

1,57

1,14

300

3,87

3,03

2,64

2,41

2,25

2,13

1,97

1,79

1,55

1,10

400

3,86

3,02

2,63

2,40

2,24

2,12

1,96

1,78

1,54

1,07

500

3,86

3,01

2,62

2,39

2,23

2,11

1,96

1,77

1,54

1,06

1000

3,85

3,00

2,61

2,38

2,22

2,10

1,95

1,76

1,53

1,03

 

3,84

2,99

2,60

2,37

2,21

2,09

1,94

1,75

1,52

1

13

Generated by Foxit PDF Creator © Foxit Software

http://www.foxitsoftware.com For evaluation only.

Тема 2. Базовые понятия статистики. 2.1. Выборка и генеральная совокупность

При исследовании реальных экономических процессов приходится обрабатывать большие объёмы экономических данных по разнообразным показателям, которые являются случайными величинами.

Основная задача математической статистики состоит в создании методов сбора и обработки экономических данных для получения научных и практических выводов.

Иногда проводят сплошное обследование, т.е. исследуется каждый объект изучаемой совокупности относительно признака, которым интересуются.

Однако изучение всей совокупности во многих случаях невозможно (трудоёмко, дорогостояще и т.п.). Поэтому на практике вся совокупность анализируется редко, в таких случаях проводят несплошное обследование (наблюдение). К несплошным относится и выборочное наблюдение.

В теории выборочного наблюдения приняты следующие определения:

Генеральной совокупностью называется множество всех возможных значений или реализаций исследуемой СВ Х при данном реальном комплексе условий.

Выборочной совокупностью (выборкой) называется часть элементов генеральной совокупности, отобранная для изучения.

Число элементов совокупности называется её объёмом.

Например, из 1000 деталей отобрано 100 для изучения, тогда объём ген.совокупности N = 1000, объём выборки n=100.

Для осуществления выводов о генеральной совокупности используют выборку ограниченного объёма. Поэтому задача математической статистики – исследование свойств выборки и обобщение этих свойств на генеральную совокупность.

Полученный при этом вывод называют статистическим.

Выборку называют репрезентативной, если она достаточно точно отражает изучаемые признаки и параметры генеральной совокупности.

Для репрезентативности выборки важно обеспечить случайность отбора, так, чтобы все объекты генеральной совокупности имели равные шансы попасть в выборку.

Для обеспечения репрезентативности выборки применяют следующие способы отбора:

1.Простой случайный отбор – объекты по одному извлекаются из ген.совокупности. Такой отбор дают обыкновенная лотерея, жеребьёвка, использование таблиц случайных чисел.

2.Механический отбор – вся генеральная ген.совокупность делится на столько групп, сколько объектов должно войти в выборку, а затем из каждой группы извлекается и обследуется одна единица.

3.Типический отбор – объекты отбирают пропорционально представительству различных типов объектов в генеральной совокупности. Он нужен для того, чтобы отразить сложную структуру ген.совокупности. При его проведении ген.совокупность предварительно подразделяется на качественно однородные группы, а затем из них производится случайный отбор.

4.Серийный отбор – объекты отбирают не по одному, а «сериями», которые подвергаются сплошному обследованию.

На практике часто применяется комбинированный отбор, при котором сочетаются выше перечисленные способы.

Выборка может быть повторной, когда объект после изучения возвращается в генеральную совокупность и могут снова попасть в выборку. И бесповторной, когда после изучения объект не возвращается в массив.

2.2. Способы представления и обработки экономических данных

Задачей статистического описания выборки является получение такого её представления, которое позволяет наглядно выявить вероятностные характеристики.

14

F * (x)
F * (x) nx n

 

Generated by Foxit PDF Creator © Foxit Software

 

http://www.foxitsoftware.com For evaluation only.

Различают следующие способы упорядочения данных: по возрастанию, по совпадающим

значениям, по интервалам и т.п.

 

 

Разность между максимальным и минимальным значениями выборки называется разма-

хом выборки:

R xmax xmin

.

Пусть объём выборки равен n, а число различных значений k ( n). Тогда значения хi на-

зываются вариантами.

Если значение хi встретилось в выборке ni раз, то число ni называют частотой значения хi .

Отношение частоты ni к объёму выборки n называется относительной частотой:

i ni .

n

Тогда наблюдаемые значения можно сгруппировать в статистический ряд:

Х

х1

 

 

х2

 

 

 

хk

ni

n1

 

 

n2

 

 

 

nk

i

1

 

 

2

 

 

 

k

 

 

k

 

 

 

k

 

 

 

 

 

ni n

,

 

 

i

1

.

 

 

i 1

 

 

 

i 1

 

 

 

Статистический ряд наглядно можно представить в виде полигона частот (или полигона относительных частот) – ломаной линии, отрезки которой соединяют ( хi , ni ) (или ( хi , i )).

Пример 1. Анализируется прибыль Х предприятий отрасли. Обследованы 100 предприятий. Данные представлены в виде статистического ряда:

Х

5

10

15

20

25

ni

5

20

40

25

10

i

0,05

0,2

0,4

0,25

0,1

Построить полигон частот.

 

 

 

Решение.

 

 

 

 

 

 

 

45

 

 

 

 

 

 

 

40

 

 

 

 

 

 

 

35

 

 

 

 

 

 

частота

30

 

 

 

 

 

 

25

 

 

 

 

 

 

20

 

 

 

 

 

 

15

 

 

 

 

 

 

 

 

 

 

 

 

 

 

10

 

 

 

 

 

 

 

5

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

0

5

10

15

20

25

30

 

 

 

прибыль предприятия

 

 

По статистическому ряду можно строить эмпирическую функцию распределения F*(x).

, где nx - число значений СВ Х< х, n - объём выборки.

Свойства F*(x):

1. 0 ≤

2. F * (x)

1.

-неубывающая функция, т.е. x1 x2 F *(x1 ) F * (x2 ) .

3.

0,

x x

F * (x)

1 .

 

1,

x xk

Эмпирическая

функция

распределения является оценкой функции распределения

F(x) P(X x) , которая называется теоретической функцией распределения.

15

Generated by Foxit PDF Creator © Foxit Software

http://www.foxitsoftware.com For evaluation only.

При большом объёме выборки (или в случае непрерывного признака) её элементы могут быть сгруппированы в интервальный статистический ряд. Для этого все n наблюдаемых значений выборки разбиваются на k непересекающихся интервалов длиной h (- шаг разбиения).

И находят для каждого частичного интервала ni

- количество наблюдаемых значений СВ Х, по-

павших в i-й интервал. i

ni

- относительная частота попадания СВ Х в i-й интервал. Тогда

n

 

 

 

 

 

 

 

 

интервальный статистический ряд имеет вид:

 

 

 

 

[xi 1 , хi )

[x0 , х1 )

 

[x1 , х2 )

 

[xk 1, хk ]

 

ni

n1

 

n2

 

nk

 

i

1

 

2

 

k

 

Интервальный статистический ряд наглядно может быть представлен в виде гистограммы частот – столбиковой диаграммы, состоящей из прямоугольников, основаниями которых

служат подынтервалы, а высота равна ni (плотность частоты). Площадь i-го прямоугольника h

равна ni , а площадь всей гистограммы частот равна сумме всех частот, т.е. объёму выборки n .

Для построения гистограммы относительных частот основание прямоугольника также

равно h, а высота

ni

 

i

 

. Площадь каждого столбика равна i . Площадь всей гистограммы

n h

 

 

 

 

h

 

k

относительных частот равна i 1.

i 1

На основании гистограммы обычно выдвигается предположение о виде закона распределения исследуемой величины.

Пример 2. Анализируется доход населения. Извлечена выборка объёма 300 единиц. По уровню дохода население подразделяется на 6 групп. Данные сгруппированы в интервальный статистический ряд:

[xi 1 , хi )

[0;20)

[20;40)

[40;60)

[60;80)

[80;100)

[100;120)

ni

10

50

80

100

40

20

i

1

 

5

 

8

 

10

 

4

 

2

 

 

 

30

 

 

30

 

 

30

 

 

30

 

 

30

 

 

30

 

Построить гистограмму относительных частот.

Решение. Шаг h = 20. Разделив относительные частоты на шаг разбиения, получим высоту столбиков.

i

 

 

 

 

 

 

h

 

 

 

 

 

 

10

 

 

 

 

 

 

600

 

 

 

 

 

 

8

 

 

 

 

 

 

600

 

 

 

 

 

 

5

 

 

 

 

 

 

600

 

 

 

 

 

 

1

 

 

 

 

 

 

600

 

 

 

 

 

 

0

20

40

60

80

100

120

Форма гистограммы в наибольшей степени соответствует нормальному распределению.

16

Generated by Foxit PDF Creator © Foxit Software

http://www.foxitsoftware.com For evaluation only.

2.3. Статистические оценки параметров распределения Статистической оценкой неизвестного параметра теоретического распределения (т.е.

количественного признака генеральной совокупности) называют функцию от наблюдаемых случайных величин.

Для того чтобы оценки давали «хорошие» приближения оцениваемых параметров, они должны удовлетворять определённым требованиям – быть несмещёнными, состоятельными и эффективными.

Оценка генеральной средней по выборочной средней:

Генеральной средней хГ называется среднее арифметическое значений признака гене-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N

 

 

 

 

 

 

 

 

ральной совокупности:

 

 

 

 

 

 

 

 

 

 

 

х

 

 

 

х1 х2

... хN

 

xi

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Г

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N

N

 

 

 

 

 

 

Если значения x1, x2 ,...,xk

 

 

 

 

 

 

 

 

 

 

 

 

 

( N1 N2

... Nk

N ), то

 

 

 

имеют частоты N1, N2 ,...,Nk

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

х

Г

х1 N1 х2 N2 ... хk Nk

 

xi Ni

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N

 

 

 

 

Выборочной средней

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N

 

 

 

 

 

 

 

значений признака выбо-

 

х

B называется среднее арифметическое

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

рочной

совокупности:

 

 

х

 

 

х1

 

х2 ... хn

 

 

xi

 

Если значения

x , x ,...,x

имеют частоты

 

 

B

 

 

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

n

 

 

 

 

 

 

 

1 2

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n ,n

,...,n

 

( n n ... n n ), то

 

 

х

 

 

xini

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 2

k

1 2

 

 

k

 

 

 

 

 

 

 

 

 

 

B

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пусть из генеральной

 

 

 

 

 

 

 

 

 

извлечена повторная выборка объёма n со значения-

 

совокупности

ми x1, x2 ,...,xn . Пусть

х

Г

неизвестна и требуется оценить (т.е. приближённо найти) её значение по

данным выборки.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Тогда в качестве оценки генеральной средней хГ принимают выборочную среднюю хB .

То же и для бесповторной выборки.

Оценка генеральной дисперсии по исправленной выборочной:

Генеральной дисперсией DГ называется среднее арифметическое квадратов отклонений значений признака генеральной совокупности от их среднего значения хГ :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

 

 

 

 

 

 

 

 

 

(х

x

 

 

)2 (х

 

x

 

)2

... (х

 

 

 

x

 

)2

 

(xi

x

Г )2

 

 

или

 

 

 

 

(xi

x

Г )2 Ni

 

(Если значе-

 

 

 

DГ

Г

Г

N

Г

 

 

 

 

 

 

DГ

 

 

 

 

 

 

 

1

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

i 1

 

ния x1,

 

 

 

 

 

 

 

 

 

 

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

N

 

 

 

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x2 ,...,xk

имеют частоты N1, N2 ,...,Nk

( N1 N2 ... Nk

 

N )).

 

 

 

 

 

 

 

 

 

Генеральное среднее квадратическое отклонение:

Г

 

 

 

.

 

 

DГ

 

 

 

Выборочной дисперсией

 

В называется среднее

арифметическое

квадратов отклонений

D

наблюдаемых значений признака от их среднего значения

х

B :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(xi

x

В )2

(xi

 

x

В )2 ni

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D

 

 

 

 

 

 

 

 

 

D

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В

 

n

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D

х

2

(

х

)2

 

х

 

x

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В

 

 

 

 

 

 

 

 

n

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

17

Generated by Foxit PDF Creator © Foxit Software

http://www.foxitsoftware.com For evaluation only.

Пусть из генеральной совокупности в результате n независимых наблюдений над количественным признаком Х извлечена выборка объёма n. ( x1, x2 ,...,xk имеют частоты n1,n2 ,...,nk

( n1 n2 ... nk n )).

Требуется по данным выборки оценить неизвестную генеральную дисперсию DГ .

В качестве оценки генеральной дисперсии DГ

принимают исправленную дисперсию

 

 

 

 

 

 

k

 

 

 

S 2

n

D

 

(xi

x

В )2 ni

 

.

 

i 1

 

 

 

 

 

n 1

B

 

n 1

 

 

 

 

 

 

 

 

Для оценки среднего квадратического отклонения генеральной совокупности используют

исправленное среднее квадратическое отклонение (стандартное отклонение):

S S 2 .

Выше рассмотренные оценки – точечные. Они определяются одним числом.

Свойства, выполнение которых желательно для того, чтобы оценка была признана удовлетворительной:

1. Несмещенность. Оценка В называется несмещённой оценкой параметра , если её математическое ожидание равно оцениваемому параметру: М( В)= . Многократное осуществление выборок одинакового объёма обеспечивает совпадение средненго значения оценки по всем выборкам с истинным значением параметра. Разность М( В) – называется смещением или систематической ошибкой оценивания. Для несмещённых оценок систематическая ошибка равна нулю.

2.Эффективность. Оценка параметра называется эффективной, если она имеет наименьшую дисперсию из любой другой альтернативной оценки при фиксированном объёме выборки. Оценка называется асимптотически эффективной, если с увеличением объёма выборки её дисперсия стремится к нулю.

3.Состоятельность. Оценка называется состоятельной, если она даёт истинное значение при достаточно большом объёме выборки.

При небольшом объёме выборки точечная оценка может значительно отличаться от оцениваемого параметра, т.е. приводить к грубым ошибкам. В этом случае следует пользовать интервальной оценкой.

Интервальной называют оценку, которая определяется 2 числами – концами интервала. Она позволяет установить точность и надёжность оценок.

Пусть найденная по данным выборки статистическая характеристика В– оценка неиз-

вестного параметра (=const).

 

 

 

 

 

 

 

В тем точнее определяет

, чем

меньше модуль разности

 

В

 

, т.е. 0 и

 

 

 

В

 

, следовательно, чем меньше ,

тем оценка точнее. Т.о. положительное число ха-

 

 

рактеризует точность оценок.

 

 

 

 

 

 

Однако статистические методы не позволяют утверждать, что В удовлетворяет неравен-

ству.

Надёжностью (доверительной вероятностью) оценки по В называется вероятность q, с которой осуществляется неравенство В .

Обычно надёжность задаётся заранее, как правило q = 0,95; 0,99 …(близкое к 1). Чем ближе доверительная вероятность к 1, тем надежнее оценка.

Доверительным называют интервал В ; В , который покрывает неизвестный параметр с заданной надёжностью q.

18

Generated by Foxit PDF Creator © Foxit Software

http://www.foxitsoftware.com For evaluation only.

2.4. Статистическая проверка гипотез

Статистической называют гипотезу о виде закона распределения или о параметрах известного распределения. В первом случае гипотеза непараметрическая, во втором – параметрическая.

Гипотеза Н0, подлежащая проверке, называется нулевой (основной). Наряду с нулевой рассматривают гипотезуН1, которая будет приниматься, если отклоняется Н0. Такая гипотеза называется альтернативной (конкурирующей). Например, если проверяется гипотеза о равенстве параметра Θ некоторому значению Θ0, т.е. Н0: Θ= Θ0, то в качестве альтернативной могут рассматриваться следующие гипотезы:

Н1(1) : 0 ; Н1(2) : 0 ; Н1(3) : 0 ; Н1(4) : 1 ( 1 0 ) .

Выбор альтернативной гипотезы определяется конкретной формулировкой задачи. Гипотезу называют простой, если она содержит одно конкретное предположение. Гипо-

тезу называют сложной, если она состоит из конечного или бесконечного числа простых гипо-

тез ( Н1(1) : 0 ; Н1(2) : 0 ; Н1(3) : 0 ).

Сущность проверки статистической гипотезы заключается в том, чтобы установить, согласуются или нет данные наблюдений и выдвинутая гипотеза. Эта задача решается с помощью специальных методов математической статистики – методов статической проверки гипотез.

При проверке гипотезы выборочные данные могут противоречить гипотезе Но. Тогда она отклоняется. Если же статистические данные согласуются с выдвинутой гипотезой, то она не отклоняется. В последнем случае часто говорят, что нулевая гипотеза принимается (такая формулировка не совсем точна, однако она широко распространена). Статистическая проверка гипотез на основании выборочных данных неизбежно связана с риском принятия ложного решения. При этом возможны ошибки двух родов.

Ошибка первого рода состоит в том, что будет отвергнута правильная нулевая гипотеза. Ошибка второго рода состоит в том, что будет принята нулевая гипотеза, в то время как

в действительности верна альтернативная гипотеза.

Возможные результаты статистических выводов представлены следующей таблицей:

Результаты

Возможные состояния гипотезы

 

 

про верки гипотезы

верна Но

верна Н1

 

 

 

 

Гипотеза Но отклоняется

Ошибка первого

Правильный вывод

рода

 

 

Гипотеза Но не отклоняется

Правильный вы-

Ошибка второго рода

вод

 

 

Последствия указанных ошибок неравнозначны. Первая приводит к более осторожному, консервативному решению, вторая - к неоправданному риску. Что лучше или хуже - зависит от конкретной постановки задачи и содержания нулевой гипотезы. Например, если Но состоит в признании продукции предприятия качественной и допущена ошибка первого рода, то будет забракована годная продукция. Допустив ошибку второго рода, мы отправим потребителю брак. Очевидно, последствия второй ошибки более серьезны с точки зрения имиджа фирмы и ее долгосрочных перспектив.

Исключить ошибки первого и второго рода невозможно в силу ограниченности выборки. Поэтому стремятся минимизировать потери от этих ошибок. Отметим, что одновременное уменьшение вероятностей данных ошибок невозможно, так как задачи их уменьшения являются конкурирующими, и снижение вероятности допустить одну из них влечет за собой увеличение вероятности допустить другую. В большинстве случаев единственный способ уменьшения вероятности ошибок состоит в увеличении объема выборки.

Вероятность совершить ошибку первого рода принято обозначать буквой α, и ее называют уровнем значимости. Вероятность совершить ошибку второго рода обозначают β. Тогда вероятность не совершить ошибку второго рода (1 - β) называется мощностью критерия.

19

Generated by Foxit PDF Creator © Foxit Software

http://www.foxitsoftware.com For evaluation only.

Обычно значения α задают заранее, «круглыми» числами (например, 0,1; 0,05; 0,01 и т.п.), а затем стремятся построить критерий наибольшей мощности. Таким образом, если α = 0,05, то это означает, что исследователь не хочет совершить ошибку первого рода более чем в 5 случаях из 100.

Проверку статистической гипотезы осуществляют на основании данных выборки. Для этого используют специально подобранную СВ (статистику, критерий), точное или приближенное значение которой известно. Эту величину обозначают:

U (или Z) - если она имеет стандартизированное нормальное распределение; T - если она распределена по закону Стьюдента;

2 - если она распределена по закону 2 ; F - если она имеет распределение Фишера.

В целях общности будем обозначать такую СВ через К.

Таким образом, статистическим критерием называют СВ К, которая служит для проверки нулевой гипотезы. После выбора определенного критерия множество всех его возможных значений разбивают на два непересекающихся подмножества: одно из них содержит значения критерия, при которых нулевая гипотеза отклоняется, другое - при которых она не отклоняется.

Совокупность значений критерия, при которых нулевую гипотезу отклоняют, называют критической областью. Совокупность значений критерия, при которых нулевую гипотезу не отклоняют, называют областью принятия гипотезы.

Основной принцип проверки статистических гипотез можно сформулировать так: если наблюдаемое значение критерия К (вычисленное по выборке) принадлежит критической области, то нулевую гипотезу отклоняют. Если же наблюдаемое значение критерия К принадлежит области принятия гипотезы, то нулевую гипотезу не отклоняют (принимают).

Точки, разделяющие критическую область и область принятия гипотезы, называют кри-

тическими.

Перейдем к определению критических точек, а следовательно, и критической области.

В основу этого определения положен принцип практической невозможности маловероятных событий (принцип практической уверенности): если вероятность события А в дан-

ном испытании очень мала, то при однократном выполнении испытания можно быть уверенным в том, что событие А не произойдёт, и в практической деятельности вести себя так, как будто событие А вообще невозможно. Этот принцип не может быть доказан математически, но подтверждается всем практическим опытом человеческой деятельности. Например, отправляясь в путешествие самолётом, мы не рассчитываем погибнуть в авиационной катастрофе, хотя некоторая (весьма малая) вероятность такого события существует. Заметим, что принцип сформулирован лишь «при однократном выполнении испытания». При многократном повторении испытаний мы уже не можем считать маловероятное событие А практически невозможным.

 

Пусть для проверки нулевой гипотезы Но служит критерий К. Тогда вероятность того,

что

СВ К попадет

в произвольный

интервал (k

, k

) ), можно найти по формуле:

 

 

 

 

1

2

2

P(k

 

K k ) 1 , а P((K k ) (K k ) .

 

 

1

2

2

1 2

2

 

 

3ададим вероятность α настолько малой (0,05; 0,01), чтобы попадание СВ К за пределы ин-

тервала (k

, k

) можно было бы считать маловероятным событием. Тогда, исходя из принци-

1

2

2

па практической невозможности маловероятных событий, можно считать, что если Но справедлива, то при ее проверке с помощью критерия К по данным одной выборки наблюдаемое значе-

ние К должно наверняка попасть в интервал

(k

, k

) . Если же наблюдаемое значение К попа-

 

1

2

2

дает за пределы указанного интервала, то произойдет маловероятное, практически невозможное событие. Это дает основание считать, что с вероятностью 1 - α нулевая гипотеза Н0 несправедлива.

Точки k

,k

являются критическими.

1

2

2

20