Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Пособие по мат. стат

.pdf
Скачиваний:
491
Добавлен:
10.06.2015
Размер:
3.53 Mб
Скачать

51

 

1

 

10

1

 

 

1

10

2

 

 

 

 

 

 

 

 

 

 

 

 

 

S 2

 

ni xi2

 

 

ni xi

 

S 2

 

 

 

 

 

0,52; s

0,52 0,72 .

n 1

n 1

 

 

i 1

n

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Находим

для

уровня значимости 1 1 0,95 0,05 и числа

степеней свободы

n 1 11 по

таблице распределения Стьюдента

критическую

точку

t0,05,11 2, 2 .

Определяем границы доверительного

интервала:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

t , n 1 s

0, 42

2, 2 0,72

0,04; x

t , n 1

s

0, 42

 

2, 2 0,72

0,88.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

12

 

 

n

 

12

 

 

 

 

 

 

 

 

 

 

 

 

Таким образом, искомый доверительный интервал: 0,04; 0,88 .

Доверительный интервал для дисперсии случайной величины, распределенной по нормальному закону при известном математическом ожидании

Пусть случайная величина X Na, , причем параметр неизвестен.

Задача состоит в следующем: построить доверительный интервал для неизвестной дисперсии, соответствующий заданной надежности γ 1 α .

Наилучшей оценкой дисперсии, найденной по выборке x1, x2, , xn

объема n

при известном математическом ожидании a , будет

 

величина

 

1

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S02

(xi a)2 . Нормируем величину

 

S02 ,

разделив ее на масштабный

 

 

n i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

множитель 2 :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S 2

1 n

(x a)2

 

1 n x a 2

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

i

 

 

 

i

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

n i 1

2

 

n i 1

 

 

 

 

 

 

так как

 

xi a

N0,1

, то,

по определению, случайная величина

 

2

 

n S02

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

имеет распределение 2 с n степенями свободы. Зададим доверительную

вероятность

1 . Найдем верхнюю и нижнюю критические границы

2

2

, соответствующие уровню значимости , т.е.

, n и

, n

 

 

 

 

 

 

 

 

P

2

2 2

 

1 .

 

 

 

, n

, n

 

52

Критические границы ищем из условия,

что прямые

2

и

x , n

2

отсекают от криволинейной трапеции,

ограниченной плотностью

x , n

вероятностей случайной величины 2 , области одинаковой площади 2 . То есть

P

2

 

2

 

 

, P

2

2

 

 

, n

2

 

, n .

 

 

 

 

 

 

 

 

2

Из первого равенства, по определению квантили для распределения

хи-квадрат, получаем 2

 

2

 

 

.

Из второго равенства, учитывая, что

 

, n

2, n

 

 

 

 

 

площадь всей криволинейной трапеции, ограниченной плотностью вероятностей, равна 1, имеем

 

 

 

 

 

, n

 

 

 

,

 

P

 

2 2

 

1

 

 

 

 

 

 

 

 

 

 

2

 

следовательно, нижняя критическая граница

 

 

 

2

 

2

 

 

2, n

.

 

 

 

, n

 

1

 

 

Таким образом, с вероятностью 1 случайная величина 2

2

 

2

 

 

 

 

 

 

 

 

попадает в интервал 1 2, n;

2, n , т.е.

 

 

2

 

 

 

2 2

2, n

.

1 2, n

 

 

 

 

 

 

Разрешаем полученный интервал

 

 

 

 

 

2

 

 

 

n S02

2

 

 

 

 

 

1 2, n

 

 

2

 

2, n

относительно 2 и получаем доверительный интервал для неизвестной дисперсии:

n S02

2

n S02

.

(2.18)

 

 

2

 

2

 

2, n

 

1 2, n

 

 

 

 

 

 

53

Значения

2

и

2

 

ищутся по таблицам распределения 2 с

 

2, n

 

1 2, n

 

уровнями значимости

 

и 1

 

соответственно и n степенями свободы

 

 

2

 

2

 

(прил. 2).

Для того, чтобы получить доверительный интервал для неизвестного среднего квадратического отклонения , нужно извлечь квадратный корень из всех частей двойного неравенства (2.18):

n S 2

 

n S 2

 

0

 

0

.

(2.18а)

 

 

2

 

2

 

2, n

 

1 2, n

 

Доверительный интервал для дисперсии случайной величины, распределенной по нормальному закону при неизвестном математическом ожидании

Пусть случайная величина X Na, , причем параметр неизвестен.

Задача состоит в следующем: построить доверительный интервал для неизвестной дисперсии, соответствующий заданной надежности 1 .

Для решения задачи из генеральной совокупности произведена выборка x1, , xn объемом n . На основании выборки найдем точечные

несмещенные оценки неизвестных параметров

 

 

 

 

1

n

 

 

1

 

 

n

 

 

 

 

x

xi ; S 2

 

 

(xi x )2.

 

 

 

n

n 1

 

 

 

 

 

i 1

 

 

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Случайная величина

2

 

(n 1)S 2

имеет распределение 2 с

n 1

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

степенями свободы. Зададим доверительную вероятность 1 . Тогда

 

 

 

P

 

2

2 2

 

1 ,

 

 

 

 

 

, n 1

 

 

, n 1

 

 

2

2

– нижняя и верхняя критические границы,

 

где , n 1

и , n 1

 

соответствующие уровню значимости . Аналогично предыдущему случаю, получим

2

2

, 2

2

.

, n 1

1 2, n 1

, n 1

2, n 1

 

54

Таким образом, с вероятностью 1 случайная величина 2 попадет в интервал

2

2 2

.

1 2, n 1

2, n 1

 

Разрешаем полученный интервал

2

 

(n 1)S 2

2

 

1 2, n 1

 

2

2, n 1

относительно 2 и получаем доверительный интервал для неизвестной дисперсии:

 

 

 

(n 1)S 2

 

 

 

(n 1)S 2

 

 

 

 

 

 

 

 

 

2

 

 

.

(2.19)

 

 

 

2

 

 

2

 

 

 

 

2, n 1

 

 

 

1 2, n 1

 

 

Значения

2

и

2

 

 

 

ищутся по таблицам распределения 2

 

2, n 1

 

 

 

1 2, n 1

 

 

 

 

 

с уровнями значимости

 

 

 

и

1

 

 

соответственно и числом

степеней

 

 

 

 

2

 

 

 

2

 

 

 

 

 

свободы n 1.

Доверительный интервал для среднего квадратического отклонения при неизвестном математическом ожидании a вычисляем по формуле

(n 1)S 2

 

(n 1)S 2

.

(2.19а)

2

2

 

 

 

2, n 1

 

1 2, n 1

 

 

Пример. Для отрасли, включающей 1200 фирм, составлена случайная выборка из 19 фирм. По выборке оказалось, что исправленное среднее квадратическое отклонение для числа работающих на фирме составляет s 25 (человек). Пользуясь 90 %-ным доверительным интервалом, оценить среднее квадратическое отклонение для числа работающих на фирме по всей отрасли.

Решение. Так как среднее квадратическое отклонение есть корень квадратный из дисперсии, то необходимо составить доверительный интервал для неизвестной дисперсии и потом извлечь квадратный корень из концов интервала. Таким образом получим доверительный интервал для среднего квадратического отклонения.

55

Необходимо построить доверительный интервал для неизвестной дисперсии при неизвестном математическом ожидании с заданной точностью

1 0,9. Значит 0,1;

2 0,05; 1 2 0,95. По таблице определяем

для данной задачи

2

2

28,9 и

2

2

9,39 .

 

2, n 1

0,05;18

 

1 2, n 1

0,95;18

 

Подставив в формулу необходимые величины, получаем доверительный интервал:

18 252

2

18 252

,

28,9

9,39

 

 

следовательно, искомый доверительный интервал имеет вид

19,74 34,61 (человек).

Замечание. Поскольку при увеличении объема выборки распределение

2 приближается к нормальному, при достаточно большом объеме выборки доверительный интервал для дисперсии можно найти по формуле

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P

 

 

s

 

 

 

 

s

 

 

1 ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 1

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

u

1

 

u

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2n

 

 

 

 

 

2n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где u

находим по таблице функции Лапласа из условия

 

u

 

1

.

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Примеры решения задач к главе 2

1. Найти несмещенные оценки математического ожидания и дисперсии, начальные моменты второго и третьего порядков и центральные моменты первого и второго порядков по выборке объема n 20:

 

xi

 

1

 

1

 

2

 

3

5

 

 

ni

 

2

 

3

 

10

 

4

1

 

 

 

 

 

 

 

 

 

 

 

 

 

Решение.

Несмещенная

 

оценка

математического

ожидания

вычисляется по формуле (2.1а):

 

2( 1) 3 1 10 2 4 3 1 5

1,9 .

x

 

20

 

 

 

56

Вычислим начальные моменты второго и третьего порядков по формуле (2.5а). Берем k 2 и k 3 соответственно:

 

 

 

 

2( 1)2 3 12 10 22 4 32 1 52

 

2 3 40 36 25

 

 

x2

 

5,3;

 

20

 

20

 

 

 

 

 

 

 

 

 

 

 

 

2( 1)3 3 13 10 23 4 33 1 53

 

2 3 80 108 125

 

x3

 

15,7 .

 

20

 

20

 

 

 

 

 

 

 

 

 

 

Теперь вычислим центральный момент первого порядка по формуле (2.6а), в формуле надо взять k 1:

 

 

 

 

 

 

 

 

 

k

 

 

 

 

 

 

 

 

1

k

1

k

 

 

ni xi

 

 

 

 

 

 

 

ˆ1

ni (xi

 

)1

ni (xi

 

)

i 1

 

 

 

 

 

 

0,

x

x

x

x

x

 

 

 

 

n i 1

n i 1

 

 

n

 

 

 

 

 

 

 

таким образом, центральный момент первого порядка всегда равен нулю.

Центральный момент второго порядка – это неисправленная выборочная дисперсия, ее удобнее вычислить по формуле

ˆ 2 D x2 x 2 5,3 (1,9)2 5,3 3,61 1,69.

Следует обратить внимание на то, что выборочная дисперсия не может быть отрицательным числом.

Осталось вычислить неисправленную выборочную дисперсию S 2 , для этого используем формулу (2.4):

 

 

 

 

 

 

 

 

S 2

20

 

 

 

20

1,69 1,78.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

20 1

19

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ответ: выборочное

среднее

x 1,9 ;

начальный

момент второго

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

порядка νˆ

2

x2 5,3;

начальный

момент третьего порядка νˆ

3

x3 15,7 ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

центральный момент первого порядка μˆ1 0 ;

центральный момент второго

порядка ˆ

2

 

1,69 и несмещенная выборочная дисперсия S 2

1,78 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2. Найти выборочное среднее по данному распределению выборки

объема n 100 :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi

 

2702

 

 

2804

 

 

2903

3028

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ni

 

8

 

 

 

30

 

 

60

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

57

Решение. Для того чтобы упростить вычисления, перейдем к условным вариантам

ui xi 2844 .

Получим следующее распределение:

ui

142

40

59

184

ni

8

30

60

2

 

 

 

 

 

Вычислим выборочное среднее условной величины по формуле (2.1а):

 

8( 142) 30( 40) 60 59 2 184

 

1136 1200 3540 368

15,72.

 

u

 

 

100

100

 

 

 

 

 

Так как u x 2844 , то u x 2844 , следовательно

x u 2844 15,72 2844 2859,72.

Отметим, что D u D x 2844 D x . То есть при переходе к

условным вариантам путем сдвига на некоторую константу выборочная дисперсия не меняется.

3. Найти выборочное среднее и выборочную дисперсию по данному распределению выборки объема n 10 :

xi

0,01

0,04

0,08

 

 

 

 

ni

5

3

2

Решение. Перейдем к условным вариантам

ui 100 xi .

Получим следующее распределение:

ui

1

4

8

 

 

 

 

ni

5

3

2

 

 

 

 

Вычислим сначала выборочное среднее u и u2 :

58

u 5 12 16 3,3 , 10

u2 5 3 16 2 64 18,1. 10

Выборочная дисперсия условной величины равна

D(u) u2 u 2 18,1 (3,3)2 7, 21.

Так как u 100 x , то u 100 x . Итак, выборочное среднее исходной варианты

 

 

x

 

 

 

 

 

3,3

0,033.

 

 

u

 

 

 

 

 

 

 

 

 

100

100

 

 

 

 

 

Аналогично, используя свойства дисперсии, получаем

 

 

 

 

 

(u) 1002

 

 

(x) .

 

 

 

 

D

D

 

Следовательно,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(x)

D(u)

 

 

7,21

0,000721.

 

D

 

 

 

 

1002

 

10000

 

 

 

4. Путем опроса получены следующие данные (n 80) :

2 4 2 4 3 3 3 2 0 6

1 2 3 2 2 4 3 3 5 1

0 2 4 3 2 2 3 3 1 3

3 3 1 1 2 3 1 4 3 1

7 4 3 4 2 3 2 3 3 1

4 3 1 4 5 3 4 2 4 5

3 6 4 1 3 2 4 1 3 1

0 0 4 6 4 7 4 1 3 5

 

Найти основные числовые характеристики вариационного ряда (по возможности использовать упрощающие формулы для их нахождения):

1)выборочное среднее x ;

2)смещенную и несмещенную оценки дисперсии D и S 2 ;

3)выборочное среднее квадратическое отклонение ˆ ;

4)коэффициент вариации V .

Решение. Для составления дискретного вариационного ряда отсортируем данные опроса по величине и расположим их в порядке возрастания:

 

 

 

59

 

0 0 0 0

1 1 1 1 1 1 1 1 1 1 1 1 1

2 2 2 2 2 2 2 2 2 2 2 2 2 2

3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3

4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4

5 5 5 5

6 6 6

7 7.

 

 

Более компактно эти данные можно представить в виде статистического распределения выборки (в виде таблицы, в которой первая строка – варианты (наблюдаемые значение), вторая строка – частоты появления этих вариант):

xi

 

0

1

2

 

3

4

 

5

 

6

7

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ni

 

4

13

14

 

24

16

 

4

 

3

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Найдем

основные

числовые

характеристики

 

вариационного ряда.

Вычислим выборочное среднее x и выборочную дисперсию D . Для этого составим расчетную таблицу:

xi

ni

xi ni

xi x 2

ni xi

 

2

x

0

4

0

8,1796

32,7184

 

 

 

 

 

1

13

13

3,4596

44,9748

 

 

 

 

 

2

14

28

0,7396

10,3544

 

 

 

 

 

 

3

24

72

0,0196

0,4704

 

 

 

 

 

 

4

16

64

1,2996

20,7936

 

 

 

 

 

5

4

20

4,5796

18,3184

 

 

 

 

 

6

3

18

9,8596

29,5788

 

 

 

 

 

7

2

14

17,1396

34,2792

 

 

 

 

 

Сумма

80

229

 

191,488

 

 

 

 

 

 

 

Используя суммы, полученные в расчетной таблице, найдем: 1) выборочное среднее

 

 

 

 

 

60

 

 

 

 

 

 

 

m

 

 

 

 

 

 

 

 

 

 

 

 

xini

 

 

 

 

229

 

 

 

 

 

x

i 1

 

 

2,86 ;

n

 

80

 

 

 

 

 

 

 

 

 

2) выборочную дисперсию

 

 

 

 

 

 

 

 

 

 

 

m

 

 

 

 

 

 

 

 

 

 

 

ni xi x

2

 

 

191,488

 

 

 

 

i 1

 

 

 

 

2,39.

 

D

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

80

 

Исправленную выборочную дисперсию вычисляем по формуле

S 2

n

 

 

80

2,39 2,42 .

D

 

n 1

79

 

 

 

 

Замечание. Если первоначальные варианты – большие числа или, наоборот, слишком малы и к тому же являются равноотстоящими, то удобно перейти к условным вариантам:

ui xi c , k

где с и

k – произвольные числа.

В

качестве c целесообразно выбирать одно из средних значений

признака X, а в качестве k – разность между двумя соседними вариантами. В этом случае формулы для упрощенного вычисления принимают следующий вид:

– выборочное среднее

 

m

 

 

uini

 

x

i 1

k c ;

n

 

 

– выборочная дисперсия

m

niui2

 

 

i 1

 

k 2

x c 2 ,

D

 

 

 

 

 

n

 

либо можно использовать такую формулу: