Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Статистика _Овсянникова (исправленный)

.pdf
Скачиваний:
200
Добавлен:
08.04.2015
Размер:
1.05 Mб
Скачать

iMe – величина медианного интервала; f – сумма частот;

SMe1 – сумма накопленных частот, предшествующих медианному интервалу;

fMe – частота медианного интервала.

Задание 1 (е)

(продолжение контрольной работы №10)

е) Найти основные числовые характеристики вариационного ряда (по возможности использовать упрощающие формулы для их нахождения):

1)выборочное среднее xB ;

2)выборочную дисперсию D(X);

3)выборочное среднее квадратическое отклонение σ(X ) ;

4)коэффициент вариации V;

5)Пояснить смысл полученных результатов.

е) Найдем основные числовые характеристики вариационного ряда:

1) Выборочное среднее найдем как среднее арифметическое взвешенное

m

xini

xB =

i=1

 

,

 

n

 

 

 

которое характеризует среднее значение признака X в пределах рассматриваемой выборки.

2) Выборочную дисперсию

m

(xi xB )2 ni

DB =

i=1

 

,

 

n

 

 

 

которая является мерой рассеяния возможных значений показателя X вокруг своего среднего значения. Его размерность совпадает с квадратом размерности варианты.

30

3) Выборочное среднее квадратическое отклонение

σB ( X ) = DB ,

которое описывает абсолютный разброс значений показателя X. Его размерность совпадает с размерностью варианты.

Примечание. При малых n (n < 30) вычисляют «исправленную» дисперсию:

 

 

 

 

m

 

S 2 (X ) =

n

 

DB =

(xi xB )2 ni

 

i=1

,

n 1

n 1

 

 

 

иисправленное стандартное отклонение S(X ) = S 2 (X ) .

4)Коэффициент вариации

V = σB (X ) 100% , xB

который характеризует относительную изменчивость показателя X, то есть относительный разброс вокруг его среднего значения xB . Коэффициент вариации является безмерной величиной, поэтому он пригоден для сравнения рассеяния вариационных рядов, варианты которых имеют различную размерность.

Используя приведенные выше формулы, вычислим выборочное среднее xB и выборочную дисперсию DB . Для этого составим расчетную табл. 2.1.

 

 

 

 

Таблица 2.1

 

 

 

 

 

xi

ni

xini

(xi xB )2

(xi xB )2 ni

0

4

0

8,1796

32,7184

1

13

13

3,4596

44,9748

2

14

28

0,7396

10,3544

3

24

72

0,0196

0,4704

4

16

64

1,2996

20,7936

5

4

20

4,5796

18,3184

6

3

18

9,8596

29,5788

7

2

14

17,1396

34,2792

Сумма

80

229

 

191,488

31

Используя суммы, полученные в табл. 2.1, найдем: 1) Выборочную среднюю

 

m

 

 

 

xB =

xini

=

229

2,86.

i=1

n

80

 

 

 

2) Выборочную дисперсию

 

 

m

 

D

=

(xi xB )2 ni

= 191,488 = 2,39.

i=1

 

B

 

n

80

 

 

Замечание. Если первоначальные варианты – большие числа или, наоборот, слишком малы и к тому же являются равноотстоящими, то удобно перейти к условным вариантам

ui = xi kА,

где А и k – произвольные числа.

В качестве с целесообразно выбирать одно из средних значений признака X, а в качестве k – разность между двумя соседними вариантами. В этом случае формулы для упрощенного вычисления принимают следующий вид:

 

m

 

 

 

 

 

ui ni

 

 

– выборочная средняя xB =

i=1

 

k + А;

 

n

 

 

 

 

 

 

 

 

 

m

 

 

 

DB =

ui2ni

k 2

(xB А)2 .

– и выборочная дисперсия

i=1

 

 

 

 

n

 

 

Для вычисления основных числовых характеристик воспользуемся упрощающими формулами, для чего составим расчетную табл. 2.2. Выберем c = 3 и k =1

32

Таблица 2.2

xi

ni

ui =

 

x А

 

uini =

x

А

ni

x

А 2

 

i

 

i

 

ui2ni =

i

 

 

ni

 

k

 

k

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

0

4

 

-3

 

-12

 

 

36

 

 

 

1

13

 

-2

 

-26

 

 

52

 

 

 

2

14

 

-1

 

-14

 

 

14

 

 

 

3

24

 

0

 

0

 

 

 

0

 

 

 

4

16

 

1

 

16

 

 

16

 

 

 

5

4

 

2

 

8

 

 

 

16

 

 

 

6

3

 

3

 

9

 

 

 

27

 

 

 

7

2

 

4

 

8

 

 

 

32

 

 

 

Сумма

80

 

 

 

 

-11

 

193

 

 

 

Используя суммы, полученные в таблице 2.2, найдем: 1) Выборочную среднюю

 

m

 

 

 

xB =

uini

k + А=

11

1+3 2,86 .

i =1

n

80

 

 

 

2) Выборочную дисперсию

 

m

 

 

 

 

 

DB =

ui2ni

k 2 (xB А)2 =

193

12

(2,86 3)2

2,39 .

i=1

n

80

 

 

 

 

 

3)Выборочное среднее квадратическое отклонение

σB (X ) = DB = 2,39 1,55 .

4)Коэффициент вариации

V =

σB (X ) 100% =

1,55

100% 54,2% .

 

xB

2,86

 

5) Смысл полученных результатов заключается в том, что величина xB 2,86 характеризует среднее значение признака X, то есть среднее значение составило 2,86. Среднее квадратическое от-

33

клонение σB (X ) описывает абсолютный разброс значений показателя X и в данном случае составляет σB (X ) 1,55 . Коэффициент вариации V характеризует относительную изменчивость показателя X, то есть относительный разброс вокруг его среднего значения xB , и в данном случае составляет V 54,2% .

Ответ: xB 2,86 ; DB 2,39 ; σB (X ) 1,55 ; V 54,2% .

34

Тема 3.

ИНТЕРВАЛЬНЫЕ ОЦЕНКИ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ

Выборочный метод широко применяется на практике. Соотношение между характеристиками выборочной и генеральной совокупностей есть соотношение между опытными данными (результатами наблюдений) и теоретической моделью. Основная идея выборки (выборочного наблюдения) заключается в следующем: определить неизвестные характеристики генеральной совокупности (генеральную долю признака p, генеральную среднюю xΓ и генеральную дисперсию σΓ2 с помощью данных выборочного распределения).

В курсе рассматриваются два вида собственно-случайных выборок – повторная и бесповторная, из которых каждая может быть связана с оценкой генеральной доли признака или генеральной средней. Таким образом, получаем четыре типа выборок, для каждой из которых должна конкретизироваться формула (3.1) и помещенная в ее правой части средняя квадратическая ошибка выборки σ :

 

 

 

 

 

δ

 

 

 

 

 

P(

 

X a

 

δ)= 2Φ

 

,

(3.1)

 

 

σ

 

 

где X – выборочная доля (ω ) или выборочная средняя ( xB ); a – их математические ожидания (генеральная доля p или генеральная средняя x0 ); δ – предельная ошибка выборки; P – доверительная вероятность; X δ, X +δ – доверительные границы; σ – средняя

35

квадратическая ошибка; Φ(x) – функция Лапласа, значение которой можно найти по таблице приложения 2 в настоящих методических указаниях или по таблице приложения 2 в книгах [1] или [5];

Формула связывает между собой три величины: доверительную вероятность Р, предельную ошибку выборки δ (или доверительный интервал (X δ, X +δ )) и объем выборки п. В конкретной задаче две из этих величин должны быть заданы, третья – определяется по указанной формуле. Это приводит к 12 типам задач теории выборки, но несмотря на такое их многообразие, все они решаются по сходным вычислительным схемам.

Доверительная вероятность P для заданных предельной ошибки δ и средней квадратической ошибки σ (в зависимости от вида

и цели выборки это будет σx , σ x, σω , σω) вычисляется по формуле

(3.1). Средняя квадратическая ошибка σ (то есть σx , или σ x, или

σω , или σω) вычисляется по одной из следующих четырех формул:

Таблица 3.1

Тип оцениваемой

 

 

 

 

 

 

 

Тип выборки

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

генеральной

 

Повторная

 

 

 

 

Бесповторная

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

для средней

 

 

 

 

 

 

 

σ 2

 

 

 

 

 

 

σ 2

 

 

 

n

 

 

 

σ

 

В

 

 

σx

В

1

 

 

 

 

 

 

 

x

n

n

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

для доли

 

 

 

 

 

 

ω(1ω)

 

 

=

ω(1 ω)

 

 

n

 

 

 

 

 

 

 

 

 

σω =

 

n

σω

 

n

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N

где n – объем выборки; N – объем генеральной совокупности.

Замечание. В некоторых задачах может быть указано, что расчет необходимо произвести для бесповторной выборки, но объем генеральной совокупности N не дан. Тогда либо в условии задачи указывается, что объем генеральной совокупности N значительно превосходит объем выборки n, либо это выясняется из содержания

36

задачи. В таких случаях, полагая в формулах таблицы 6 объем генеральной совокупности «бесконечно» большим N → ∞ , получим

1Nn 1. Отсюда следует, что σ x=σx , σω=σω . Это означает, что,

несмотря на условие бесповторности выборки, расчет можно производить по формулам для повторной выборки. Подобная замена формул для бесповторной выборки на формулы для повторной выборки должна быть обоснована, как это показано выше.

Иногда для удобства вычислений выражение σδ обозначают

одной буквой t, то есть t = σδ или δ = t σ .

Объем выборки n при фиксированных предельной ошибке δ

идоверительной вероятности P вычисляется в зависимости от вида

ицели выборки по одной из формул:

 

 

 

 

 

 

 

 

Таблица 3.2

 

 

 

 

Тип выборки

 

 

 

Тип оцениваемой

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

генеральной

Повторная

Бесповторная

 

 

 

 

 

 

 

 

 

 

для средней

nx

t 2σB2

 

nx

nx N

 

 

nx + N

δ 2

 

 

 

 

 

для доли

nω

t 2ω(1 ω)

 

nω′ ≈

 

nω N

 

 

 

nω + N

 

 

 

 

δ 2

 

 

где параметр t находится по таблице значений функции Лапласа Ф(t) (см. приложение 2 в настоящих методических указаниях или в

книгах в [1] или [5]) из соотношения Φ(t) = P2 .

Рассмотрим решение конкретных задач, аналогичных задачам № 2 контрольной работы.

37

Задание 2 [2(а, б, в)]

В заочном вузе, где обучаются 2000 студентов, была образована случайная бесповторная выборка с целью определения стажа работы студентов по специальности. Полученные при этом результаты представлены в таблице 3.3:

Таблица 3.3

Стаж работы по

1-5

5-9

9-13

13-17

17-21

Итого

специальности (лет).

 

 

 

 

 

 

Количество студентов

15

20

45

12

8

100

а1: Найти границы, в которых с вероятностью 0,997 заключен средний стаж работы по специальности всех студентов вуза.

а2: Найти границы, в которых с вероятностью 0,9708 заключена доля всех студентов вуза, стаж работы которых по специальности не более 9 лет.

б1: Каким должен быть объем выборки, чтобы границы, найденные в пункте а1, гарантировать с вероятностью 0,9964?

б2: Каким должен быть объем выборки, чтобы границы, найденные в пункте а2, гарантировать с вероятностью 0,996?

в1: Найти вероятность того, что средний стаж работы по специальности всех студентов вуза отличается от среднего их стажа в выборки не более чем на 1 год (по абсолютной величине).

в2: Найти вероятность того, что доля студентов в вузе, имеющих стаж работы не менее 13 лет отличается от выборочной доли таких же студентов не более, чем на 2 года (по абсолютной величине).

г: Используя χ2 -критерий Пирсона, при уровне значимости α = 0,05 проверить гипотезу о том, что случайная величина X – стаж работы студентов по специальности – распределена по нормальному закону. Построить на одном чертеже гистограмму эмпирического распределения и соответствующую нормальную кривую.

38

Решение. Рассмотрим решение задач 2 (а1, а2, б1, б2, в1, в2). Решение задачи 2 г будет приведено в теме 4.

Задание 2, а1. Найти границы, в которых с вероятностью 0,997 заключен средний стаж работы по специальности всех студентов вуза.

Решение 2, а1. Средний стаж работы по специальности всех студентов вуза будет заключен в границах

xB δ xo xB +δ ,

где предельная ошибка выборки δ = t σ x. В данном случае в каче-

стве средней квадратической ошибки σ выбираем σ x(см. табл. 6), так как оценивается генеральная средняя и выборка бесповторная.

Так как по условию доверительная вероятность P = 0,997 , то значение t найдем по таблице значений функции Лапласа (приложение 2 в настоящих методических указаниях или приложение 2 в

книгах [1] или [5]) из условия

Φ(t) =

P

, то есть

Φ(t) =

0,997

= 0,4985 .

2

2

 

 

 

 

 

По таблице находим t = 2,96 .

Так как по условию выборка бесповторная и оценивается генеральная средняя, то среднюю квадратическую ошибку выборки

σ xсогласно табл. 6 найдем по формуле

 

 

 

 

 

σ 2

 

 

n

 

σ

 

x

 

B

1

 

 

,

 

 

 

 

 

 

 

 

n

 

 

N

 

где n =100

– объем выборки,

N = 2000 – объем генеральной сово-

купности,

тогда выборочную дисперсию σ B2 найдем по упрощенной

формуле

 

 

 

 

 

 

m

 

 

 

 

ui2ni

 

σB2 =

i=1

 

k 2 (xB А)2 ,

 

n

 

 

 

 

 

39