Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Частина 4 практикум.pdf
Скачиваний:
79
Добавлен:
20.02.2016
Размер:
1.14 Mб
Скачать

Питання для самоконтролю

1.Що називається вибірковим середнім?

2.Що називається розмахом вибірки, коефіцієнтом варіації?

3.Що називається початковим емпіричним моментомs-го порядку?

4.Що називається вибірковою дисперсією?

5.Що називається центральним емпіричним моментомs-го порядку?

6.Що називається модою, медіаною?

7.Як знайти моду й медіану для дискретного(інтервального) ряду?

9.Що називається асиметрією, ексцесом?

 

 

 

 

 

 

 

 

 

 

 

Вправи

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1.

У результаті валютних торгів протягом п’яти днів був встановле-

 

ний такий курс американського долара у гривнях: 6,02; 6,05; 6,03;

 

6,08; 6,07. Знайти вибіркову середню, вибіркову дисперсію, коефі-

 

цієнт варіації курсу долара.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2.

Для дослідження розподілу маси новонароджених зважили1 000 ма-

 

люків і побудували інтервальний статистичний розподіл:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ai -1 -ai

 

1,0 – 1,5

1,5 – 2,0

 

2,0 – 2,5

 

2,5 – 3,0

 

3,0 – 3,5

 

3,5 – 4,0

 

4,0 – 4,5

4,5 – 5,0

 

 

ni

 

20

80

 

 

100

 

300

 

 

250

 

 

 

 

190

 

50

 

 

10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Побудувати гістограму частот, визначити моду; побудувати кумуля-

 

ту, графічно визначити медіану; обчислити

x

,

s B .

 

 

 

 

 

 

 

3.

Прибуток P

мегамаркету відповідно по місяцях набув таких зна-

 

чень (млрд. грн.):

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Місяць

 

1

2

3

 

 

4

5

 

6

 

 

7

 

8

 

9

 

10

 

11

12

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P

 

0,2

0,5

0,4

 

0,2

0,4

 

0,5

 

 

0,2

 

0,2

 

0,4

 

0,5

 

0,4

0,2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Знайти вибіркове середнє та вибіркове середньоквадратичне відхи-

 

лення.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4.

Знайти вибіркове середнє за даним розподілом вибірки:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi

 

 

 

 

1 450

 

 

 

 

 

1 480

 

 

 

 

 

 

 

 

1 490

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ni

 

 

 

 

3

 

 

 

 

 

5

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

5.

Знайти вибіркову дисперсію за даним розподілом вибірки:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi

 

 

 

 

0,02

 

 

 

 

 

0,05

 

 

 

 

 

 

 

 

0,08

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ni

 

 

 

 

3

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ДВНЗ “Українська академія банківської справи НБУ”

105

3.7. СТАТИСТИЧНІ ОЦІНКИ ПАРАМЕТРІВ ГЕНЕРАЛЬНОЇ СУКУПНОСТІ

Вивчаючи певну ознаку X генеральної сукупності, ми можемо знати характер розподілу випадкової величини X, але параметри цього закону залишаються невідомими. Тоді постає подальше завдання: на основі одержаної вибірки визначити наближені числові значення невідомих параметрів розподілу – точкові статистичні оцінки або просто статистичні оцінки.

3.7.1. СТАТИСТИЧНІ ОЦІНКИ НЕВІДОМИХ ПАРАМЕТРІВ РОЗПОДІЛУ ТА ЇХ ВЛАСТИВОСТІ

Статистичною оцінкою невідомого параметра q теоретичного розподілу називається будь-яка однозначна функція від випадкових ве-

личин, які спостерігаються: qn* = f (x1 , x2 , ... , xn ).

Для того, щоб оцінка qn* мала практичну цінність, вона мусить задовольняти певні умови. Статистична оцінка є сама випадковою величиною.

Статистична оцінка qn* = f (x1, x2 , ... , xn ) невідомого параметра розподілу q випадкової величини X називається незміщеною, якщо її математичне сподівання дорівнює точному значенню цього параметра:

M (qn*) =q.

Якщо оцінка не задовольняє цієї умови, то вона називається змі-

щеною.

Статистична оцінка qn* = f (x1, x2 , ..., xn ) невідомого параметра розподілу q випадкової величини X називається ефективною, якщо вона має найменшу дисперсію серед усіх незміщених оцінок параметра q, обчислених за вибірками одного й того ж обсягу.

Під час розглядання вибірок великого обсягу до статистичних оцінок додається вимога слушності (або змістовності, або конзистентності).

Статистична оцінка q* = f (x , x , ..., x

n

) невідомого параметра

n

1

2

 

розподілу q випадкової величини X

називається слушною (або змістов-

ною, або конзистентною), якщо qn*

збігається за ймовірністю до

оцінюваного параметра при необмеженому зростанні обсягу вибірки, тобто виконується така рівність: для "e > 0

lim P{

 

qn * -q

 

< e } =1,

(3.26)

n®¥

 

 

 

 

 

 

 

 

де e > 0 – яке завгодно мале число.

 

ДВНЗ “Українська академія банківської справи НБУ”

106

3.7.2. СТАТИСТИЧНА ОЦІНКА МАТЕМАТИЧНОГО СПОДІВАННЯ

Припустимо, що x1, x2 , ..., xn - вибірка, отримана в результаті n незалежних випробувань над випадковою величиноюX – деякою ознакою генеральної сукупності, яка має математичне сподівання

M ( X ) = a.

За статистичну оцінку

математичного

сподівання a = M ( X )

приймають вибіркове середнє:

 

 

 

 

 

 

 

 

 

 

1

n

 

an* =

 

=

åxi .

(3.27)

x

 

 

 

 

 

n i=1

 

Оцінка an* = x є незміщеною, тобто M (x) = a.

Припустимо додатково, що випадкова величина X має скінченну дисперсію D( X ) = s 2. Тоді оцінка an* = x є слушною для параметра a.

Твердження. Якщо випадкова величина X нормально розподілена з параметрами M (x) = a і D( X ) = s 2 , то оцінка x має у класі всіх не-

зміщених оцінок математичного сподівання a

мінімальну дисперсію,

 

s 2

 

 

 

 

 

 

яка дорівнює

 

, тому x є ефективною оцінкою параметра a.

 

 

n

 

 

3.7.3. СТАТИСТИЧНА ОЦІНКА ДИСПЕРСІЇ.

 

 

ВИПРАВЛЕНА ДИСПЕРСІЯ

Якщо випадкова вибірка x1, x2 , ..., xn складається з n незалежних

випробувань

над випадковою величиною X

із математичним споді-

ванням M ( X ) = a та дисперсією D( X ) = s 2 , то за статистичну оцінку дисперсії беруть вибіркову дисперсію

 

 

1

n

 

 

 

 

 

 

DB =

å(xk -

 

)2 ,

(3.28)

x

 

 

 

n k =1

 

яка є зміщеною оцінкою параметра D( X ) = s 2 ;

 

або виправлену вибіркову дисперсію

 

 

 

 

 

 

 

1

 

n

 

s2 =

 

(xk -

x

)2 ,

(3.29)

n -1

 

åk =1

 

яка є незміщеною оцінкою параметра D( X ) = s 2.

Той факт, що DB є зміщеною оцінкою для D( X ) , випливає із рів-

ності:

 

 

 

 

M (D

)=

n -1

s 2 ,

(3.30)

 

B

 

n

 

 

 

 

ДВНЗ “Українська академія банківської справи НБУ”

107

Враховуючи співвідношення s2

=

 

n

 

 

DB , отримуємо:

 

n -

 

 

 

 

 

 

 

 

1

 

 

M (s 2 ) =

n

 

M (DB ) =

n

 

×

n -1

s 2 = D( X ),

(3.31)

n -1

 

 

 

 

 

 

n -1

 

 

n

 

тобто виправлена дисперсія s 2 є незміщеною оцінкою для дисперсії

D( X ) = s 2.

Відповідно незміщеною точковою оцінкою середнього квадратичного відхилення є число – виправлене середнє квадратичне відхилення:

s = s2 .

Дріб

n

 

називають поправкою Бесселя. Для малих n

поправка

n -1

 

 

 

Бесселя значно відрізняється від одиниці. Для n > 50 DB та s 2

різнять-

ся мало. На практиці користуються виправленою дисперсією, якщо обсяг n < 30 .

Оцінки DB та s 2 є слушними і не є ефективними.

У випадку, якщо математичне сподівання a відоме і випадкова величина X розподілена нормально, то незміщеною, слушною та ефективною оцінкою дисперсії D( X ) = s 2 є:

1 ån (xk - a)2 . n k =1

Приклад 3.4. У результаті дослідження отримано статистичний ряд: 3,2; 4,4; 8,1; 8,1; 6,7; 4,4; 4,4; 3,2; 5,0; 6,7; 6,7; 7,5; 3,2; 4,4; 6,7; 6,7; 5,0; 5,0; 4,4; 8,1. Обчислити статистичну оцінку математичного сподівання, незміщену оцінку дисперсії та виправлене середнє квадратичне відхилення.

Розв’язання. Для обчислення статистичних оцінок побудуємо дискретний варіаційний ряд:

xi

3,2

4,4

5,0

6,7

7,5

8,1

 

 

 

 

 

 

 

ni

3

5

3

5

1

3

Обчислимо статистичну оцінку математичного сподівання:

x = 3,2 × 3 + 4,5 × 5 + 5,0 × 3 + 6,7 × 5 + 7,5 ×1 + 8,1× 3 = 5,595. 20

ДВНЗ “Українська академія банківської справи НБУ”

108

Оскільки обсяг вибірки n = 20 < 30, обчислимо незміщену оцінку дисперсії та виправлене середнє квадратичне відхилення:

s 2 = (3,2 - 5,595)2 × 3 + ... + (8,1 - 5,595)2 × 3 = 2,84; 19

s= s 2 = 2,84 =1,65.

3.7.4.МЕТОД МОМЕНТІВ СТАТИСТИЧНОГО ОЦІНЮВАННЯ

ПАРАМЕТРІВ РОЗПОДІЛУ

На підставі даних вибірки x1, x2 , ..., xn , отриманої внаслідок спостережень над випадковою величиною X , потрібно оцінити невідомий параметр q = (q1,q2 ,K,qm ). Припустимо, що закон розподілу випадкової

величини X відомий із точністю до параметраq і визначається за допомогою функції f (x, q), яка у випадку дискретної випадкової величини X задає ймовірність події X = xi , а у випадку неперервної випадкової величини X – щільність її розподілу. Тоді всі моменти випадкової величини X є функціями від q:

M (X s )= vs (q1,q2 ,K,qm ),

де vs (q1,q2 ,K,qm ) = åxis f (xi ,q1,q2 ,K,qm ), якщо X – дискретна ви-

i

падкова величина, а xi – можливі значення X; і vs (q1,q2 ,K,qm ) =

¥

= ò xis f (xi ,q1,q2 ,K,qm ) dx, якщо X – неперервна випадкова величина.

Схема статистичного оцінювання параметрів q1 , q2 , ..., qm за мето-

дом моментів:

1) обчислюємо m теоретичних початкових моментів:

n1(q1,q2 ,...,qm ),n2 (q1,q2 ,...,qm ),...,nm (q1,q2 ,...,qm ), де n s = M ( X s );

2)на підставі вибірки x1 , x2 , ..., xn обчислюємо m відповідних вибіркових початкових моментів.

Увипадку, якщо вибірка задана вихідним статистичним рядом, це будуть емпіричні моменти:

 

 

 

 

1

n

 

 

 

, ..., qm ) =

åxi s , s =

 

.

n s

(q1 , q2

1, m

 

 

 

 

 

n i=1

ДВНЗ “Українська академія банківської справи НБУ”

109

У випадку, якщо вибірка задана згрупованим варіаційним рядом, це будуть емпіричні моменти:

 

 

 

 

1

k

k

 

 

 

, ..., qm ) =

åni xi s ,

åni = n, s =

 

;

n s

(q1 , q2

1, m

 

 

 

 

 

n i=1

i=1

3)прирівнюємо теоретичні та відповідні емпіричні моменти і отримуємо систему рівнянь відносно компонентq1,q2 ,K,qm оцінюваного параметра:

{n s (q1, q2 , ... , qm ) =n s (q1 , q2 , ... , qm ), s =1, m;

4)розв’язуючи отриману систему рівнянь(точно або наближено), знаходимо шукані оцінки (q1*, q2* , ...qm* ). Ці оцінки, очевидно, є функціями від вибіркових значень x1, x2 , ..., xn .

Необхідно зауважити, що:

·схема у разі вибору центральних або початкових і центральних -мо ментів у сукупності залишається без змін;

·теоретичним обґрунтуванням методу моментів є закон великих чисел;

·методом моментів отримують слушні статистичні оцінки параметрів розподілу, які, однак, умови незміщеності взагалі не задовольняють;

·прирівнюючи функції від теоретичних та емпіричних моментів, можна дістати статистичні оцінки для характеристик випадкової величини, які є функціями від теоретичних моментів.

Приклад 3.5. Знайти методом моментів за вибіркоюx1, x2 , ..., xn

статистичні оцінки невідомих

параметрів a і s нормального роз-

поділу:

 

 

 

 

 

 

 

 

1

 

-

( x -a )2

 

f (x) =

 

e

2s 2

.

 

 

 

 

 

 

 

s

 

2p

 

 

 

 

Розв’язання. Прирівняємо початкові теоретичні й емпіричні моменти першого порядку, а також центральні й емпіричні моменти другого порядку: n1 = M1, m2 = m2 . Враховуючи, що

 

n1 = M (X ), m2 = D(X ), M1 = x, m2 = DB ,

 

ìM (X ) =

x

,

отримаємо:

ï

)= D .

íD(X

 

ï

 

B

 

î

 

 

 

ДВНЗ “Українська академія банківської справи НБУ”

110

Беручи до уваги, що математичне сподівання нормального розподілу дорівнює параметру a , дисперсія дорівнює s 2 , маємо:

a = x, s 2 = DB .

Таким чином, шукані статистичні оцінки параметрів нормального розподілу:

a* = x, s * = DB .

3.7.5. МЕТОД МАКСИМУМУ ПРАВДОПОДІБНОСТІ СТАТИСТИЧНОГО ОЦІНЮВАННЯ ПАРАМЕТРІВ РОЗПОДІЛУ

На підставі даних вибірки x1, x2 , ..., xn , отриманої внаслідок спостережень над випадковою величиною X, потрібно оцінити невідомий

параметр q = (q1, q2 , K, qm ). Припустимо,

що

закон

розподілу

випад-

кової величини X відомий із точністю до параметраq і визначаєть-

ся за допомогою функціїf (x, q ),

яка

у

випадку

дискретної

випадкової величини X задає ймовірність події X = xi , а у випадку неперервної випадкової величини X – щільність її розподілу.

Функцією правдоподібності називають функцію

L (x1, x2 , ..., xn , q ) = f (x1,q )× f (x2 ,q )L f (xn ,q ),

яка зображує сумісний розподіл випадкового вектора з незалежними компонентами, кожна з яких має той самий розподіл, що й випадкова величина X.

Ідея методу максимуму правдоподібності: за статистичну оці-

нку невідомого параметра q приймають таке його значення q*, для якого функція правдоподібності L(x1 , x2 , .., xn , q), що розглядається як функція від q при фіксованих значеннях x1, x2 , ..., xn досягає максимуму.

Схема статистичного оцінювання параметраq методом максиму-

му правдоподібності:

1)досліджуємо функцію правдоподібності L( x1 , x2 , ..., xn , q ) на максимум за допомогою методів диференціального числення: знаходимо критичні точки q * = (q1*, q2* , ..., qm* ) із системи рівнянь:

ì¶L(x

, x

2

, ... , x

n

, q , q

2

, ... , q

m

)

 

 

 

 

 

 

 

 

í

1

 

 

1

 

 

,

i =1, m;

 

 

 

qi

 

 

 

 

î

 

 

 

 

 

 

 

 

 

 

 

ДВНЗ “Українська академія банківської справи НБУ”

111

 

 

Для спрощення обчислень зручно замість функції L(x1

, x2 , .., xn , q),

розглядати логарифмічну функцію правдоподібності ln L(x1

, x2 , .., xn , q),

оскільки

точки

екстремуму для

функційL

 

і

ln L збігаються, бо

 

ln L =

1

 

L

.

Знаходимо

критичні

 

точки

функціїln L із системи

 

 

 

 

 

 

qi

L qi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

рівнянь:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ì¶ ln L(x , x

2

, ... , x

n

, q , q

2

, ... , q

m

)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

í

1

 

 

1

 

 

 

,

i =1, m;

 

 

 

 

 

 

 

qi

 

 

 

 

 

 

 

 

 

 

î

 

 

 

 

 

 

 

 

 

 

 

 

 

 

розв’язки якої (q1*, q2* , ..., qm* );

2)використовуючи достатні умови екстремуму функції, знаходимо точку максимуму.

Метод максимуму правдоподібності статистичного оцінювання

параметрів розподілу має низку важливих переваг:

·вони слушні, асимптотично нормально розподілені (при великому обсязі вибірки n їх розподіл близький до нормального) і мають найменшу дисперсію в порівнянні з іншими асимптотично нормальними оцінками;

·найбільш повно використовуються дані вибірки для оцінки параметрів, тому цей метод особливо корисний за малих обсягів вибірки.

Недолік методу в тому, що він часто вимагає складних обчислень. Найчастіше цей метод використовується при біноміальному, по-

казниковому розподілах і розподілі Пуассона.

 

У

випадку

біноміального розподілу функція правдоподібності

має вигляд: L(x1 , x2 , .., xn , q ) = Pr (x1, p) × Pr (x2 , p) ××× Pr (xn , p),

де

P

(x

, p) = C xi pxi

qr-xi .

 

r

i

r

 

Після логарифмування та прирівнювання до нуля похідної відln L отримуємо вираз для оцінки параметра p:

 

 

 

*

 

n x

 

p

 

= å

 

i

.

 

 

 

 

 

 

 

 

i=1 nr

У випадку, якщо варіанта xi

має частоту ni , то оцінка параметра p

така:

 

 

 

 

 

 

 

 

 

*

 

 

k x n

p

 

=

å

i i

,

 

 

 

 

 

 

i=1 nr

де n = n1 + n2 + ... + nk – кількість дослідів по r випробувань у кожному.

ДВНЗ “Українська академія банківської справи НБУ”

112