Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Методичка з ВМ. Статистика

.pdf
Скачиваний:
21
Добавлен:
07.02.2016
Размер:
361.77 Кб
Скачать

МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИ

ЗАПОРІЗЬКИЙ НАЦІОНАЛЬНИЙ ТЕХНІЧНИЙ УНІВЕРСИТЕТ

Методичні вказівки та індивідуальні завдання для самостійної роботи

здисципліни

Математична статистика ”

для студентів економічних спеціальностей (денної форми навчання)

2009

PDF создан испытательной версией pdfFactory Pro www.pdffactory.com

2

Методичні вказівки та індивідуальні завдання для самостійної роботи з дисципліни “Математична статистика” для студентів економічних спеціальностей денної форми навчання / Укл. Коротунова О. В., Щолокова М.О. – Запоріжжя: ЗНТУ, 2009. – 42 с.

Укладачі:

Коротунова О. В., доцент, к.т.н

 

Щолокова М.О., доцент, к.т.н

Експерт:

Гузь П. В., професор, д.е.н

Рецензент:

Мастиновський Ю.В, доцент, к.т.н.

Відповідальний за випуск: Коротунова О. В., доцент, к.т.н

Затверджено на засіданні кафедри прикладної математики

Протокол № 6 від 27.12.08

Схвалено радою радіоприладобудівного інституту ЗНТУ

Протокол № 5 від 15.01.09

PDF создан испытательной версией pdfFactory Pro www.pdffactory.com

3

ЗМІСТ

1 ТЕОРЕТИЧНІ ВІДОМОСТІ ТА ПРИКЛАДИ РОЗВ’ЯЗАННЯ

ЗАДАЧ

4

1.1

Первинна обробка вибіркових даних

4

1.2 Точкові та інтервальні оцінки параметрів розподілу

8

1.3

Перевірка статистичних гіпотез

10

1.3.1 Перевірка гіпотези про математичне сподівання нормально

розподіленої сукупності

11

1.3.2 Перевірка гіпотези про рівність дисперсій двох нормально

 

розподілених сукупностей

12

1.3.3 Критерій χ 2 Персона

14

1.4

Елементи теорії кореляції

15

1.5

Дисперсійний аналіз

20

2 ІНДИВІДУАЛЬНІ ЗАВДАННЯ

23

ЛІТЕРАТУРА

42

PDF создан испытательной версией pdfFactory Pro www.pdffactory.com

4

1 ТЕОРЕТИЧНІ ВІДОМОСТІ ТА ПРИКЛАДИ РОЗВ’ЯЗАННЯ ЗАДАЧ

1.1 Первинна обробка вибіркових даних

Генеральною сукупністю в математичній статистиці називається множина однотипних об’єктів, кількісна чи якісна ознака яких підлягає вивченню. Підмножина об’єктів із генеральної сукупності, називається вибірковою сукупністю або вибіркою. Кількість об’єктів n у вибірці називається її об’ємом. Вважаємо, що ознака, яка

вивчається, є випадковою величиною Х із функцією розподілу F(x). Нехай x1 зустрічається у вибірці n1 разів, x2 n2 , …, xk nk разів. Числа x1 , x2 , …, xk називаються варіантами, n1 , n2 , …, nk – частотами. Розмістивши числа x1 , x2 , …, xk в порядку зростання і

записавши відповідні частоти, з якими зустрічаються ці значення,

дістанемо варіаційний, або статистичний, ряд:

 

xi

 

x1

 

 

 

x2

 

 

xk

 

 

Частоти

 

n1

 

 

 

n2

 

 

nk

 

 

На підставі такого ряду можна побудувати емпіричну функцію

розподілу

Fn (x)= å

n(xi )

.

Якщо

n → ∞ , то емпірична

функція

 

 

 

 

xi < X

n

 

 

 

 

 

 

розподілу збігається до теоретичної функції розподілу.

Статистичний ряд графічно подається полігоном частот. Щоб побудувати його, на осі абсцис відкладають значення реалізацій, а на осі ординат – відповідні їм частоти (відносні частоти). Отримані точки сполучають відрізками прямих.

У разі, коли Х – неперервна величина і об’єм вибірки великий, результати вибірки подають інтервальним рядом. Для цього область реалізацій розбивають на k інтервалів і для кожного інтервалу

визначають частоти. Довжину інтервалів hi = xi найчастіше беруть

однаковою ( h ). Отриманий ряд геометрично подається гістограмою. Для побудови її на осі абсцис відкладають інтервали, а на них як на

основах будують прямокутники, висота яких дорівнює ni h (щільність частоти). Гістограма дає певне уявлення про графік

PDF создан испытательной версией pdfFactory Pro www.pdffactory.com

5

щільності розподілу.

Для вибіркової сукупності обчислюють числові характеристики – вибіркові випадкові функції: вибіркову середню x вибіркову

дисперсію

Dâ

тощо. Реалізації цих вибіркових функцій знаходять за

формулами, вигляд яких залежить від того, в якій формі подано

вибіркові

дані.

 

Якщо

вибіркові

дані

не

згруповано,

то

 

1

n

 

 

1

n

 

 

 

 

 

 

 

x =

åxi ,

Dâ =

å(xi x)2 .

Якщо

вибіркові

дані зведено у

 

n i=1

 

 

n i=1

 

 

 

1

k

 

 

 

 

 

 

 

 

 

 

k

 

 

 

статистичний

ряд, то

x =

1 å xi ni ,

Dâ =

å(xi - x)2 ni .

Для

 

практичних

обчислень

 

n i=1

 

n i=1

більш зручно

вибіркової

дисперсії

використовувати формулу Dâ = x 2 (x)2 .

Якщо дані подаються інтервальним рядом, то перехід до статистичного ряду виконують, обчислюючи для кожного інтервалу його середину.

Приклад 1.1.1 У цеху встановлено 5 верстатів. Протягом 25 днів реєструвалась кількість верстатів, які не працювали. Здобуто такі значення: 0, 1, 2, 1, 1, 2, 3, 2, 1, 4, 2, 0, 0, 2, 2, 3, 3, 1, 0, 1, 2, 1, 3, 5,

0. Обчислити x , Dâ .

Розв’язання. На підставі вибіркових даних складемо статистичний ряд:

 

xi

 

 

0

 

1

2

 

3

 

4

 

5

 

 

ni

 

 

5

 

7

7

 

4

 

1

 

1

 

 

Знайдемо

числові

характеристики вибіркової сукупності.

 

 

 

k

 

1

 

 

 

 

 

 

 

 

 

 

x = 1 å xi ni

=

(7 +14 +12 + 4 + 5)= 1,68.

Вибіркову дисперсію

25

 

n i=1

 

 

 

 

 

 

 

 

 

(x)2 = :

визначимо

 

 

за

формулою

 

 

Dâ = x 2

x 2 = (7 + 28 + 36 +16 + 25)/ 25 = 4,48. Отже, Dâ

= 4,48 − (1,68)2

= 1,6576.

Приклад 1.1.2 За заданим дискретним статистичним розподілом вибірки побудувати емпіричну функцію розподілу та полігон частот:

xi

–6

–4

–2

2

4

6

Частоти ni

5

10

15

20

40

10

Розв’язання. Згідно з означенням та властивостями F * (x) має такий

PDF создан испытательной версией pdfFactory Pro www.pdffactory.com

 

 

6

 

вигляд (рис. 1.1):

 

 

 

ì0

 

x £ -6,

ï

0,05

- 6 < x £ -4,

ï

ï

0,15

- 4 < x £ -2,

ï

F (x) = í

0,3

- 2

< x £ 2,

ï0,5

2

< x £ 4,

ï

 

4

< x £ 6,

ï 0,9

ï

1,

 

x > 6.

î

 

 

 

 

 

F*(x)

 

 

 

 

 

 

1

 

 

 

 

–6

–4

–2

0

2

4

6

хі

Рисунок 1.1 – Емпірична функція розподілу

 

Полігон частот зображено на рис. 1.2.

 

 

 

 

 

 

 

ni

 

 

 

 

 

 

 

40

 

 

 

 

 

 

 

10

 

 

 

 

–6

–4

–2

0

2

4

6

xi

 

Рисунок 1.2 – Полігон частот

 

 

Приклад 1.1.3 За заданим інтервальним статистичним розподілом вибірки побудувати функцію F * (x) та гістограму частот:

Інтервал

0-4

4-8

8-12

12-16

16-20

20-24

ni

5

7

7

4

1

1

PDF создан испытательной версией pdfFactory Pro www.pdffactory.com

 

 

 

 

7

 

 

 

Розв’язання. Гістограма зображена на рис. 1.3, а F * (x) – на рис. 1.4.

 

hi

 

 

 

 

 

 

 

n

 

 

 

 

 

 

7

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

0

4

8

12

 

16

20

xi

 

24

 

Рисунок 1.3 – Гістограма частот

 

F (x)

 

 

 

 

 

 

1

 

 

 

 

 

 

 

0,65

 

 

 

 

 

 

 

0,4

 

 

 

 

 

 

 

0,1

 

 

 

 

 

 

 

0

4

8

12

16

20

24

xi

 

Рисунок 1.4 – Емпірична функція розподілу

Приклад 1.1.4 Із генеральної сукупності зроблено вибірку обсягом n=32. Здобуто такі реалізації випадкової величини: 2,2; 7,1; 6,3; 3,9; 5,9; 5,6; 5,6; 4,7; 7,9; 3,2; 6,1; 5,5; 6,4; 6,0; 6,9; 4,7; 6,4; 6,9; 6,7; 7,9; 4,2; 6,7; 6,0; 9,2; 5,5; 6,5; 3,5; 4,9; 7,2; 4,9; 8,9; 5,7. Скласти інтервальний

ряд і знайти x, Dâ .

Розв’язання. Для побудови інтервального ряду розбиваємо область реалізацій на 7 інтервалів з однаковими довжинами інтервалів:

 

max(x )− min(x )

 

 

9,2 −

2,2

 

x =

i

i

i

i

;

x =

=1. Частоти кожного інтервалу

 

 

7

 

7

 

 

 

 

 

 

 

 

 

знайдемо, визначивши для кожного значення інтервал. Якщо значення xi потрапляє на межу, то збільшуємо на 1 частоту нижнього інтервалу.

PDF создан испытательной версией pdfFactory Pro www.pdffactory.com

8

Інтервал 2,2-3,2 3,2-4,2 4,2-5,2 5,2-6,2 6,2-7,2 7,2-8,2 8,2-9,2

Частота

2

3

4

9

10

2

2

Для обчислення числових характеристик розподілу перейдемо до статистичного ряду. Для цього складемо таблицю, в якій запишемо

середини інтервалів u j =

x j−1 + x j

і їхні частоти mj .

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

u j

 

2,7

 

 

3,7

 

4,7

 

5,7

6,7

7,7

8,7

 

 

mj

 

2

 

 

 

3

 

4

 

9

10

2

2

 

 

1

k

 

1

 

(2,7 ×2 + 3,7 ×3 + 4,7 ×4 + 5,7 ×9 + 6,7 ×10 + 7,7 ×2 + 8,7 ×2) = 5,825

x =

å x j m j

=

 

n

 

 

j=1

32

 

 

 

 

 

 

 

 

 

 

 

D =

1

(2,72 ×2+3,72

×3+4,72 ×4+5,72 ×9+6,72 ×10+7,72 ×2+8,72 ×2)-(5,825)2 » 2,172

 

â

32

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1.2 Точкові та інтервальні оцінки параметрів розподілу

Оцінка параметра розподілу сукупності θ у загальному випадку є

випадковою величиною, яка визначається за даними вибірки і використовується замість невідомого значення параметра, який потрібно оцінити. Оцінка називається обґрунтованою, якщо вона збігається за ймовірністю до відповідного параметра при n → ∞. Оцінка називається незміщеною, якщо її математичне сподівання збігається зі значенням параметра. У разі вибору з усіх відомих незміщених обґрунтованих оцінок певної оцінки потрібно зазначити критерій, за яким зроблено вибір. Найчастіше застосовується критерій, який полягає у виборі оцінки, що має найменшу можливу дисперсію. Така оцінка називається ефективною.

Нехай маємо точкову оцінку θ параметра θ . Знайдемо для

параметра інтервальну оцінку, скориставшись умовою P(θ) −θ < )= γ.

В такому разі

називається точністю оцінки, а γ – її надійністю.

Тоді інтервальна оцінка (довірчий інтервал) для параметра θ набуває вигляду (θ − ;θ + ). Параметр θ – це випадкова величина, надійність

γ можна розглядати як імовірність того, що довірчий інтервал покриває дійсне значення параметра. Величини i γ тісно зв’язані з

об’ємом вибірки n. Якщо задати дві з цих величин, то можна знайти третю. Для цього потрібно знати закон розподілу для

θ = ϕ(X1,X2,...,Xn ).

Нехай ця величина розподілена за нормальним законом. Побудуємо інтервальну оцінку математичного сподівання a = xген за

PDF создан испытательной версией pdfFactory Pro www.pdffactory.com

 

 

 

 

 

9

 

 

 

 

 

 

 

значенням вибіркового середнього

 

в

для двох випадків:

 

 

 

x

 

 

 

1. Якщо відомо середнє квадратичне відхилення σ , то довірчий

інтервал

для

 

математичного

сподівання

має

вигляд:

xB

t ×

σ

 

< a < xB

+

t ×

σ

 

, де n – об’єм вибірки,

t – таке значення

 

 

 

 

 

 

n

 

 

 

 

 

 

n

 

γ , тобто

 

 

 

аргументу функції Лапласа Ф(t) , для якого Ô(t) =

= t ×σ .

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

n

 

2. Параметр σ нормального закону розподілу ознаки X генеральної сукупності невідомий. У цьому випадку інтервальна

оцінка параметра a = xген із заданою надійністю γ визначається за

формулою: xв − < a < xв + , де D = tγ × S , S точкова оцінка

n

параметра σ , виправлене вибіркове середнє квадратичне відхилення tγ = t(γ ,n) критична точка розподілу Стьюдента, значення якої

можна знайти з таблиць по відомим n і γ .

Для оцінки генерального середнього квадратичного відхилення σ при заданій надійності γ можна побудувати довірчий інтервал s × (1- q) < σ < s × (1+ q), де q = q(n,γ ) – значення, що визначається

таблицями.

Приклад 1.2.1 Знайти довірчий інтервал для математичного сподівання нормально розподіленої випадкової величини, якщо об’єм вибірки n = 49, x В = 2,8 , σ =1,4 , а довірча ймовірність γ = 0,9.

Розв’язання.

Визначимо

t , при якому Ф(t) = 0,9 : 2 = 0,45:

t = 1,645 . Тоді 2,8 −

1,645×1,4

< a < 2,8 +

1,645

×

1,4

, або 2,471 < a < 3,129 .

 

 

 

 

 

 

 

49

 

14

 

 

 

 

 

 

Приклад 1.2.2 Дана вибірка значень нормально розподіленої випадкової величини: 2, 3, 3, 4, 2, 5, 5, 5, 6, 3, 6, 3, 4, 4, 4, 6, 5, 7, 3, 5.

Знайти с довірчою ймовірністю γ = 0,95 границі довірчих інтервалів

для математичного сподівання та дисперсії.

Розв’язання. Об’єм вибірки n = 20 . Знайдемо x В = 4,25 , S = 1,37 . За таблицями визначимо t(0,95; 20) = 2,093 ; q(0,95; 20) = 0,37 . Тоді

PDF создан испытательной версией pdfFactory Pro www.pdffactory.com

10

4,25 -

2,093×1,37

< a < 4,25 +

2,093

×1,37 , 3,64 < a < 4,86 довірчий інтервал

 

 

20

 

 

 

20

 

 

для

математичного

сподівання;

1,37(1−0,37) <σ <1,37(1+0,37) ;

0,86 < σ <1,88; 0,74 < D = σ 2 < 3,52 довірчий інтервал для дисперсії.

1.3 Перевірка статистичних гіпотез

Статистичною називається гіпотеза, яка стосується виду або параметрів розподілу випадкової величини і яку можна перевірити на підставі результатів спостереження у випадковій вибірці. Перевіряючи статистичні гіпотези за результатами випадкової вибірки, завжди ризикують прийняти хибне рішення. Але в такому випадку можна обчислити ймовірність прийняття хибного рішення і, якщо вона мала, ризик помилки буде невеликим. Помилки, яких можна припуститися, бувають двох родів. Помилка першого роду полягає в тому, що перевірювана гіпотеза H0 відхиляється, тоді як вона правильна.

Помилка другого роду полягає у тому, що гіпотеза H0 приймається, тоді як вона хибна, а правильною є деяка гіпотеза H1. Ця гіпотеза, яка протиставляється гіпотезі H0 , називається альтернативною.

Статистичні гіпотези поділяються на прості і складні. Проста гіпотеза однозначно визначає закон розподілу випадкової величини. Для побудови статистичного критерію, який дає змогу перевірити деяку гіпотезу H0 , необхідно вибрати статистичну характеристику

гіпотези – деяку вибіркову функцію, визначити допустиму ймовірність помилки першого роду α (рівень значущості), сформулювати альтернативну гіпотезу H1, знайти критичну область для статистичної характеристики, щоб мінімізувати ймовірність помилки другого роду. В критичній області гіпотеза H0 відхиляється на користь гіпотези H1. Критична область визначається так, щоб імовірність потрапляння в неї статистичної характеристики за умови, що правильна гіпотеза H0 , дорівнювала α – заданому рівню

значущості. Крім того, необхідно, щоб ймовірність помилки другого роду була мінімальною.

Статистичні гіпотези поділяються на параметричні і

PDF создан испытательной версией pdfFactory Pro www.pdffactory.com