 
        
        Методичка з ВМ. Статистика
.pdfМІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИ
ЗАПОРІЗЬКИЙ НАЦІОНАЛЬНИЙ ТЕХНІЧНИЙ УНІВЕРСИТЕТ
Методичні вказівки та індивідуальні завдання для самостійної роботи
здисципліни
“Математична статистика ”
для студентів економічних спеціальностей (денної форми навчання)
2009
PDF создан испытательной версией pdfFactory Pro www.pdffactory.com
2
Методичні вказівки та індивідуальні завдання для самостійної роботи з дисципліни “Математична статистика” для студентів економічних спеціальностей денної форми навчання / Укл. Коротунова О. В., Щолокова М.О. – Запоріжжя: ЗНТУ, 2009. – 42 с.
| Укладачі: | Коротунова О. В., доцент, к.т.н | 
| 
 | Щолокова М.О., доцент, к.т.н | 
| Експерт: | Гузь П. В., професор, д.е.н | 
| Рецензент: | Мастиновський Ю.В, доцент, к.т.н. | 
Відповідальний за випуск: Коротунова О. В., доцент, к.т.н
Затверджено на засіданні кафедри прикладної математики
Протокол № 6 від 27.12.08
Схвалено радою радіоприладобудівного інституту ЗНТУ
Протокол № 5 від 15.01.09
PDF создан испытательной версией pdfFactory Pro www.pdffactory.com
3
ЗМІСТ
1 ТЕОРЕТИЧНІ ВІДОМОСТІ ТА ПРИКЛАДИ РОЗВ’ЯЗАННЯ
| ЗАДАЧ | 4 | |
| 1.1 | Первинна обробка вибіркових даних | 4 | 
| 1.2 Точкові та інтервальні оцінки параметрів розподілу | 8 | |
| 1.3 | Перевірка статистичних гіпотез | 10 | 
| 1.3.1 Перевірка гіпотези про математичне сподівання нормально | ||
| розподіленої сукупності | 11 | |
| 1.3.2 Перевірка гіпотези про рівність дисперсій двох нормально | 
 | |
| розподілених сукупностей | 12 | |
| 1.3.3 Критерій χ 2 Персона | 14 | |
| 1.4 | Елементи теорії кореляції | 15 | 
| 1.5 | Дисперсійний аналіз | 20 | 
| 2 ІНДИВІДУАЛЬНІ ЗАВДАННЯ | 23 | |
| ЛІТЕРАТУРА | 42 | |
PDF создан испытательной версией pdfFactory Pro www.pdffactory.com
4
1 ТЕОРЕТИЧНІ ВІДОМОСТІ ТА ПРИКЛАДИ РОЗВ’ЯЗАННЯ ЗАДАЧ
1.1 Первинна обробка вибіркових даних
Генеральною сукупністю в математичній статистиці називається множина однотипних об’єктів, кількісна чи якісна ознака яких підлягає вивченню. Підмножина об’єктів із генеральної сукупності, називається вибірковою сукупністю або вибіркою. Кількість об’єктів n у вибірці називається її об’ємом. Вважаємо, що ознака, яка
вивчається, є випадковою величиною Х із функцією розподілу F(x). Нехай x1 зустрічається у вибірці n1 разів, x2 – n2 , …, xk – nk разів. Числа x1 , x2 , …, xk називаються варіантами, n1 , n2 , …, nk – частотами. Розмістивши числа x1 , x2 , …, xk в порядку зростання і
записавши відповідні частоти, з якими зустрічаються ці значення,
дістанемо варіаційний, або статистичний, ряд:
| 
 | xi | 
 | x1 | 
 | 
 | 
 | x2 | 
 | … | 
 | xk | 
 | 
| 
 | Частоти | 
 | n1 | 
 | 
 | 
 | n2 | 
 | … | 
 | nk | 
 | 
| 
 | На підставі такого ряду можна побудувати емпіричну функцію | |||||||||||
| розподілу | Fn (x)= å | n(xi ) | . | Якщо | n → ∞ , то емпірична | функція | ||||||
| 
 | ||||||||||||
| 
 | 
 | 
 | xi < X | n | 
 | 
 | 
 | 
 | 
 | 
 | ||
розподілу збігається до теоретичної функції розподілу.
Статистичний ряд графічно подається полігоном частот. Щоб побудувати його, на осі абсцис відкладають значення реалізацій, а на осі ординат – відповідні їм частоти (відносні частоти). Отримані точки сполучають відрізками прямих.
У разі, коли Х – неперервна величина і об’єм вибірки великий, результати вибірки подають інтервальним рядом. Для цього область реалізацій розбивають на k інтервалів і для кожного інтервалу
визначають частоти. Довжину інтервалів hi = xi найчастіше беруть
однаковою ( h ). Отриманий ряд геометрично подається гістограмою. Для побудови її на осі абсцис відкладають інтервали, а на них як на
основах будують прямокутники, висота яких дорівнює ni  h (щільність частоти). Гістограма дає певне уявлення про графік
h (щільність частоти). Гістограма дає певне уявлення про графік
PDF создан испытательной версией pdfFactory Pro www.pdffactory.com
5
щільності розподілу.
Для вибіркової сукупності обчислюють числові характеристики – вибіркові випадкові функції: вибіркову середню x вибіркову
| дисперсію | Dâ | тощо. Реалізації цих вибіркових функцій знаходять за | ||||||||||||
| формулами, вигляд яких залежить від того, в якій формі подано | ||||||||||||||
| вибіркові | дані. | 
 | Якщо | вибіркові | дані | не | згруповано, | то | ||||||
| 
 | 1 | n | 
 | 
 | 1 | n | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |
| x = | åxi , | Dâ = | å(xi − x)2 . | Якщо | вибіркові | дані зведено у | ||||||||
| 
 | n i=1 | 
 | 
 | n i=1 | 
 | 
 | 
 | 1 | k | 
 | 
 | |||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | k | 
 | 
 | 
 | |||
| статистичний | ряд, то | x = | 1 å xi ni , | Dâ = | å(xi - x)2 ni . | Для | ||||||||
| 
 | ||||||||||||||
| практичних | обчислень | 
 | n i=1 | 
 | n i=1 | більш зручно | ||||||||
| вибіркової | дисперсії | |||||||||||||
використовувати формулу Dâ = x 2 − (x)2 .
Якщо дані подаються інтервальним рядом, то перехід до статистичного ряду виконують, обчислюючи для кожного інтервалу його середину.
Приклад 1.1.1 У цеху встановлено 5 верстатів. Протягом 25 днів реєструвалась кількість верстатів, які не працювали. Здобуто такі значення: 0, 1, 2, 1, 1, 2, 3, 2, 1, 4, 2, 0, 0, 2, 2, 3, 3, 1, 0, 1, 2, 1, 3, 5,
0. Обчислити x , Dâ .
Розв’язання. На підставі вибіркових даних складемо статистичний ряд:
| 
 | xi | 
 | 
 | 0 | 
 | 1 | 2 | 
 | 3 | 
 | 4 | 
 | 5 | 
 | |
| 
 | ni | 
 | 
 | 5 | 
 | 7 | 7 | 
 | 4 | 
 | 1 | 
 | 1 | 
 | |
| 
 | Знайдемо | числові | характеристики вибіркової сукупності. | 
 | 
 | ||||||||||
| 
 | k | 
 | 1 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||
| x = 1 å xi ni | = | (7 +14 +12 + 4 + 5)= 1,68. | Вибіркову дисперсію | ||||||||||||
| 25 | |||||||||||||||
| 
 | n i=1 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | − (x)2 = : | ||||
| визначимо | 
 | 
 | за | формулою | 
 | 
 | Dâ = x 2 | ||||||||
| x 2 = (7 + 28 + 36 +16 + 25)/ 25 = 4,48. Отже, Dâ | = 4,48 − (1,68)2 | = 1,6576. | |||||||||||||
Приклад 1.1.2 За заданим дискретним статистичним розподілом вибірки побудувати емпіричну функцію розподілу та полігон частот:
| xi | –6 | –4 | –2 | 2 | 4 | 6 | 
| Частоти ni | 5 | 10 | 15 | 20 | 40 | 10 | 
Розв’язання. Згідно з означенням та властивостями F * (x) має такий
PDF создан испытательной версией pdfFactory Pro www.pdffactory.com
 
| 
 | 
 | 6 | 
 | 
| вигляд (рис. 1.1): | 
 | 
 | 
 | 
| ì0 | 
 | x £ -6, | |
| ï | 0,05 | - 6 < x £ -4, | |
| ï | |||
| ï | 0,15 | - 4 < x £ -2, | |
| ï | |||
| F (x) = í | 0,3 | - 2 | < x £ 2, | 
| ï0,5 | 2 | < x £ 4, | |
| ï | 
 | 4 | < x £ 6, | 
| ï 0,9 | |||
| ï | 1, | 
 | x > 6. | 
| î | 
 | ||
| 
 | 
 | 
 | 
 | F*(x) | 
 | 
 | 
 | 
| 
 | 
 | 
 | 1 | 
 | 
 | 
 | 
 | 
| –6 | –4 | –2 | 0 | 2 | 4 | 6 | хі | 
| Рисунок 1.1 – Емпірична функція розподілу | 
 | ||||||
| Полігон частот зображено на рис. 1.2. | 
 | 
 | 
 | 
 | |||
| 
 | 
 | 
 | ni | 
 | 
 | 
 | 
 | 
| 
 | 
 | 
 | 40 | 
 | 
 | 
 | 
 | 
| 
 | 
 | 
 | 10 | 
 | 
 | 
 | 
 | 
| –6 | –4 | –2 | 0 | 2 | 4 | 6 | xi | 
| 
 | |||||||
| Рисунок 1.2 – Полігон частот | 
 | 
 | |||||
Приклад 1.1.3 За заданим інтервальним статистичним розподілом вибірки побудувати функцію F * (x) та гістограму частот:
| Інтервал | 0-4 | 4-8 | 8-12 | 12-16 | 16-20 | 20-24 | 
| ni | 5 | 7 | 7 | 4 | 1 | 1 | 
PDF создан испытательной версией pdfFactory Pro www.pdffactory.com
 
| 
 | 
 | 
 | 
 | 7 | 
 | 
 | 
 | 
| Розв’язання. Гістограма зображена на рис. 1.3, а F * (x) – на рис. 1.4. | |||||||
| 
 | hi | 
 | 
 | 
 | 
 | 
 | 
 | 
| 
 | n | 
 | 
 | 
 | 
 | 
 | 
 | 
| 7 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
| 1 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
| 0 | 4 | 8 | 12 | 
 | 16 | 20 | xi | 
| 
 | 24 | ||||||
| 
 | Рисунок 1.3 – Гістограма частот | ||||||
| 
 | F (x) | 
 | 
 | 
 | 
 | 
 | 
 | 
| 1 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
| 0,65 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
| 0,4 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
| 0,1 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
| 0 | 4 | 8 | 12 | 16 | 20 | 24 | xi | 
| 
 | |||||||
Рисунок 1.4 – Емпірична функція розподілу
Приклад 1.1.4 Із генеральної сукупності зроблено вибірку обсягом n=32. Здобуто такі реалізації випадкової величини: 2,2; 7,1; 6,3; 3,9; 5,9; 5,6; 5,6; 4,7; 7,9; 3,2; 6,1; 5,5; 6,4; 6,0; 6,9; 4,7; 6,4; 6,9; 6,7; 7,9; 4,2; 6,7; 6,0; 9,2; 5,5; 6,5; 3,5; 4,9; 7,2; 4,9; 8,9; 5,7. Скласти інтервальний
ряд і знайти x, Dâ .
Розв’язання. Для побудови інтервального ряду розбиваємо область реалізацій на 7 інтервалів з однаковими довжинами інтервалів:
| 
 | max(x )− min(x ) | 
 | 
 | 9,2 − | 2,2 | 
 | |||
| x = | i | i | i | i | ; | x = | =1. Частоти кожного інтервалу | ||
| 
 | 
 | 7 | 
 | 7 | 
 | ||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||
знайдемо, визначивши для кожного значення інтервал. Якщо значення xi потрапляє на межу, то збільшуємо на 1 частоту нижнього інтервалу.
PDF создан испытательной версией pdfFactory Pro www.pdffactory.com
 
8
| Інтервал 2,2-3,2 3,2-4,2 4,2-5,2 5,2-6,2 6,2-7,2 7,2-8,2 8,2-9,2 | |||||||
| Частота | 2 | 3 | 4 | 9 | 10 | 2 | 2 | 
Для обчислення числових характеристик розподілу перейдемо до статистичного ряду. Для цього складемо таблицю, в якій запишемо
| середини інтервалів u j = | x j−1 + x j | і їхні частоти mj . | 
 | 
 | 
 | ||||||||||||||
| 2 | 
 | 
 | 
 | ||||||||||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||
| 
 | u j | 
 | 2,7 | 
 | 
 | 3,7 | 
 | 4,7 | 
 | 5,7 | 6,7 | 7,7 | 8,7 | 
 | |||||
| 
 | mj | 
 | 2 | 
 | 
 | 
 | 3 | 
 | 4 | 
 | 9 | 10 | 2 | 2 | 
 | ||||
| 
 | 1 | k | 
 | 1 | 
 | (2,7 ×2 + 3,7 ×3 + 4,7 ×4 + 5,7 ×9 + 6,7 ×10 + 7,7 ×2 + 8,7 ×2) = 5,825 | |||||||||||||
| x = | å x j m j | = | 
 | ||||||||||||||||
| n | 
 | ||||||||||||||||||
| 
 | j=1 | 32 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||||||
| D = | 1 | (2,72 ×2+3,72 | ×3+4,72 ×4+5,72 ×9+6,72 ×10+7,72 ×2+8,72 ×2)-(5,825)2 » 2,172 | ||||||||||||||||
| 
 | |||||||||||||||||||
| â | 32 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||||
1.2 Точкові та інтервальні оцінки параметрів розподілу
Оцінка параметра розподілу сукупності θ у загальному випадку є
випадковою величиною, яка визначається за даними вибірки і використовується замість невідомого значення параметра, який потрібно оцінити. Оцінка називається обґрунтованою, якщо вона збігається за ймовірністю до відповідного параметра при n → ∞. Оцінка називається незміщеною, якщо її математичне сподівання збігається зі значенням параметра. У разі вибору з усіх відомих незміщених обґрунтованих оцінок певної оцінки потрібно зазначити критерій, за яким зроблено вибір. Найчастіше застосовується критерій, який полягає у виборі оцінки, що має найменшу можливу дисперсію. Така оцінка називається ефективною.
Нехай маємо точкову оцінку θ параметра θ . Знайдемо для
| параметра інтервальну оцінку, скориставшись умовою P(θ) −θ < )= γ. | |
| В такому разі | називається точністю оцінки, а γ – її надійністю. | 
Тоді інтервальна оцінка (довірчий інтервал) для параметра θ набуває вигляду (θ − ;θ + ). Параметр θ – це випадкова величина, надійність
γ можна розглядати як імовірність того, що довірчий інтервал покриває дійсне значення параметра. Величини i γ тісно зв’язані з
об’ємом вибірки n. Якщо задати дві з цих величин, то можна знайти третю. Для цього потрібно знати закон розподілу для
θ = ϕ(X1,X2,...,Xn ).
Нехай ця величина розподілена за нормальним законом. Побудуємо інтервальну оцінку математичного сподівання a = xген за
PDF создан испытательной версией pdfFactory Pro www.pdffactory.com
 
| 
 | 
 | 
 | 
 | 
 | 9 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||||
| значенням вибіркового середнього | 
 | в | для двох випадків: | 
 | 
 | 
 | ||||||||||
| x | 
 | 
 | 
 | |||||||||||||
| 1. Якщо відомо середнє квадратичне відхилення σ , то довірчий | ||||||||||||||||
| інтервал | для | 
 | математичного | сподівання | має | вигляд: | ||||||||||
| xB − | t × | σ | 
 | < a < xB | + | t × | σ | 
 | , де n – об’єм вибірки, | t – таке значення | ||||||
| 
 | 
 | 
 | 
 | 
 | 
 | |||||||||||
| n | 
 | |||||||||||||||
| 
 | 
 | 
 | 
 | 
 | n | 
 | γ , тобто | 
 | 
 | 
 | ||||||
| аргументу функції Лапласа Ф(t) , для якого Ô(t) = | = t ×σ . | |||||||||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 2 | 
 | n | 
 | 
2. Параметр σ нормального закону розподілу ознаки X генеральної сукупності невідомий. У цьому випадку інтервальна
оцінка параметра a = xген із заданою надійністю γ визначається за
формулою: xв − < a < xв + , де D = tγ × S , S – точкова оцінка
 n
 n
параметра σ , виправлене вибіркове середнє квадратичне відхилення tγ = t(γ ,n) – критична точка розподілу Стьюдента, значення якої
можна знайти з таблиць по відомим n і γ .
Для оцінки генерального середнього квадратичного відхилення σ при заданій надійності γ можна побудувати довірчий інтервал s × (1- q) < σ < s × (1+ q), де q = q(n,γ ) – значення, що визначається
таблицями.
Приклад 1.2.1 Знайти довірчий інтервал для математичного сподівання нормально розподіленої випадкової величини, якщо об’єм вибірки n = 49, x В = 2,8 , σ =1,4 , а довірча ймовірність γ = 0,9.
| Розв’язання. | Визначимо | t , при якому Ф(t) = 0,9 : 2 = 0,45: | ||||||||
| t = 1,645 . Тоді 2,8 − | 1,645×1,4 | < a < 2,8 + | 1,645 | × | 1,4 | , або 2,471 < a < 3,129 . | ||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||||
| 49 | 
 | 14 | ||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | |||||
Приклад 1.2.2 Дана вибірка значень нормально розподіленої випадкової величини: 2, 3, 3, 4, 2, 5, 5, 5, 6, 3, 6, 3, 4, 4, 4, 6, 5, 7, 3, 5.
Знайти с довірчою ймовірністю γ = 0,95 границі довірчих інтервалів
для математичного сподівання та дисперсії.
Розв’язання. Об’єм вибірки n = 20 . Знайдемо x В = 4,25 , S = 1,37 . За таблицями визначимо t(0,95; 20) = 2,093 ; q(0,95; 20) = 0,37 . Тоді
PDF создан испытательной версией pdfFactory Pro www.pdffactory.com
 
10
| 4,25 - | 2,093×1,37 | < a < 4,25 + | 2,093 | ×1,37 , 3,64 < a < 4,86 – довірчий інтервал | ||||
| 
 | 
 | 20 | 
 | 
 | 
 | 20 | 
 | 
 | 
| для | математичного | сподівання; | 1,37(1−0,37) <σ <1,37(1+0,37) ; | |||||
0,86 < σ <1,88; 0,74 < D = σ 2 < 3,52 – довірчий інтервал для дисперсії.
1.3 Перевірка статистичних гіпотез
Статистичною називається гіпотеза, яка стосується виду або параметрів розподілу випадкової величини і яку можна перевірити на підставі результатів спостереження у випадковій вибірці. Перевіряючи статистичні гіпотези за результатами випадкової вибірки, завжди ризикують прийняти хибне рішення. Але в такому випадку можна обчислити ймовірність прийняття хибного рішення і, якщо вона мала, ризик помилки буде невеликим. Помилки, яких можна припуститися, бувають двох родів. Помилка першого роду полягає в тому, що перевірювана гіпотеза H0 відхиляється, тоді як вона правильна.
Помилка другого роду полягає у тому, що гіпотеза H0 приймається, тоді як вона хибна, а правильною є деяка гіпотеза H1. Ця гіпотеза, яка протиставляється гіпотезі H0 , називається альтернативною.
Статистичні гіпотези поділяються на прості і складні. Проста гіпотеза однозначно визначає закон розподілу випадкової величини. Для побудови статистичного критерію, який дає змогу перевірити деяку гіпотезу H0 , необхідно вибрати статистичну характеристику
гіпотези – деяку вибіркову функцію, визначити допустиму ймовірність помилки першого роду α (рівень значущості), сформулювати альтернативну гіпотезу H1, знайти критичну область для статистичної характеристики, щоб мінімізувати ймовірність помилки другого роду. В критичній області гіпотеза H0 відхиляється на користь гіпотези H1. Критична область визначається так, щоб імовірність потрапляння в неї статистичної характеристики за умови, що правильна гіпотеза H0 , дорівнювала α – заданому рівню
значущості. Крім того, необхідно, щоб ймовірність помилки другого роду була мінімальною.
Статистичні гіпотези поділяються на параметричні і
PDF создан испытательной версией pdfFactory Pro www.pdffactory.com
