
- •1. Перед вами – результат регресії індексу споживчих цін (у відсотках) на грошову масу (у трильйонах ієн).
- •4. Випробування 16-ти шин певної марки показали, що середній термін служби шин у вибірці – 32 тисячі кілометрів, а середньоквадратичне відхилення вибірки – 6,4 тисячі кілометрів.
- •Розв’язок
- •5. Відповіді так/ні. Відповідаючи “ні”, надавайте коротке пояснення або графік.
- •6. Для кожного з 10 випадково вибраних студентів заміряно час (х) у годинах, що він/вона витратив/ла на підготовку до іспиту. Отримано такі дані:
- •10. Студент американського університету витрачає на придбання підручників в середньому 380 доларів на рік. Розподіл цих витрат нормальний з середнім квадратичним відхиленням 50 доларів.
- •11. Термін дії певних приладів розподілений нормально з середнім 1200 годин та середнім квадратичним відхиленням 400 годин. Випадково вибрали 9 приладів.
10. Студент американського університету витрачає на придбання підручників в середньому 380 доларів на рік. Розподіл цих витрат нормальний з середнім квадратичним відхиленням 50 доларів.
а) знайдіть імовірність того, що випадково вибраний студент витратить на підручники менше 400 доларів на рік.
б) знайдіть імовірність того, що випадково вибраний студент витратить на підручники більше 360 доларів на рік.
в) знайдіть імовірність того, що випадково вибраний студент витратить на підручники від 360 до 400 доларів на рік.
Розв’язок. Аналогічно до задачі 3.
a) P(X < 400) = P(Z < (400-380)/50) = P(Z< 0.4) = 0.6554
б) P(X > 360) = P(Z > (360-380)/50) = P(Z > -0.4) = P(Z < 0.4) = 0.6554
в) Використовуючи попередні результати, P(360 < X < 400) = 2*0.6554 – 1 = 0.3108
11. Термін дії певних приладів розподілений нормально з середнім 1200 годин та середнім квадратичним відхиленням 400 годин. Випадково вибрали 9 приладів.
а) який середній термін дії приладів у вибірці?
б) якою є варіація середнього вибіркового значення?
в) яким є стандартне відхилення середнього вибіркового значення?
г) яка імовірність того, що в середньому термін дії 9-ти вибраних приладів становитиме менше, ніж 1050 годин?
Розв’язок. Для цього завдання нам знову потрібні властивості вибіркових величин (див. рамку).
а) E(X) = 1200
б) var(Х) = σ2/n = 4002/9
в
)
σх
= √var(X)
= 400/3 ≈ 133.3
г) P(X < 1050) = P(Z < (1050-1200)/133.3) = P(Z < -1.125) = P(Z > 1.125) = 1 – Φ(1.125) = 1-0.8697 = 0.1303
12. З двох генеральних сукупностей, що розподілені нормально та мають однакові дисперсії, зроблено по вибірці. Розмір вибірки з першої ГС n1=10, з другої – n2=15. Знайдіть k таке, щоб P(S12/S22 ≤ k) = 0.95. (S12 та S22 – вибіркові дисперсії першої та другої вибірки відповідно).
Розв’язок. Для знаходження параметра нам потрібно знати функцію розподілу випадкової величини S12/S22.
Скористаємося тим, що у вибірці розміру n (n-1)S2/ σ2 ~ χ2n-1.
Перетворимо вираз S12/S22: домножимо його чисельник та знаменник на σ2 (спільна дисперсія двох генеральних сукупностей), а потім домножимо чисельник на (n1 - 1)/(n1 -1) = 1, а знаменник на (n2 -1)/(n2 -1) = 1 (зрозуміло, що в результаті цих перетворень первісний вираз не зміниться). Отримаємо:
S12 σ2(n1 - 1)/(n1 -1) (n1 - 1) S12/ σ2/(n1 -1) χ2n1-1/(n -1)
---------------------- = ------------------------ = --------------- ~ F(n1-1, n2-1).
S22 σ2(n2 -1)/(n2 -1) (n2 -1) S22/ σ2/(n2 -1) χ2n2-1/(n2 -1)
Тобто наша випадкова величина (S12/S22) має розподіл Фішера з n1-1 та n2-1 ступенями вільності. Відшукуємо у таблиці розподілу значення, що відповідає 9 ступеням вільності чисельника та 14 – знаменника. Це число – 2,65. Отже, k = 2,65.
13. Завод виробляє цеглу. З багаторічних спостережень відомо, що вага цеглин має нормальний розподіл із середньоквадратичним відхиленням 0,12 кг. Із сьогоднішньої партії випадково вибрано 16 цеглин. Їхня середня вага - 4,07 кг.
а) знайдіть 95%-й інтервал довіри для середньої ваги усіх цеглин, вироблених сьогодні.
б) не виконуючи розрахунків, скажіть, чи 90%-й інтервал довіри для середньої ваги генеральної сукупності буде ширшим, вужчим, чи таким самим, як у (а)
в) вирішено, що завтра буде взято вибірку з 20 цеглин. Не виконуючи розрахунків, скажіть, чи 95%-й інтервал довіри для середньої ваги цеглин завтрашнього випуску буде ширшим, вужчим, чи таким самим, як у (а)
г) вам повідомили, що насправді середньоквадратичне відхилення генеральної сукупності складає 0,15 кг. Не виконуючи розрахунків, скажіть, чи правильно розрахований 95%-й інтервал довіри для середньої ваги цеглин буде ширшим, вужчим, чи таким самим, як у (а)
Розв’язок.
Оскільки нам відоме середньоквадратичне відхилення генеральної сукупності, використовуємо нормальний розподіл.
а) інтервал довіри розраховується за формулою X Z0.025*(/n) = 4.07 1.96*0.03
Отже, 95%-й інтервал довіри – (4,0112; 4,1288).
б) оскільки це 90%-й інтервал, він буде вужчим
в) оскільки вибірка більша, оцінки точніші, значить, інтервал довіри буде вужчим (переконайтесь, підставивши у формулу 20 замість 4).
г) якщо середньоквадратичне відхилення зростає, точність оцінок зменшується. Отже, інтервал довіри ширшає.
14. Відомо, що бали, отримані на тесті претендентами на роботу, мають середньоквадратичне відхилення 32,4. Випадково вибрано 9 тестів. Середній бал цих тестів - 187,9. На основі цієї інформації знайдено інтервал довіри - (165,8; 210) - для середнього балу усіх тестів. Знайдіть рівень довіри цього інтервалу.
Розв’язок. Тут також використовуємо нормальний розподіл.
Рівень довіри можна знайти з будь-якого із двох рівнянь:
187,9 - Z/2*(32,4/3) = 165,8 або 187,9 + Z/2*(32,4/3) = 210.
З другого рівняння Z/2 = 2,046. Цьому значенню відповідає імовірність 0,9796. Отже,
/2 = 1 - 0,9796 = 0.020364, звідси рівень довіри дорівнює 1 - = 0,9593 або 95,93%.
15. Крамницю цікавлять витрати студентів на одяг. Опитавши 9 студентів, менеджери дізналися, що вони в середньому витрачають 157,82 грн. на місяць. Середньоквадратичне відхилення вибірки – 38,89 грн. Припускаючи, що насправді витрати мають нормальний розподіл, знайдіть 95%-й інтервал довіри для середніх витрат усіх студентів на одяг.
Розв’язок. Оскільки нам відоме лише середньоквадратичне відхилення вибірки, використовуємо розподіл Стьюдента.
Інтервал довіри дорівнює X t8; 0.025*(S/n) = 157.82 2.306*(38.89/3) або (127,93; 187,71).
16. Фармацевтичну компанію цікавить відсоток домішок у її продукції – за стандартом, домішки мають складати не більше 3% маси препарата. Для певного виду пігулок відомо, що концентрація домішок у них має нормальний розподіл із середньоквадратичним відхиленням 0,4%. Випадково вибрано та досліджено 64 пігулки. Середній відсоток домішок у них склав 3,07%.
а) чи відповідають ці пігулки стандарту? Протестуйте із 5% рівнем значимості статистичну гіпотезу про те, що середня концентрація домішок менша або дорівнює 3%. Покажіть на графіку області прийняття та відхилення гіпотези.
б) знайдіть p-value для цього тесту
в) припустимо, ви сформулювали двосторонній тест: Н0: μ = 3%, На: μ 3%. Не виконуючи розрахунків, скажіть, чи буде p-value для цього тесту меншим, більшим або рівним знайденому у (б). Використовуйте графік.
г) чому у цій задачі одностороння альтернативна гіпотеза більш придатна, ніж двостороння?
Розв’язок.
а) оскільки нам відоме середньоквадратичне відхилення ГС, використовуємо нормальний розподіл. Розрахункова тестова статистика
Zрозр = (3.07 – 3)/(0.4/8) = 1.4
Критичне значення знаходимо з таблиці нормального розподілу. Імовірності 0,05 відповідає значення стандартної нормальної величини 1,64.
1,64 > 1.4, отже, не можемо відхилити Н0.
б) p-value – це імовірність, яка відповідає площі, що знаходиться в даному випадку справа від розрахункової тестової статистики (в той регіон має потрапити розрахункова статистика для того, щоб ми могли відхилити нульову гіпотезу). З нормального розподілу знаходимо
p-value = 1 – Ф(1,4) = 1 – 0,9192 = 0,0808 або 8,08%.
в) для двосторонньої гіпотези p-value вдівічі більше, оскільки для відхилення гіпотези розрахункова статистика має бути більшою за критичне значення за модулем.
Для кращого розуміння покажіть описані вище імовірності на графіках.