
- •6. Вибірковий метод. Статистична перевірка гіпотез
- •6.1. Суть вибіркового спостереження
- •6.2. Вибіркові оцінки середньої та частки
- •Вік і потенційна професійна мобільність робітників
- •6.3. Різновиди вибірок
- •6.4. Визначення обсягу вибірки
- •Достатній обсяг вибірки для вивчення малопоширених явищ
- •6.5. Статистична перевірка гіпотез
- •Ймовірність ризиків помилкових рішень при перевірці гіпотез
- •Основні категорії та поняття
- •7. Методи аналізу взаємозв’язків
- •7.1. Види взаємозв’язків
- •Залежність фондомісткості видобутку вугілля від глибини розробки вугільних пластів
- •7.2. Регресійний аналіз
- •Розрахунок параметрів лінійної регресії, теоретичних рівнів і залишкових величин
- •7.3. Оцінка щільності та перевірка істотності кореляційного зв’язку
- •Розрахунок загальної дисперсії фондомісткості видобутку вугілля (
- •Розрахунок факторної дисперсії фондомісткості продукції ()
- •7.4. Рангова кореляція
- •Розрахунок коефіцієнта рангової кореляції Спірмена
- •7.5. Оцінка узгодженості варіації атрибутивних ознак
- •Розподіл респондентів за віком і схильністю до ризику
- •Критичні значення
- •Розподіл пацієнтів клініки за результатами легеневих проб
- •Основні категорії та поняття
6.4. Визначення обсягу вибірки
У процесі проектування вибіркових спостережень визначають мінімально достатній обсяг вибірки, при якому вибіркові оцінки репрезентували б основні властивості генеральної сукупності. Занадто великий обсяг вибірки потребує зайвих витрат, а занадто малий призведе до збільшення похибки репрезентативності. Теорія вибіркового методу дає змогу науково обгрунтувати достатній обсяг вибірки.
Згідно з формулою граничної похибки
вибірки
обсяг вибірки
,
тобто достатній обсяг вибірки залежить від ступеня однорідності генеральної сукупності, ймовірності, з якою гарантується результат, і необхідної точності вибіркової оцінки. Практичне використання цієї формули ускладнюється через відсутність оцінки варіації.
Як правило,
використовують оцінки
за аналогією, тобтооцінки,
отримані в попередніх або аналогічних
обстеженнях. Наприклад, на лісовому
масиві в 400 га визначається загальний
запас деревини. Пробні ділянки по 0,1 га.
За даними попередніх обстежень середнє
квадратичне відхилення виходу деревини
з 0,1 га становить 3 м3. Скільки
пробних ділянок необхідно обстежити,
щоби похибка вибірки з імовірністю
0,954 не перевищила 1 м3?
При t= 2 достатній обсяг вибірки
ділянок.
Якщо аналогічні обстеження не проводились
або в генеральній сукупності відбулися
істотні зміни, точнішу характеристику
варіації дають пробні обстеження. Коли
відомі межі варіації ознаки,
розраховують за правилом «трьох сигм»,
тобто
(
).
Для альтернативної ознаки, коли відсутня будь-яка інформація про структуру сукупності, вважають, що частка р= 0,5, отже,s2= = 0,5×0,5 = 0,25.
Коли розрахований обсяг вибіркової
сукупності nперевищує 5% обсягу
генеральної сукупностіN, його
коригують на «безповторність вибірки».
Скоригований обсяг вибірки.
Щодо точності вибіркового обстеження,
то доцільно контролювати відносну
граничну похибку
.
У такому разі мірою варіації ознаки є
коефіцієнт варіації
:
.
Наприклад, проектується вибіркове
опитування робітників компанії (N= 3200) щодо середнього розміру вільного
часу. За аналогічними обстеженнями в
інших компаніях=
20%. Мінімально необхідний обсяг вибірки,
при якому з імовірністю 0,954 гарантується
похибка вибірки в обсязі не більш як
2,5%,
,
скоригований на кінцевість сукупності обсяг вибірки
.
Необхідний обсяг вибірки можна розрахувати також на основі відносної похибки вибірки для частки:
.
Очевидно, чим більша частка р, тим менший обсяг вибірки забезпечить необхідну точність результатів обстеження, і навпаки: для малих значеньробсяг вибірки збільшується.
У табл. 6.2 наведено обсяги вибірки, які забезпечують точність результатів обстеження малопоширених явищ з відносною стандартною похибкою, меншою за 10 %.
Таблиця 6.2
Достатній обсяг вибірки для вивчення малопоширених явищ
р |
q / р |
n
при
|
0,20 |
4,0 |
400 |
0,15 |
5,7 |
570 |
0,12 |
7,3 |
730 |
0,10 |
9,0 |
900 |
0,09 |
10,1 |
1010 |
0,08 |
11,5 |
1150 |
У практиці вибіркових обстежень одночасно вивчаються кілька ознак. Якщо бажаний ступінь точності визначати для кожної ознаки окремо, то результатом розрахунків стане низка значень обсягу вибірки. З метою їх узгодження використовуть або максимальний обсяг n(і тоді решта ознак оцінюється «надто точно»), або обсяг головної ознаки.