
2.2 Проведення вибіркового спостереження
Для успішного проведення вибіркового спостереження необхідно досконально визначити його план з точки зору сукупності, інструментарію, одиниць, методи здійснення та обсягу вибірки. Якщо одиницями вибірки є сім'ї (домогосподарства), необхідно сформулювати робоче поняття сім'ї. Слід описати процедури для випадків, коли в квартирі ніхто не живе, і у випадку повторних дзвінків респондентам, яких не було вдома. Кожне рішення, передбачене планом вибіркового спостереження, повинно підкріплюватися відповідної детальною інформацією.
Приклад: вибіркове спостереження для Міністерства туризму
Мета телефонного опитування, проведеного для Міністерства туризму штату Флорида, - це вивчення поведінки жителів штату, що знаходяться в туристичних поїздках. Сім'ї стратифікована за місцем за місцем проживання на північний, центральний і південний район Флориди. Для відбору цих сімей використовували випадковий комп'ютерний набір телефонних номерів. З кожної сім'ї вибиралися кандидати, які відповідатимуть чотирьом критеріям: 1) вік 25 років або старші; 2) проживає у Флоріді як мінімум 7 місяців на рік; 3) прожив у Флориді, щонайменше, два роки; 4) отримував водійські права у Флориді .
Для відбору одного респондента з кожної сім'ї скористалися методом випадкових чисел, щоб отримати представницьку вибірку з індивідуумів, що відповідають заданим критеріям. Перераховано всі члени сім'ї, які відповідатимуть чотирьом критеріям, з них вибраний той, хто наступним відсвяткує свій день народження. Для встановлення контакту з цією людиною потрібен ряд повторних дзвінків. Визначено такі етапи формування плану вибіркового спостереження:
1. Досліджувана сукупність: повноліття, що відповідає чотирьом критеріям (елемент сукупності) в сім'ї з працюючим телефоном (одиниця вибірки) в штаті Флорида (територія) у період проведення опитування (час).
2. Основа вибірки: комп'ютерна програма, випадковим чином генерує номери телефонів.
3. Одиниця вибірки: номери працюючих телефонів.
4. Метод проведення вибіркового спостереження: стратифікована вибірка. Досліджувану сукупність розподілили за географічною ознакою на три райони Флориди: північний, центральний і південний.
5. Обсяг вибірки: 868.
6. Здійснення: поділити вибірку на шари; скористатися комп'ютером для довільного набору телефонних номерів; перерахувати всіх членів сім'ї, які відповідають чотирьом критеріям; вибрати одного члена сім'ї методом наступного дня народження 5.
Таким чином, складання вибірки - дуже складна процедура, що включає безліч дій та етапів, на кожному з яких соціолог може допустити помилку. Рання помилка породжує наступні, наростає сніжний ком спотвореної інформації, який здатний паралізувати дослідження або звести його цінність до нуля. Саме тому важливим є вміння долати всі ці труднощі, несподіванки і неприємності.
Помилки вибіркового спостереження. При правильному проведенні вибіркового спостереження характеристики вибірки близькі до відповідних характеристик генеральної сукупності, але вони не збігаються. Пояснюється це наявністю помилки вибірки. Помилкою вибірки називаються деякі розходження характеристик генеральної та вибіркової сукупностей. Вона складається з помилок реєстрації та помилок репрезентативності. Помилками реєстрації називають такі, які виникають внаслідок отримання неточних або невірних відомостей від окремих одиниць сукупності із-за недосконалості вимірювальних приладів, недостатньої кваліфікації спостерігача, недостатньої точності розрахунку тощо. Помилки репрезентативності розділяють на систематичні та випадкові. Систематичні помилки репрезентативності виникають внаслідок особливостей прийнятої системи та обробки даних спостереження або з умов недотримання правил відбору у вибіркову сукупність. Вони мають тенденційний характер викривлення величини досліджуваної ознаки в бік її збільшення або зменшення. Такі помилки також повинні бути виключені. Випадкові помилки репрезентативності виникають перш за все через те, що вибіркова сукупність через її малий обсяг не завжди точно відтворює характеристики генеральної сукупності. Тому цей вид помилок є основним, і завдання вибіркового методу полягає в отриманні таких вибіркових характеристик , які б якомога точніше відтворювали характеристики генеральної сукупності, тобто давали найменші помилки репрезентативності. Теорія вибіркового методу полягає в знаходженні середньої величини помилки репрезентативності та можливих її меж при різних способах утворювання вибіркової сукупності. Для кожного конкретного вибіркового спостереження значення помилки репрезентативності здійснюється за відповідними формулами. Для узагальнюваної характеристики похибки вибірки розраховують середню похибку репрезентативності µ, її називають стандартом. Для вивчення середньої похибки репрезентативності власне випадкової і механічної вибірки застосовують певні формули (табл. 1.1). Таблиця 1.1 Середня похибка репрезентативності µ.
Спосіб відбору |
Визначення середньої |
Визначення частки |
Повторний |
|
|
Безповторний |
|
|
де
σ2
– середній квадрат відхилень у вибірці;
n – чисельність вибіркової сукупності;
N – чисельність генеральної сукупності;
- частка обстеженої частини вибіркової
сукупності;
-
необстежена частина генеральної
сукупності; W – частка одиниць, які мають
дану ознаку; 1- W – частка одиниць, які
не мають даної ознаки.
Без повторний
відбір гарантує більш точніші результати,
оскільки він виключає можливість
обстеження одних і тих самих одиниць
при відборі з генеральної сукупності.
Для узагальнюваної характеристики
похибки вибірки поряд із середньою
розраховують і граничну похибку вибірки.
Стверджувати, що дана генеральна середня
не вийде за межі середньої похибки
вибірки можна лише за певним ступенем
імовірності.
Уразі вибіркового
спостереження гранична похибка
репрезентативності ∆ може бути більшою,
чи дорівнювати, або меншою від середньої
похибки репрезентативності µ . Тому
граничну похибку репрезентативності
обчислюють з певною ймовірністю Р,
якій відповідає t-разове значення µ. З
уведенням показника кратності похибки
t формула граничної похибки репрезентативності
має вигляд:
де
t – коефіцієнт довіри, який залежить
від імовірності, з якою гарантується
значення граничної похибки вибірки.
Формула граничної похибки вибірки
випливає з основних положень теорії
вибіркового методу, сформульованих у
теоремах ймовірностей, що відображають
закон великих чисел.
Однією з головних
теорем, які покладено в основу теорії
вибіркового методу. є теорема П.Л.
Чебишева, за допомогою якої він довів,
що імовірністю, скільки завгодно близької
до одиниці, можна стверджувати, що при
достатньо великому числі незалежних
спостережень вибіркова середня буде
мало відрізнятися від генеральної
середньої при проведенні повторної
вибірки.
Академік А.А. Марков довів
збереження цієї умови для залежних
спостережень (безповторної вибірки).
Академік А. М. Ляпунов дослідив, що
ймовірність відхилень вибіркової
середньої від генеральної середньої
при достатньо великому обсязі вибірки
та обмеженій дисперсії генеральної
сукупності підпорядковується закону
нормального розподілу. Ймовірність цих
відхилень при різних значеннях t
визначається за формулою:
Значення цього інтеграла при різних
значеннях t табульовані і наводяться в
спеціальних таблицях, наприклад:
t
= 1; Р(∆≤µ) = 0,683
t = 2; Р(∆≤µ) =
0,954
t = 3; Р(∆≤µ) = 0,997
t = 4;
Р(∆≤µ) = 0,999
Ці показники означають,
що з імовірністю 0,683 можна стверджувати,
що гранична похибка вибірки не перевищує
µ, тобто в 68,3% випадків похибка
репрезентативності не виходить за межі
±µ. Інакше, в 683 випадках із 1000 похибка
репрезентативності не перевищує одного
значення середньої похибки. З імовірністю
0,954 можна стверджувати, що похибка
репрезентативності не перевищує 2 ±µ,
з імовірністю 0,997 – не перевищить 3±µ.
З імовірністю 0,999, тобто дуже близької
до одиниці, можна очікувати, що різниця
між вибірковою і генеральною середніми
на перевищить 4±µ.
Гранична похибка
вибірки розраховується за вибірковим
спостереженням по-різному, залежно від
видів і способів відбору. Вона дає
можливість встановити, в яких межах
лежить значення генеральної середньої
або частки.
Із теореми Чебишева
знаходять, що
і
Теорема
Бернулі розглядає похибку вибірки для
альтернативної ознаки. Стверджується,
що при достатньо великому обсязі вибірки
в міру його збільшення ймовірність
відхилення між частками ознак у вибірковій
і генеральній сукупностях наближатиметься
до одиниці. Тобто, з імовірністю, скільки
завгодно близькою до одиниці, можна
стверджувати, що при достатньо великому
обсязі вибірки вибіркова частка мало
відрізняється від її частки в генеральній
сукупності.
Додаючи граничну похибку
вибірки до вибіркової частки і віднімаючи
її від неї, знаходять межі генеральної
частки:
Таким
чином ми можемо записати формули для
обчислення граничної похибки власне
випадкової і механічної вибірки (табл.
1.2),
Табл.. 1.2
Граничні похибки
вибірки.
Спосіб відбору |
Визначення середньої |
Визначення частки |
Повторний |
|
|
Безповторний |
|
|
де
∆х
– гранична похибка вибірки середньої;
∆р
– гранична похибка вибірки для частки.
За допомогою формул граничної похибки
вибірки можна визначити:
1)
довірчі межі генеральної і середньої
частки з певною ймовірністю;
2)
ймовірність того, що відхилення між
вибірковими і генеральними характеристиками
не перевищує визначену величину;
3)
необхідну чисельність вибірки, яка із
заданою ймовірністю забезпечує очікувану
точність вибіркових показників.
Під
час розрахунків вибіркових характеристик
інколи треба визначити ймовірності
допуску певної похибки , тобто відхилення
від відповідних характеристик генеральної
сукупності не більше, ніж на певне задане
значення, яке знаходять за формулою
граничної похибки.
Під час вибіркового
спостереження важливо правильно
визначити необхідну чисельність обсягу
вибірки, яка з відповідною ймовірністю
забезпечує точність результатів
спостереження. Надмірна чисельність
вибірки призводить до затягнення строків
дослідження, зайвої втрати часу і коштів,
недостатня ж дає результати з великою
похибкою репрезентативності.
Чисельність
вибірки залежить від таких факторів:
◊
варіації досліджуваної ознаки. Чим
більша варіація, тим більшою має бути
чисельність вибірки і навпаки;
◊
розміру можливої граничної похибки
вибірки. Чим менший розмір можливої
похибки, тим більшою має бути чисельність
вибірки. За існуючим правилом, якщо
похибку потрібно зменшити в три рази,
то чисельність вибірки збільшують в
дев’ять раз;
◊
значення ймовірності, з якою гарантуватимуть
результати вибірки. Чим більша ймовірність,
тим більша має бути чисельність вибірки;
◊
способу вибору одиниць у вибіркову
сукупність.
Визначення необхідної
чисельності вибірки залежить від
алгебраїчного перетворення формул
граничної похибки вибірки при різних
способах відбору.
Для власне випадкової
і механічної вибірки виведення формул
необхідної чисельності вибірки
здійснюється в такий спосіб. З формули
граничної похибки вибірки для середньої
при повторному відборі
потрібно
визначити чисельність вибірки n. Для
цього обидві частини даного рівняння
підносимо до квадрата і отримуємо
,
звідки необхідна чисельність вибірки
.
Дана формула є математичним
підтвердженням залежності чисельності
вибірки від граничної похибки, величини
коефіцієнта довіри t і варіації
(дисперсії).
Так само виводять формули
необхідної чисельності вибірки в разі
обчислення частки ознаки при повторному
і безповторному відборах (табл. 1.3).
табл. 1.3
Чисельність вибірки n.
Спосіб відбору |
Визначення середньої |
Визначення частки |
Повторний |
|
|
Безповторний |
|
|
Коли
відбір одиниць здійснюється з окремих
типово однорідних груп, виділених за
відповідною ознакою, варіації групових
середніх немає, і похибка типової вибірки
залежить від середньої величини з
групових дисперсій. А тому при типовому
відборі в формулах похибок вибірки
замість загальної дисперсії слід
використовувати середню з групових
для
середньої
-
для частки.
Отже, граничну похибку
вибірки при типовому відборі розраховують
за допомогою певних формул (табл. 1.4).
табл. 1.4
Гранична похибка вибірки
∆.
Спосіб відбору |
Визначення середньої |
Визначення частки |
Повторний |
|
|
Безповторний |
|
|
Знайти
необхідну чисельність вибірки за типовим
відбором можна в такий спосіб. Спочатку
визначають загальну чисельність вибірки
за формулою
-
для повторного відбору і
-
для безповторного відбору, після чого
здійснюється відбір одиниць кожної
групи методом, який враховує чисельність
одиниць у кожній групі і варіацію
досліджуваної ознаки.
Найпоширенішим
способом серійного відбору є такий, за
якого утворені в генеральній сукупності
і відібрані вибіркою серії (гнізда)
однакові за обсягом. Очевидно, що в разі
серійної вибірки, яка передбачає суцільне
спостереження одиниць у відібраних
серіях, похибка вибірки залежатиме не
від числа обстежених одиниць сукупності,
а від кількості відібраних серій. Похибка
вибірки залежатиме не від варіації
ознаки в усій сукупності, а від варіації
серійних середніх, яка вимірюється
міжсерійною (між груповою) дисперсією
δ2
(табл. 1.5), показниками: S – число серій
у генеральній сукупності; s – число
відібраних серій.
табл. 1.5
Гранична
помилка ∆ серійної вибірки.
Спосіб відбору |
Визначення середньої |
Визначення частки |
Повторний |
|
|
Безповторний |
|
|
Необхідну
чисельність вибірки в разі серійного
відбору визначають як відбір певної
кількості серій, які забезпечують з
відповідною ймовірністю потрібну
точність результатів дослідження.
Для
повторного відбору необхідна чисельність
вибірки
,
а для безповторного -
.
У статистичні практиці вибіркове
спостереження з великих масивів
генеральної сукупності часто здійснюють
у вигляді комбінованої, ступінчастої
або кілька фазної вибірки. Вибіркова
сукупність у разі комбінованої вибірки
формується внаслідок ступінчастого
відбору.
Загальна похибка для
комбінованої вибірки складається з
похибок, які можливі на кожному ступені,
і визначається як корінь квадратний з
квадратів похибок відповідних вибірок.
Якщо серійну вибірку скомбінувати
власне випадковою або механічною, то
гранична похибка вибірки
Під
час застосування комбінованої вибірки
обов’язково потрібно знати склад
генеральної сукупності, а також скласти
обґрунтовану схему відбору одиниць за
ступенями.
У разі моментального
методу спостереження гранична похибка
частки визначається як для звичайної
повторної власне випадкової вибірки.
Вибір моментів здійснюють за схемою
механічної вибірки або за схемою власне
випадкової вибірки за таблицею випадкових
чисел. Другий спосіб доцільно застосовувати
в тих випадках, коли спостереження має
бути для об’єкта несподіваним, аби не
порушувати його звичайний трудовий
ритм.
Визначають чисельність моментних
спостережень за формулою похибки власне
випадкової повторної вибірки. Відбір
у моментних спостереженнях завжди
безповторний, однак формулу безповторного
відбору застосовувати не можна, оскільки
чисельність генеральної сукупності
моментів роботи визначити неможливо,
вона нескінченна, якщо момент спостереження
досить короткий. А тому необхідна
чисельність моментів спостереження
,
або якщо довірчу ймовірність Р =
0,954, тобто коефіцієнт довіри t = 2, тоді
.
В разі малих вибірок розподіл
вибіркових середніх і похибок вибірки
відрізняється від нормального. Тому
для оцінки результатів малої вибірки
використовують дещо змінені формули.
Середня похибка малої вибірки
,
де
;
n – 1 – число ступенів вільності
варіації, які вказують на кількість
різних можливих значень варіантів з їх
середньою арифметичною.
Аби зв’язати
середню похибку малої вибірки з граничною,
враховують те, що в разі недостатньо
великого обсягу вибірки стандартизована
різниця між вибіркою і генеральною
середньою має розподіл Стьюдента, а не
нормальний. У. Стьюдент винайшов закон
розподілу відхилень вибіркових середніх
від генеральної середньої для малих
вибірок і склав спеціальні таблиці, в
яких наведено значення t при невеликому
обсязі вибірки.
Малі вибірки
використовують переважно для оцінки
суттєвості (достовірності) різниць двох
вибіркових середніх.
Для оцінки
відмінності двох залежних вибіркових
середніх застосовують середню різницю.
Різновиди вибірок
Формування вибірки — не безладний процес. Ця дія виконується за певними правилами. Передусім визначається основа вибірки. У сукупностях, які складаються з «фізичних» елементів, одиниця основи може репрезентувати або окремий елемент сукупності, або певне їх угруповання. Наприклад, вивчається використання комбайнів. Загальна їх кількість N розподілена за М бригадами, кожна з них має Njn комбайнів із загального їх числа N, у другому — m бригад із загального їх числа M. комбайнів. Одиницею основи вибірки може бути комбайн або бригада. Відповідно формується вибіркова сукупність: у першому випадку вибирається
Найпростішою основою вибірки є перелік елементів генеральної сукупності, пронумерований від 1 до N. Простими вважаються також набори звітів, анкет, карток тощо.
На практиці досліджувані сукупності мають, як правило, не одну, а низку альтернативних основ для вибірки. Наукове обґрунтування та правильний вибір основи — перша передумова забезпечення репрезентативності результатів вибіркового спостереження.
Від основи вибірки залежить спосіб добору елементів сукупності для обстеження. Найчастіше використовують способи добору: простий випадковий, механічний, розшарований (районований), серійний.
Простий випадковий добір провадиться жеребкуванням або за допомогою таблиць випадкових чисел. Це класичний спосіб формування вибіркової сукупності, який передбачає попередню досить складну підготовку до формування вибірки. Для жеребкування на кожну одиницю генеральної сукупності необхідно заготувати відповідну фішку; при використанні таблиць випадкових чисел усі елементи цієї сукупності мають бути пронумеровані. У великих за обсягом сукупностях така робота здебільшого недоцільна, а часом і неможлива. Тому на практиці застосовуються інші різновиди випадкових вибірок.
Механічний добір. Основа вибірки — упорядкована множина елементів сукупності. Добір елементів здійснюється через рівні інтервали. Крок інтервалу обчислюється діленням обсягу сукупності N на передбачений обсяг вибірки n. Початковий елемент вибірки визначається як випадкове число всередині першого інтервалу, другий елемент залежить від початкового числа й кроку інтервалу. Так, для частки вибірки кроком інтервалу є число =, тобто у вибірку має потрапити кожний двадцятий елемент. Якщо початковий елемент — випадкове число 7, то другим елементом буде 7 + 20 = 27, третім — 27 + 20 = 47 і т. д.
Механічна вибірка порівняно з простою випадковою ефективніша, її простіше здійснити. Проте за наявності циклічних коливань значень ознаки, цикл коливань яких збігається з інтервалом, можливий зсув вибіркових оцінок. Похибку механічної вибірки обчислюють за формулою похибки безповторної вибірки.
Вивчаючи безперервні в часі процеси, зокрема технологічні (структури затрат робочого часу, використання виробничого устаткування), проводять моментні спостереження. Суть їх — у періодичній фіксації стану процесу на певні моменти часу, які вибирають за схемою випадкової або механічної вибірки (через певні інтервали часу).
На етапі підготовки моментних спостережень визначають перелік можливих варіантів стану процесу, наприклад перелік причин простоїв устаткування. Під час обстеження певної сукупності одиниць устаткування, скажімо, верстатів, у визначені моменти часу фіксується, працює r-й верстат чи ні (якщо ні, зазначаються причини простою). Припустимо, що в цеху працюють 10 верстатів і за 8-годинну зміну через кожні півгодини проводилась реєстрація використання цих верстатів. Було зроблено 160 записів (2 · 8 · 10), у 144 випадках зазначено, що верстат працював, у 16 — не працював. Частка працюючих верстатів становить 0,9, дисперсія частки — 0,9 × 0,1 = 0,09. Із імовірністю 0,954 гранична похибка вибірки , або 4,6%. Отже, частка працюючих верстатів за зміну становила не менш як 90 – 4,6 = 85,4%.
Щодо повноти охоплення елементів сукупності, то моментне спостереження суцільне, воно вибіркове впродовж часу, бо охоплює не весь час роботи устаткування, а лише певні моменти. У разі правильної організації моментні обстеження забезпечують досить точні результати швидко і з меншими витратами, ніж при суцільному спостереженні.
Розшарований (районований, типовий) добір — це спосіб формування вибірки з урахуванням структури генеральної сукупності. На відміну від простого випадкового та механічного добору, які проводяться в цілому по генеральній сукупності, розшарований передбачає її попередню структуризацію й незалежний добір елементів у кожній складовій. Обсягом розшарованої вибірки є сума частинних вибірок , тобто , де m — число складових (груп, типових районів тощо).
Похибку розшарованої вибірки обчислюють, використовуючи середню з групових дисперсій . Якщо сформовані групи об’єднують «схожі» елементи, а групові середні величини помітно різні, варіація ознаки в групах буде значно меншою, ніж по сукупності. У такому разі <, а отже, похибка розшарованої вибірки порівняно з простою випадковою чи механічною буде менша:
.
Для того щоб забезпечити більшу точність розшарованої вибірки, слід обґрунтувати ознаку розшарування сукупності, число складових частин m, обсяг частинних вибірок і спосіб добору. Зменшення варіації ознаки при розшаруванні сукупності можливе за умови, що ознака розшарування сукупності корелює з ознакою, характеристики якої оцінюються. ці ознаки співвідносяться як причина й наслідок.
Відповідно до правила розкладання дисперсій =– або Отже, розшарування сукупності зменшує похибку вибірки на частку (). Чим щільніший зв’язок між ознаками, тим помітніше зменшення похибки. При = 0,50 похибка вибірки зменшується вдвічі, при = 0,66 — утричі.
У практиці вибіркових спостережень застосовують різні способи визначення обсягу вибіркової сукупності n та її складових nj. Найпростіший з них, коли всі m груп подані однаковою кількістю елементів:
.
Проте застосування цього способу обмежене. Якщо чисельності груп у генеральній сукупності Nj дуже різні, може виникнути ситуація, коли nj > Nj.
Найчастіше застосовують пропорційний добір, який передбачає однакове для всіх складових представництво, тобто частки однакові й обсяг частинної вибірки залежить від обсягу відповідної складової сукупності:
Оптимальним щодо мінімізації похибки є добір, пропорційний до середнього квадратичного відхилення:
Очевидно, що обсяг вибірки залежить від рівня варіації ознаки в окремих складових генеральної сукупності. Однорідні групи подаються меншим числом елементів, неоднорідні — більшим. Відсутність даних про варіацію ускладнює практичну реалізацію такого способу вибірки.
Різновидом розшарованої вибірки є метод квот, коли обсяг частинних вибірок nj визначається завчасно. Цей спосіб поширений при вивченні громадської думки, ринку тощо. Так, при вивченні громадської думки тому, хто має брати інтерв’ю, установлюються квоти, наприклад обстежити двох фермерів-чоловіків віком 30—40 років, трьох мешканців міста віком 20—30 років і т. ін. В який спосіб «заповнити квоти», він вирішує сам. Метод квот не гарантує незсуненості вибіркових оцінок.
Серійна вибірка. Одиниця основи вибірки — серія елементів. Серії складаються з одиниць, які пов’язані або територіально (райони, селища), або організаційно (фірми, акціонерні товариства). Вибіркова сукупність серій формується за схемами механічної або простої випадкової вибірки. Дібрана серія розглядається як одне ціле, обстеженню підлягають усі без винятку елементи серії. При обчисленні похибки вибірки враховується міжсерійна варіація:
де d2 — міжсерійна дисперсія; m та М — число серій відповідно у вибірці та генеральній сукупності.
Похибка серійної вибірки буде меншою порівняно з похибкою простої випадкової чи механічної вибірки в тому разі, якщо серії більш-менш однорідні й варіація серійних середніх незначна. Зростання міжсерійної варіації призводить до збільшення похибки вибірки.
Використання того чи іншого способу формування вибіркової сукупності залежить від мети вибіркового обстеження, можливостей його організації та проведення. Іноді поєднуються різні способи добору: механічний і серійний, розшарований і механічний, випадковий і серійний.
Таке поєднання можливе в рамках багатоступеневої вибірки. Ступенів може бути два, три й більше. Кожний із них має свою, відмінну від інших основу вибірки. Відповідно поділяються й одиниці вибірки: першого ступеня, другого і т. ін. Повнота охоплення основи й схема добору одиниць на різних ступенях різняться.
Наприклад, сукупність містить K одиниць першого ступеня, які складаються з M одиниць другого ступеня, ті, у свою чергу, об’єднують Nj одиниць третього ступеня. Саме така триступенева вибірка застосовується при організації обстеження домогосподарств. Наприклад, у сільській місцевості одиниці першого ступеня — це райони області; одиниці другого ступеня — селища; одиниці третього ступеня — домогосподарства.
Отже, вибір елементів для безпосереднього обстеження здійснюється на останньому, третьому ступені формування вибіркової сукупності. Частка її відносно до генеральної сукупності залежить від часток вибірки на всіх ступенях. Якщо припустити, що до вибірки потрапив один з десяти районів (d1 = 0,10), у цих районах відібране кожне п’яте селище (d2 = 0,20), а у відібраних селищах обстежується 4% домогосподарств (d3 = 0,04), то частка вибіркової сукупності в генеральній становить:
тобто обстеженню підлягає 0,08% домогосподарств.
Багатоступенева вибірка значно зменшує витрати на обстеження й порівняно з іншими вибірками більш ефективна.
Якщо обстежують сукупність за двома й більше ознаками, які різняться варіацією, ефективною є багатофазна вибірка. Суть її в тому, що для різних ознак формуються вибіркові сукупності різного обсягу. На відміну від багатоступеневої вибірки багатофазна використовує для всіх ознак одну й ту саму основу вибірки, проте програма обстеження різна.
Вибіркові сукупності формуються поетапно — фазами. З генеральної сукупності утворюється первинна вибірка, а з первинної — підвибірка і т. д. На кожній наступній фазі обсяг підвибірки зменшується, а програма обстеження розширюється. Вибіркові оцінки кожної фази використовуються як додаткова інформація на наступних фазах, що підвищує точність результатів вибіркового обстеження.
При організації багатофазної вибірки можливі комбінації різних способів і видів вибірки. Багатофазна вибірка поєднується з багатоступеневою, а також із суцільним спостереженням.
Визначення обсягу вибірки
У процесі проектування вибіркових спостережень визначають мінімально достатній обсяг вибірки, при якому вибіркові оцінки репрезентували б основні властивості генеральної сукупності. Занадто великий обсяг вибірки потребує зайвих витрат, а занадто малий призведе до збільшення похибки репрезентативності. Теорія вибіркового методу дає змогу науково обґрунтувати достатній обсяг вибірки.
Згідно з формулою граничної похибки вибірки обсяг вибірки
,тобто залежить від ступеня однорідності генеральної сукупності, імовірності, з якою гарантується результат, і необхідної точності вибіркової оцінки. Практичне використання цієї формули ускладнюється через відсутність оцінки варіації.
Як правило, використовують оцінки s2 за аналогією, тобто оцінки, отримані в попередніх або аналогічних обстеженнях. Наприклад, на лісовому масиві в 400 га визначається загальний запас деревини. Пробні ділянки по 0,1 га. За даними попередніх обстежень середнє квадратичне відхилення виходу деревини з 0,1 га становить 3 м3. Скільки пробних ділянок необхідно обстежити, аби похибка вибірки з імовірністю 0,954 (для якої t = 2 ) не перевищила 1 м3?
Достатній обсяг вибірки пробних ділянок
.Якщо аналогічні обстеження не проводились або в генеральній сукупності відбулися істотні зміни, точнішу характеристику варіації дають пробні обстеження. Коли відомі межі варіації ознаки, можна визначити, скориставшись коефіцієнтами Р. Пірсона (табл. 5.5).
Для альтернативної ознаки, коли немає жодної інформації про структуру сукупності, застосовують максимальне значення дисперсії s2 = 0,25 (див. 5.5).
Коли розрахований обсяг вибіркової сукупності n перевищує 5% обсягу генеральної сукупності N, його коригують на «безповторність вибірки». Скоригований обсяг вибірки
.
Щодо точності вибіркового обстеження, то доцільно контролювати відносну граничну похибку VD. У такому разі мірою варіації ознаки є коефіцієнт варіації Vx і тоді:
.
Наприклад, проектується вибіркове обстеження підприємств малого бізнесу в галузі інформаційно-обчислювального обслуговуваня (N = 125) з метою визначення середньої тривалості обороту дебіторської заборгованості. За аналогічними обстеженнями в інших галузях діяльності, середня тривалість обороту становить 72 дні, квадратичний коефіцієнт варіації Vx = 20%. Мінімально необхідний обсяг вибірки, при якому з імовірністю 0,954 гарантується відносна похибка вибірки в обсязі не більш як 8%:
.
Скоригований на скінченність сукупності обсяг вибірки менший
.
Необхідний обсяг вибірки можна розрахувати також на основі відносної похибки вибірки для частки:
.
Очевидно, чим більша частка р, тим менший обсяг вибірки забезпечить необхідну точність результатів обстеження, і навпаки: для малих значень р обсяг вибірки збільшується.
У табл. 6.1 наведено обсяги вибірки, які забезпечують точність результатів обстеження малопоширених явищ з відносною стандартною похибкою, меншою за 10%.
Таблиця 6.1
ДОСТАТНІЙ ОБСЯГ ВИБІРКИ ДЛЯ ВИВЧЕННЯ МАЛОПОШИРЕНИХ ЯВИЩ
р |
q / р |
n при Vm10% |
0,20 |
4,0 |
400 |
0,15 |
5,7 |
570 |
0,12 |
7,3 |
730 |
0,10 |
9,0 |
900 |
0,09 |
10,1 |
1010 |
0,08 |
11,5 |
1150 |
У практиці вибіркових обстежень одночасно вивчаються кілька ознак. Якщо бажаний ступінь точності визначати для кожної ознаки окремо, то результатом розрахунків стане низка значень обсягу вибірки. З метою їх узгодження використовуть або максимальний обсяг n (і тоді решта ознак оцінюється «надто точно»), або обсяг головної ознаки.
Визначення методу вибірки Існуючі методи аудиторської вибірки можна поділити на статистичні і нестатистичні. Статистичні методи вибірки базуються на припущенні, що кожна одиниця сукупності має наперед відому (хоча і не обов'язково однакову) ймовірність бути вибраною під час тестування. Найчастіше використовуються такі статистичні методи: Вибір випадковим способом. Цей метод означає, що кожна одиниця сукупності має однакову ймовірність бути обраною. При цьому одиниці із сукупності вибираються випадковим способом, із можливим використанням таблиці випадкових чисел. Систематична вибірка. У разі використання систематичної вибірки одиниці із сукупності вибираються через певні однакові інтервали. Величина однакового інтервалу визначається діленням кількості одиниць у сукупності на розмір вибірки, яку необхідно зробити. Наприклад, якщо розмір сукупності 20 000 одиниць, а розмір вибірки - 100 одиниць, то величина інтервалу має бути: 20 000 / 100 = 200 одиниць. Багатоступенева вибірка. Багатоступенева вибірка означає кількаразове проведення вибірки на різних рівнях. Прикладом багатоступеневої вибірки може бути вибір кількох сальдо рахунків бухгалтерського обліку, які необхідно підтвердити, з наступним відбором кількох рахунків-фактур чи накладних для кожного рахунку. У такий спосіб аудитор може оцінити достовірність цілого компонента фінансової звітності, до складу якого входять відібрані рахунки. Що стосується нестатистичних (довільних) методів вибірки, то у разі їх застосування ймовірність кожної одиниці сукупності бути обраною для тестування наперед невідома. Тому, застосовуючи нестатистичні методи вибірки, аудитор має бути впевненим, що обрані ним для тестування одиниці сукупності є справді типовими для цієї сукупності. Оцінка результатів аудиторської вибірки. Оцінка результатів вибірки є найважливішою і найважчою частиною процесу аудиторської вибірки. Оцінюючи результати аудиторської вибірки, аудитори роблять два типи висновків: вони або залишаються задоволеними результатами аудиторської вибірки, отримавши достатню кількість аудиторських свідчень, або вирішують збільшити обсяг вибірки. При вибірковій перевірці застосовують метод статистичної вибірки до елементів популяції тоді, коли з неї вже вибрані найбільш значні елементи перевіркою суцільним способом. Вживається також групування елементів за однаковими ознаками, наприклад відокремлюють рахунки на приблизну однакову суму і вибірку роблять зі створеної підгрупи. Існують три методи відбору елементів вибірки: систематичний, довільний і безсистемний. За систематичного методу відбору потрібно підрахувати інтервал вибірки, вибрати початок відліку та всі відповідні елементи популяції. Наприклад, популяція становить 350 елементів, потрібний розмір вибірки - 35. Тоді інтервал вибірки буде (350 : 35).