Тема 6. Вибірковий метод
ТЕОРЕТИЧНІ ОСНОВИ ТЕМИ
1. ЗАГАЛЬНЕ ПОНЯТТЯ ВИБІРКОВОГО СПОСТЕРЕЖЕННЯ
Як уже відомо з теми 2, статистичне спостереження може бути суцільним або несуцільним. Вибіркове спостереження є одним з видів несуцільного спостереження.
У сільському господарстві вибіркове спостереження застосовують для встановлення втрат урожаю при збиранні, засміченості посівів, якості продукції', продуктивності праці, для контрольних перевірок перепису худоби і т. ін. Цей вид спостереження одержав значне поширення у зв'язку з вивченням соціальних аспектів суспільного життя, зокрема, у дослідженні рівнів споживання і рівня добробуту населення.
Мета вибіркового методу полягає в тому, щоб, відібравши з генеральної сукупності певну кількість одиниць, дослідити їх і на цій основі оцінити невідомі параметри генеральної сукупності.
Загальна чисельність одиниць, із яких здійснюється відбір, називається генеральною сукупністю. Всі її характеристики мають назву генеральних (середня, частка, дисперсія тощо). Сукупність одиниць, відібраних на основі науково розроблених принципів, називається вибірковою сукупністю. Всі характеристики вибірки (відповідні узагальнюючі показники) називаються вибірковими (середня, частка, дисперсія та ін.).
Щоб забезпечити достатню точність характеристики генеральної сукупності, необхідно організувати правильний відбір одиниць спостереження із цієї сукупності. Теорія і практика статистики передбачають кілька систем відбору одиниць у вибіркову сукупність. В їх основу покладено науковий принцип забезпечити максимальну можливість вибору будь-якої одиниці з генеральної сукупності при дотриманні принципу випадковості. Тобто, для одержання правильної, невикривленої характеристики генеральної сукупності необхідно намагатися забезпечити можливість відбору у вибіркову сукупність одиниць спостереження ç будь-якої частини генеральної сукупності. Зазначена вимога є основною і повинна виконуватися тим точніше, чим більше варіює досліджувана ознака. Ці й інші завдання вирішує теорія вибіркового методу.
2. СПОСОБИ ВІДБОРУ У ВИБІРКОВУ СУКУПНІСТЬ
Способи відбору одиниць з досліджуваної генеральної сукупності з метою утворення вибіркової сукупності можуть бути різні. Залежно від того, як поставлена вибірка, як організований відбір із загальної маси, розрізняють кілька варіантів утворення вибіркової сукупності. Щоб одержана вибіркова сукупність мала об'єктивну гарантію репрезентативності, застосування того чи іншого способу відбору повинно бути науково обгрунтованим. Основний принцип правильності відбору строго об'єктивний підхід до відбору одиниць спостереження. Якщо цей принцип порушується і одиниці відбираються суб'єктивно, то результати такого спостереження не можна поширювати на генеральну сукупність, вони можуть бути застосовані лише щодо тієї частини, яка підлягала спостереженню.
Є такі види вибірки: 1) власне випадковий відбір; 2) механічний відбір; 3) типовий відбір; 4) серійний відбір; 5) комбінований відбір.
Власне випадковий спосіб відбору це такий спосіб формування вибіркової сукупності, коли відбір одиниць з генеральної сукупності здійснюється у випадковому порядку. Випадковість відбору полягає у дотриманні принципу однакової можливості для всіх одиниць генеральної сукупності потрапити у вибірку.
Випадкова вибірка може бути організована або за схемою повторного відбору або по схемі безповторного відбору.
При повторному відборі кожна одиниця після реєстрації повертається у генеральну сукупність і в подальшому може знов потрапити у вибіркову сукупність. При безповторному відборі кожна відібрана одиниця у подальшому відборі не бере участі, тобто не повертається у генеральну сукупність.
Механічний відбір. Механічним називається відбір, при якому генеральна сукупність поділяється на рівні частини відповідно до природного розташування її одиниць (географічного, просторового, алфавітного тощо) і з кожної частини обстежується одна одиниця. Тобто одиниці відбирають через рівні проміжки у порядку розташування їх у сукупності. Наприклад, кожна п'ята одиниця при 20%-му відборі, кожна десята одиниця при 10%-му відборі і т. ін. Якщо відбір здійснюється на земельній території, проби беруть у шаховому порядку. Проміжок між відібраними одиницями визначається залежно від прийнятої пропорції відбору. Цей проміжок розраховується як частка від ділення чисельності сукупності на обсяг вибірки. Наприклад, потрібно відібрати для обстеження 30 гол. тварин із загальної чисельності поголів'я 611 гол. Проміжок відбору (шаг) тут становитиме тобто у вибірку потрібно включити кожну 20 одиницю, враховуючи “початкове число” відбору, за яке приймається будь-яка одиниця перших двадцяти одиниць. Як правило, першою одиницею відбирається та, яка знаходиться посередині проміжку (у даному випадку десята від початку відрахування).
Механічний спосіб забезпечує рівномірність відбору одиниць з усіх частин сукупності, тобто їх пропорційне представництво, а отже, і найбільш високу репрезентативність обстеження.
Типовий відбір. При типовому відборі генеральна сукупність попередньо розбивається на однорідні групи з наступним відбором окремих одиниць з кожної групи за власне випадковим принципом або механічним.
Серійний відбір. Для розглянутих вище способів відбору (власне випадкового, механічного, типового) характерним є те, що відбір одиниць з генеральної сукупності здійснюється в індивідуальному порядку. На практиці інколи виявляється доцільним проводити відбір не окремих одиниць, а цілих груп (серій, гнізд), котрі підлягають потім суцільному обстеженню. Групи (серії) відбирають за методом власне випадкової безповторної вибірки або способом механічного відбору.
Серійний відбір (в англійській термінології “cluster sampling” груповий відбір; у сільськогосподарській статистиці “гніздовий відбір”) має практичні переваги, особливо у сільськогосподарській статистиці, де обстеження кількох груп господарств, розташованих безпосередньо одне біля одного, менш утруднене, ніж обстеження такої ж чисельності окремих господарств, розташованих по всій території району.
У сільському господарстві серійний спосіб відбору застосовують при вивченні бюджету сімей робітників і службовців галузі, при контрольних обходах, які проводяться після обліку худоби і т. ін. З цією метою відбирають господарства або їх групи, в яких проводять суцільне обстеження.
Багатоступенева вибірка. Значна частина великих вибіркових обстежень здійснюється не на підставі одного способу відбору, а у комбінуванні (поєднанні) двох і більше способів, які утворюють ступені відбору.
Так, типовий відбір поєднують з кількома стадіями (ступенями) відбору. При цьому кожна стадія має свою одиницю відбору. Така вибірка називається багатоступеневою або комбінованою. Наприклад, при обстеженні бюджетів сімей робітників і службовців сільськогосподарських держпідприємств спочатку загальне число сімей, які підлягають обстеженню, розподіляють по держпідприємствах з різним напрямом спеціалізації і по областях. Це перша стадія відбору, яка забезпечує репрезентативність тих чи інших типів спеціалізації господарств і адміністративних областей. У даному випадку одиницею відбору є область і тип спеціалізації. На наступному етапі відбирають підприємства в межах кожного типу спеціалізації в області. Це друга стадія відбору. Здійснюється вона на підставі науково розроблених принципів її організації.
3. ПОМИЛКИ ВИБІРКИ, ЇХ ВИЗНАЧЕННЯ ПРИ РІЗНИХ СПОСОБАХ ВІДБОРУ
Між характеристиками вибіркової сукупності і шуканими параметрами відповідних характеристик генеральної сукупності існують певні розбіжності, їх називають помилками спостереження. Загальна величина помилки вибіркового спостереження зумовлюється можливістю виникнення двох видів помилок: помилки реєстрації і помилки репрезентативності.
Помилки реєстрації виникають внаслідок недостатнього рівня кваліфікації працівників, неточності підрахунків, недосконалості вимірювальних приладів і т. ін. Ймовірність виникнення помилок реєстрації при вибірковому обстеженні значно менша, ніж при суцільному, адже вибіркове здійснюється кваліфікованішими працівниками і організовується більш ретельно і конструктивно, ніж суцільне. При вибірковому спостереженні завдяки скороченню кількості досліджуваних одиниць значно зменшується можливість одержати помилки реєстрації. Спеціально підібрані і навчені спостережувачі не зацікавлені у викривленні спостережуваних даних, що також сприяє одержанню більш об'єктивної інформації про обстежувану сукупність об'єктів.
У той же час при вибірковому спостереженні виникають помилки, які не мають місця при суцільному обстеженні помилки репрезентативності. Вони являють собою розбіжність між величиною одержаних по вибірці показників і величиною тих показників, котрі були б одержані при проведенні з однаковим рівнем точності суцільного спостереження.
Отже, помилка вибірки (помилка репрезентативності) це абсолютна величина різниці між відповідними вибірковою і генеральною характеристиками: () помилка для середньої; ( р) помилка для частки (, р частка ознаки відповідно у вибірковій і генеральній сукупностях). Природа виникнення такої помилки полягає в тому, що вибіркова сукупність не точно відтворює генеральну сукупність.
Розрізняють середню і граничну помилку вибірки. Під середньою (стандартною) помилкою вибірки розуміють таке розходження між вибірковою і генеральною середньою , яке не перевищує розмір середнього квадратичного відхилення (±). Максимально можливе розходження називають граничною помилкою вибірки, тобто це максимум помилки при заданій імовірності її появи.
Існують дві формули середньої помилки вибірки. Одна з них використовується при вимірюванні середнього значення ознаки (наприклад, вибірково обстежується середня продуктивність тварин), друга коли вибірково вимірюється частка ознаки
(наприклад, частка високопродуктивної худоби в стаді).
Коли вибірка здійснюється за принципом повторного відбору, то формули середньої помилки мають вигляд: для середньої для частки т =.
Повторну вибірку використовують дуже рідко. Як правило, вибірка організовується за принципом безповторного відбору. Стосовно до цього принципу відбору в наведених вище формулах середньої помилки в підкореневий вираз вводиться додаткоковий множник , де N чисельність генеральної сукупності.
Отже, для безповторної вибірки формули середньої помилки набудуть вигляду:
а) при визначенні середнього значення ознаки ;
б) при визначенні частки ознаки .
Теорією ймовірностей доведено: ствердження про те, що генеральні характеристики не відхиляються від вибіркових на величину більшу, ніж величина помилки вибірки (m), завжди має постійний ступінь імовірності 0,683. Імовірність ствердження можна підвищити, подвоївши або потроївши середню помилку (2т; Зт). У цьому випадку ймовірність стверджень досягає рівнів 0,954 або 0,997, тобто з тисячі випадків відповідно в 954 і 997 випадках вибіркові характеристики будуть відрізнятися від генеральних на величину обчисленої помилки вибірки. У решти випадків (46 і 3) відхилення генеральних і вибіркових параметрів може виходити за межі обчисленої помилки.
Таким чином, щоб підвищити ймовірність ствердження, необхідно розширити межі відхилень шляхом збільшення середньої помилки в разів, де відношення різниці середніх до середнього квадратичного відхилення являє собою величину так званого нормованого відхилення (t).
Отже, з визначеною ймовірністю можна стверджувати, що відхилення генеральних і вибіркових характеристик не перевищать деякої величини граничної помилки вибірки (). Гранична помилка вибірки пов'язана з середньою помилкою рівнянням =tm, де t нормоване відхилення (коефіцієнт кратності, коефіцієнт довіри), яке залежить від рівня ймовірності.
Величина ймовірності задається залежно від мети і завдань дослідження.
Припустимо, що помилку вибірки треба оцінити з імовірністю 0,954. Це означає, що розбіжність між вибірковою і генеральною середньою не перевищить двох величин середньої помилки, тобто в 95,4 % випадків помилка репрезентативності не вийде за межі ±2; при ймовірності 0,997 за межі ±3 і т. ін.
Для чисельно малих статистичних сукупностей використовуються таблиці розподілу Ст'юдента S(t), в яких дано рівні ймовірностей для різних значень п і t .
Із сказаного вище випливає, що після обчислення середньої помилки вибірки виникає питання обчислення граничної помилки репрезентованості (). Розмір її у вибірковому спостереженні може бути менший або більший від середньої помилки репрезентативності ().Гранична помилка вибірки () обчислюється з певною ймовірністю (р), якій відповідає t-разове значення середньої помилки () : = t.
Межі середньої характеристики в генеральній сукупності становитимуть: для середньої
для частки р = .
У розгорнутому вигляді формули граничної помилки для повторної і безповторної схеми відбору.
Розглянемо конкретний приклад розрахунку граничної помилки вибірки при визначенні середньої характеристики у вибірковій сукупності і частки вибірки.
Умова. В господарствах району площа зернових культур становить 20000 га. При 10%-му безповторному відборі встановлено, що середня урожайність зернових в районі дорівнює 30 ц/га, середньоквадратичне відхилення урожайності становить 2 ц. Питома вага високоврожайних культур 60%. Потрібно визначити з ймовірністю 0,954 граничну помилку середньої врожайності зернових культур по вибірці і граничну помилку частки, тобто питомої ваги високоврожайних культур в загальній площі посіву.
Хід рішення. Встановлюємо чисельність вибіркової сукупності 10% від 20000 га, вона дорівнює 2000 га. Маємо:
.
.
Отже, різниця між вибірковою середньою урожайністю і генеральною середньою буде не більша за 0,08 ц. Межі середньої генеральної урожайності в центнерах 29,92
Гранична помилка для частки становить:
.
Таким чином, помилка у визначенні частки високоурожайних культур у вибірковій сукупності не перевищить 2%, тобто питома вага високоурожайних культур знаходиться у межах 586062%.
4. ОРГАНІЗАЦІЯ ВИБІРКОВОГО CПОСТЕРЕЖЕННЯ
Організація вибіркового спостереження з метою відтворення генеральної сукупності висуває ряд завдань, вирішення яких грунтується на теорії вибіркового методу. Розглянемо їх.
По-перше, це вирішення питання щодо встановлення чисельності вибіркової сукупності. Суть цього завдання полягає в тому, щоб знайти відповідь на запитання скільки потрібно відібрати одиниць спостереження, щоб помилка вибірки з певним рівнем ймовірності не перевищувала встановлений розмір.
Необхідна чисельність вибірки залежить від варіації одиниць обстежуваної сукупності. Чим більша коливність, тим більшою повинна бути чисельність вибірки. Зворотний зв'язок існує між чисельністю вибірки і її граничною помилкою. Прагнення отримати меншу помилку вимагає збільшення чисельності вибіркової сукупності.
Необхідна чисельність вибірки визначається на основі формул граничної помилки вибірки () із заданим рівнем ймовірності (р). Шляхом математичних перетворень отримують
Таблиця 6.1. Розрахунок необхідної чисельності вибірки
Спосіб відбору |
Чисельність вибірки (n) при визначенні та оцінці параметра |
|
|
середньої |
Частки (W) |
Повторний |
|
|
Безповторний |
|
|
формули розрахунку чисельності вибірки .