- •Обчислення необхідного обсягу вибірки при заданій наперед абсолютній похибці вибірки
- •Обчислення необхідного обсягу вибірки при заданій наперед відносній похибці вибірки
- •Приклад організації вибіркових обстежень підприємств: методика Держстату. Перелік скорочень
- •Перелік позначень
- •1. Загальні положення
- •2. Визначення основи вибірки
- •Перелік ознак, необхідних для формування вибіркової сукупності малих підприємств
- •3. Побудова дизайну вибірки
- •Стратифікація підприємств
- •Виявлення нетипових підприємств
- •Об’єднання страт
- •4. Обчислення обсягу вибірки Обчислення загального обсягу вибірки
- •Обчислення обсягу вибірки за стратами
Методи репрезентативних обстежень в економіці
Основні питання курсу
Суть вибіркового методу у репрезентативних обстеженнях, його математична основа.
Основні етапи вибіркового обстеження. Генеральна сукупність та основа вибірки.
Визначення необхідного обсягу вибірки
Поняття дизайну вибірки. Способи формування вибірки
Розрахунок похибок вибіркових обстежень
Поширення результатів вибіркових обстежень на характеристики генеральної сукупності
Приклад організації вибіркових обстежень підприємств: Методика Держстату.
Суть вибіркового методу та його математична основа
Вибірковий метод – це система наукових принципів випадкового добору певної частини сукупності, яка представляла б усю сукупність і характеристики якої слугували б надійною основою для статистичного висновку.
Теорія вибіркового методу ґрунтується на основних теоремах закону великих чисел (Бернуллі, Чебишева, Ляпунова).
Згідно
з теоремами закону великих чисел Чебишева
і Ляпунова за достатньо великого обсягу
вибірки (n) ймовірність (Р) того, що похибка
вибірки не перевищує свого граничного
значення
(=t),
дорівнює інтегралу Лапласа Ф(t):
,
(5.1)
де - середньоквадратична, або стандартна, похибка вибірки; t – квантиль розподілу ймовірностей (довірче число для заданого значення ймовірності Р), який визначається за табличними значеннями функції (t).
При малих вибірках (n20) квантиль t визначають за розподілом імовірностей Стьюдента.
Основні етапи вибіркового обстеження
Вибірковий метод є основою для проведення вибіркових обстежень, кожне з яких передбачає вирішення таких основних завдань:
Постановка мети вибіркового обстеження та розробка його програми.
Визначення об’єкту дослідження, характеристика генеральної та сукупності та основи вибірки.
Визначення необхідного обсягу вибірки та її дизайну.
Формування вибірки (практична реалізація) та визначення на її основі вибіркових оцінок невідомих параметрів.
Обчислення похибок вибіркового оцінювання та довірчих інтервалів.
Поширення результатів вибіркового обстеження на характеристики генеральної сукупності.
На першому етапі визначають перелік головних (цільових) та інших характеристик (ознак, показників), що мають бути дослідженні за даними вибірки. Вибір головних характеристик для вибіркового обстеження, рівень їх варіації у подальшому безпосередньо впливають на необхідний обсяг вибірки.
Генеральна сукупність – це повна сукупність одиниць,які характеризують досліджуваний об’єкт. З метою вилучення з генеральної сукупності “нерепрезентативних” (наприклад, економічно неактивних підприємств) формують основу вибірки – упорядковану за певним принципом множину одиниць генеральної сукупності, з якої безпосередньо буде здійснюватися добір одиниць. У якості основи вибірки може слугувати список (реєстр) одиниць, карта країни, регіону чи іншого об’єкту дослідження. У процесі формування основи вибірки з генеральної сукупності можуть “вилучати” окремі одиниці. Наприклад, у вибірковому обстеженні обсягів діяльності малих підприємств для формування основи вибірки використовують реєстр підприємств, дані якого коригують з урахуванням новостворених підприємств, а також тих, які ліквідовані станом на початок досліджуваного періоду.
Визначення необхідного обсягу вибірки та її дизайну
Необхідний
обсяг вибірки визначають з урахуванням
вимог щодо надійності оцінок головних
показників, а відповідно а) ймовірності
(P) гарантування результатів, значення
якої пов’язане з квантилем розподілу
ймовірностей t (див табл.1); б) прийнятної
абсолютної
або відносної (
або
)
похибок вибірки.
На практиці суттєвим обмежуючим чинником є також обсяг фінансових коштів, які виділені для проведення обстежень.
З урахуванням вимог щодо надійності вибіркових оцінок та варіації значень досліджуваних ознак необхідний обсяг вибірки n визначають за формулами, наведеними у табл.1.
Таблиця 1
Обчислення необхідного обсягу вибірки при заданій наперед абсолютній похибці вибірки
|
Вибіркова оцінка |
|
середньої |
частки значень альтернативної ознаки |
|
Повторний відбір |
|
|
Безповторний відбір |
|
|
У
наведених в табл. 1 формулах їх елементи
мають такий зміст:
t
– квантиль розподілу ймовірностей,
який визначають, виходячи з прийнятої
ймовірності гарантування результатів
за табличними значеннями функції (t)
у випадку нормального розподілу даних
або за розподілом імовірностей Стьюдента;
p
– частка значень альтернативної ознаки.
Оскільки на етапі визначення необхідного
обсягу вибірки вона невідома, в обчисленнях
використовують її наближене значення,
отримане за результатами пробних
(пілотних) обстежень, або приймають
рівною 0,5, при якому можлива найбільша
дисперсія частки
=0,25(
,
якщо p=0,5, то
);
– дисперсія
середнього значення ознаки, оцінена за
даними попереднього (пілотного)
обстеження, даними мікровибірки чи
наближено оцінена за формулою
для середньої у випадку нормального
розподілу даних генеральної сукупності;
– прийнята гранична похибка вибірки;
N
– обсяг генеральної сукупності.
У
багатьох вибіркових обстеженнях в
основу для розрахунку необхідного
обсягу вибірки n наперед кладуть не
абсолютну, а відносну граничну похибку
вибірки
.
У такому випадку формули модифікуються
(табл. 2)
Таблиця 2
Обчислення необхідного обсягу вибірки при заданій наперед відносній похибці вибірки
|
Вибіркова оцінка |
|
середньої |
частки значень альтернативної ознаки |
|
Обсяг вибірки |
|
|
Залежність
обсягу вибірки від заданої відносної
точності оцінювання (
)
при
ймовірності 0,95 і найбільшому рівні
варіації
2
= 0,25 (р=0,5) ілюструє таблиця 3.
Таблиця 3
Залежність обсягу вибірки від відносної точності оцінювання
|
10 |
8 |
6 |
4 |
2 |
n |
96 |
150 |
266 |
600 |
2 400 |
У тих випадках, коли розрахований обсяг вибіркової сукупності перевищує 5% обсягу генеральної сукупності N, його коригують на „безповторність вибірки”. Скоригований обсяг вибірки
(2)
У практиці вибіркових обстежень одночасно вивчають декілька ознак. Якщо бажану точність вказати для кожної ознаки окремо, то результатом розрахунків буде низка значень обсягу вибірки. З метою їх узгодження використовують або максимальний обсяг n (тоді решта ознак оцінюється „надто точно”), або обсяг головної ознаки.
У
тих випадках, коли наперед відомо, що
частина респондентів може відмовитися
прийняти участь в обстеженні чи буде
недоступною, розрахований обсяг вибірки
n коригується на очікуваний коефіцієнт
відповідей
(співвідношення кількості респондентів,
які фактично надали інформацію та їх
загальної кількості, передбаченої
обсягом вибірки) може отримана та
формулою:
(3)
Поняття дизайну вибірки. Способи формування вибірки
Після визначення необхідного обсягу вибірки здійснюють розробку її дизайну. Дизайн (план) вибірки – це організаційно-логічна модель структури вибіркової сукупності та принципи її формування.
Розробка дизайну вибірки передбачає з’ясування таких основних запитань:
стратифікація генеральної сукупності;
схема ротації одиниць вибірки;
обсяг вибірки;
механізм формування вибірки.
Основою дизайну вибірки є спосіб її формування. В залежності від основи вибірки у практиці вибіркових обстежень використовують різні способи формування вибіркових сукупностей, зокрема:
простий випадковий,
механічний (систематичний),
розшарований (районований, типовий, стратифікований),
серійний.
Суть та особливості кожного з цих способів, а також формули, за якими обчислюють похибки вибірки при їх застосуванні наведені у таблиці 4.
У практиці вибіркових обстежень найпоширенішими є багатоступеневі вибірки, які поєднують різні способи добору: механічний і серійний, розшарований і механічний, простий випадковий і серійний. Поєднання способів добору забезпечує високу репрезентативність результатів з найменшими витратами на організацію та проведення досліджень. Той чи інший спосіб відбору або схема багатоступеневої вибірки можуть бути вибрані тільки після попереднього ознайомлення з генеральною сукупністю і її частинами.
Таблиця 4
Способи формування вибірки, що забезпечують її репрезентативність
Назва та суть способу |
Обчислення похибок вибірки |
Простий випадковий відбір
Класичний спосіб формування вибіркової сукупності, на якому ґрунтується теорія вибіркового методу. Здійснюється шляхом жеребкування, використання таблиці випадкових чисел чи програми-генератора випадкових чисел або ж за допомогою прикладних програм (наприклад, табличного редактора Microsoft Excel (інструмент “Вибірка” в Аналізі даних) Випадкового відбір передбачає попередню нумерацію одиниць генеральної сукупності.
|
Для повторного відбору
Для безповторного добору
де t – квантиль розподілу ймовірностей (довірче число для заданого значення ймовірності Р, див. табл. 8.1);
|
Продовження таблиці 4
Назва та суть способу |
Обчислення похибок вибірки |
Механічний (систематичний) відбір
Одиниці генеральної сукупності необхідно спочатку упорядкувати та пронумерувати. Добір елементів здійснюють через однакові інтервали, шириною 1/D=N/n. Початковий елемент добору визначають як випадкове число всередині першого інтервалу жеребкуванням (іноді розпочинають із середини інтервалу), другий елемент залежить від початкового числа і кроку інтервалу. За циклічних коливань значень ознаки, цикл коливань яких збігається з інтервалом, можливе зміщення похибки. |
|
Розшарований (стратифікований)
Передбачає попередню стратифікацію генеральної сукупності та незалежний добір елементів у кожній страті. У якості ознак стратифікації на основі попереднього факторного аналізу вибирають ті, що найбільше впливають на варіацію досліджуваних ознак в обстеженні. Обсяг розшарованої вибірки – це сума частинних вибірок nj, тобто |
|
Продовження табл. 4
Назва та суть способу |
Обчислення похибок вибірки |
де
m
кількість складових частин ( районів,
страт) вибірки. Найчастіше використовують
пропорційний добір, який передбачає
однакове для всіх складових частин
представництво у вибірці. Обсяг
частинних вибірок у цьому випадку
визначається як
Оптимальним щодо мінімізації похибки вибірки за розшарованого добору є добір, пропорційний чисельності групи Nj і середньому квадратичному відхиленню ознаки, яка вивчається у цій групі j. Обсяг частинних вибірок визначається при цьому за формулою |
Розшарування (типізація) сукупності зменшує похибку вибірки. Чим щільніший зв’язок між ознаками, яка вивчається у вибірці і за якою проводиться розшарування генеральної сукупності, тим помітніше зменшення похибки вибірки. Наприклад, у вивченні середнього доходу малих підприємств їх стратифікують за видами діяльності.
|
Закінчення табл. 4
Назва та суть способу |
Обчислення похибок вибірки |
Серійний добір
Основою відбору є не окремі одиниці генеральної сукупності, а серії елементів, з яких формується вибірка. Такі серії можуть бути пов’язані територіально (райони, селища), організаційно (підприємства, акціонерні товариства) тощо. Серії добирають за схемою механічної або простої випадкової вибірки, обстеженню підлягають всі елементи серії. |
де
S
– загальна кількість серій у генеральній
сукупності; s
– кількість серій, відібраних для
обстеження;
де
nk
та
Похибка серійної вибірки буде меншою від похибки простої випадкової чи механічної вибірки за умови, що серії більш-менш однорідні і варіація серійних середніх незначна.
|
Розрахунок похибок вибіркових обстежень
Після визначення дизайну вибірки та її практичної реалізації важливим завданням є оцінка якості статистичних даних, отриманих на основі вивчення вибірки. Таку якість характеризують похибки репрезентативності, тобто розбіжності між характеристиками генеральної сукупності та їх вибірковими оцінками.
За причинами виникнення похибки репрезентативності поділяють на систематичні (тенденційні) та випадкові.
Систематичні похибки виникають за умови, що під час формування вибіркової сукупності порушується принцип випадковості відбору (упереджений відбір елементів, недосконала основа вибірки тощо). Для всіх елементів сукупності вони мають односторонній напрям і тому їх ще називають похибками зміщення.
Випадкові похибки – це наслідок випадковості відбору елементів сукупності для обстеження.
В організації вибіркового обстеження важливо запобігти виникненню систематичних похибок. Випадкових похибок уникнути неможливо, проте на основі теорії вибіркового методу можна визначити їх розмір і по можливості регулювати.
Отже, якість вибіркових оцінок невідомих параметрів генеральної сукупності характеризують:
абсолютні: стандартна
та гранична =t
похибка
вибірки;
відносні: стандартна або гранична
похибки вибірки.
Гранична
похибка вибірки
– це максимально можлива похибка для
прийнятої ймовірності Р. Довірче число
t вказує, як співвідносяться гранична
і стандартна
похибки. Розмір граничної похибки для
середньої величини
і частки p значень альтернативної ознаки
залежить від прийнятої ймовірності
гарантування результатів, варіації
досліджуваної ознаки, яку характеризує
дисперсія
,
обсягу вибірки, а також способу її
формування. Формули для обчислення
похибок вибірки для різних способів її
формування наведені у таблиці 5.4.
Гранична
похибка вибірки використовується для
побудови границь довірчих інтервалів,
у межах яких з прийнятою ймовірністю P
може знаходитися невідоме значення
середньої
або частки D у генеральній сукупності.
Для побудови таких довірчих інтервалів
використовують формули:
– для
середньої (4)
–
(5)
для частки значень альтернативної ознаки
Відносні стандартні похибки вибірки розраховуються за формулами:
-
для середньої;
- для частки (6)
Відповідно відносні граничні похибки вибірки будуть становити:
-
для середньої;
- для частки. (7)
Відносна
стандартна похибка часто використовується
як показник придатності для аналізу.
Так якщо
,
то оцінка вважається надійною, якщо
- оцінка є придатною для кількісного
аналізу, але її надійність недостатньо
висока, якщо
- оцінка придатна лише для якісного
аналізу, тому її слід використовувати
обережно.
Поширення результатів вибіркових обстежень на характеристики генеральної сукупності
Завершальним етапом вибіркового обстеженні є поширення його результатів на характеристики генеральної сукупності. Для цього використовують різні способи, серед яких найбільш поширеними є спосіб прямого перерахунку і спосіб коефіцієнтів.
Спосіб прямого перерахунку застосовують у тому випадку, коли на основі результатів вибірки розраховують показники обсягу генеральної сукупності, використовуючи для цього вибіркову середню або частку. Загальний обсяг значень ознаки обчислюють за формулою:
. (8)
А його можливі межі з урахуванням похибки:
. (9)
Способом прямого перерахування можна поширювати дані вибіркового обстеження також на основі співвідношення чисельностей вибіркової і генеральної сукупностей. Значення сумарного показника в генеральній сукупності можна визначити діленням вибіркового його значення на частку вибірки
, (10)
де
– коефіцієнт поширення, який показує,
скільки одиниць генеральної сукупності
представляє одна вибіркова одиниця.
Наприклад,
при 2%-му вибірковому обстеженні якості
продукції у вибірку потрапило 100 одиниць,
з яких 20 одиниць виявились неякісними.
Гранична похибка вибірки ±2 одиниці.
Визначивши коефіцієнт поширення, як
,
можна встановити, що кількість бракованих
одиниць продукції для всієї партії, яка
складається з 5000 одиниць, дорівнюватиме
1000±100 (20·50±2·50), тобто коливатиметься у
межах від 900 до 1100 одиниць.
Спосіб коефіцієнтів застосовується в тих випадках, коли вибіркове обстеження проводиться з метою перевірки і уточнення результатів суцільного спостереження. У даному випадку зіставляючи дані вибіркового спостереження із суцільним, вираховують поправочний коефіцієнт, який використовують для внесення поправок у матеріали суцільного спостереження.
, (11)
де N1 та N0 – чисельності сукупності з поправкою і без поправки на недооблік, n0 та n1 – чисельності в контрольних точках за первинними і уточненими даними.
Теорія вибіркового методу найбільшого застосування та модифікації набула у практиці соціологічних опитувань громадської думки населення, державних вибіркових обстежень з питань економічної активності населення, умов життя домогосподарств, суб’єктів малого бізнесу.

,
де q = 1– p
%
стандартна
похибка вибірки;
-
дисперсія, обчислена за даними вибірки;
n
та N
– обсяг вибіркової та генеральної
сукупностей відповідно, p – частка
значень альтернативної ознаки,
обчислена за даними вибірки, q=1-p.
– середня
з групових дисперсій:
,
, де
D=n/N
– частка вибірки.
.
– міжгрупова дисперсія, яка обчислюється
за формулою:
,
- відповідно обсяг і середня k-ї
серії.