- •Національна академія статистики, обліку та аудиту
- •Тематичний план дисципліни
- •Зміст курсу та методичні вказівки
- •Тема 1 Суть та основні поняття вибіркового спостереження
- •1 Суть, мета та завдання вибіркового спостереження
- •2 Переваги та недоліки вибіркового спостереження
- •3 Основні поняття вибіркового методу
- •Тема 2 Етапи проведення вибіркового спостереження
- •1 Етапи вибіркового обстеження
- •2 Планування вибіркового обстеження
- •3 Збір та обробка даних
- •4 Розповсюдження результатів та оцінка якості
- •Тема 3 Впровадження вибіркового обстеження в практику державної статистики
- •1 Передумови проведення вибіркового обстеження
- •2 Проведення робіт з впровадження вибіркового обстеження
- •3 Аналіз основи вибірки
- •Аналіз основи вибірки без проведення вибіркового обстеження
- •Аналіз основи вибірки за допомогою формування “штучних” вибірок
- •Тема 4 Види вибірок та відборів
- •1 Види вибірок
- •2 Види відборів
- •Тема 5 Побудова дизайну вибірки
- •1 Вивчення основних характеристик сукупності
- •2 Стратифікація генеральної сукупності
- •3 Дизайн вибірки
- •Тема 6 Обчислення обсягу вибірки
- •1 Проблеми, що виникають при визначенні обсягу вибірки
- •2 Вимоги до мінімального обсягу вибірки
- •3 Формули обчислення обсягу вибірки Формули обчислення обсягу вибірки через абсолютні величини
- •Тема 7 Виявлення та врахування нетипових одиниць
- •1 Види екстремальних елементів
- •Екстремальні елементи у вибірковому обстеженні
- •2 Методи виявлення екстремальних елементів
- •3 Особливості нетипових одиниць у обстеженні підприємств
- •Тема 8 Імпутація часткових невідповідей
- •1 Проблеми, пов’язані з пропусками у даних
- •2 Методи зменшення рівня невідповідей
- •3 Види часткових невідповідей
- •4 Методи оброблення часткових невідповідей
- •Класифікація методів обробки даних з невідповідями
- •Тема 9 Компенсація повних невідповідей
- •1 Методи компенсації повних невідповідей
- •2 Зважування даних
- •3 Обчислення ваг та вагових коефіцієнтів
- •Тема 10 Розповсюдження результатів вибіркової сукупності
- •1 Етапи обробки та аналізу результатів вибіркового обстеження
- •2 Обчислення оцінок показників генеральної сукупності за вибіркою
- •Тема 11 Обчислення похибок репрезентативності
- •1 Види похибок у вибірковому спостереженні
- •2 Обчислення похибок репрезентативності
- •Класи точності вибіркових даних
- •Класи надійності вибіркових даних
- •Тема 12 Оцінка якості результатів вибіркового спостереження
- •1 Поняття якості
- •2 Критерії якості результатів вибіркового спостереження
- •3 Компроміс між якістю та витратами на обстеження
- •Приклади розв’язання типових задач
- •Вказівки до виконання контрольних робіт для студентів стаціонару
- •Зміст контрольних робіт
- •Вказівки до виконання контрольних робіт для студентів заочної форми навчання
- •Державний комітет статистики України
- •Варіант 2 Задача 1
- •Задача 2
- •Варіант 3 Задача 1
- •Задача 2
- •Варіант 4 Задача 1
- •Задача 2
- •Варіант 5 Задача 1
- •Задача 2
- •Варіант 6 Задача 1
- •Задача 2
- •Варіант 7 Задача 1
- •Задача 2
- •Варіант 8 Задача 1
- •Задача 2
- •Варіант 9 Задача 1
- •Задача 2
- •Варіант 10 Задача 1
- •Задача 2
- •Запитання до іспиту
- •Список рекомендованої літератури
3 Дизайн вибірки
Організаційно-логічна модель структури вибіркової сукупності називається планом (дизайном) вибірки. Числовим виразом статистичної ефективності того чи іншого плану вибірки є відношення квадратів середніх похибок для даного плану обстеження та для простої випадкової вибірки:
.
Дана характеристика називається ефектом дизайну.
Таким чином, для стратифікованої вибірки ефект дизайну завжди менший за одиницю, тобто стратифікована вибірка завжди має більший ефект, ніж проста випадкова вибірка.
Для порівняння точності та надійності результатів за різними планами вибірки використовують обернену величину
.
Проте подібність одиниць усередині страт при стратифікації повинна бути не лише кількісною (за значеннями ознак), але й за поведінкою під час обстеження, що залежить передусім від ступеня їх активності. Тому, наприклад, при обстеженнях підприємств, спочатку проводять поділ сукупності за активністю підприємств. Очевидно, що ступінь активності підприємств буде впливати на кількість відсутніх відповідей. Зазвичай виділяють підприємства:
неактивні – мають нульові цільові показники за звітний та за попередній до звітного періоди;
нульові – мають нульові цільові показники лише за звітний період;
активні – мають ненульові цільові показники.
Вивчення основних характеристик сукупності має сенс лише для групи активних підприємств, оскільки для груп неактивних та нульових підприємств цільові ознаки мають нульові значення.
Далі необхідно визначити ознаки, за якими стратифікація матиме найкращий ефект. Серед найбільш часто використовуваних ознак для стратифікації є такі як регіон, основний вид економічної діяльності та розмір підприємства. Зауважимо, що велика кількість критеріїв стратифікації може призвести до надлишкового подрібнення страт, що негативно відобразиться на дизайні вибірки.
Використання в якості ознаки стратифікації регіону не завжди дає виграш у точності показників вибіркового обстеження, проте розподіл підприємств за регіонами є необхідним для отримання даних обстеження у регіональному розрізі. Крім того, бажано отримати приблизно однакове навантаження на кожного статистика, що буде приймати участь у обстеженні. А тому, у зв’язку з важливістю для споживача інформації ознаки регіону використовувається прийом“прихованої стратифікації”.
Виконується він у два етапи:
1) безпосередньо перед формуванням вибірки підприємства в стратах, з яких буде проводитись відбір, упорядковуються за видом економічної діяльності, розміром підприємства (кількістю працівників) та регіональною ознакою;
2) використовується систематичний відбір одиниць у вибірку.
Такий підхід забезпечує наближено пропорційне представлення у вибірці кожного регіону без безпосередньої стратифікації за регіональною ознакою.
Використання основного виду економічної діяльності підприємства як критерію стратифікації зумовлене передусім необхідністю подання узагальнених результатів спостереження у розрізі видів діяльності. Стратифікація лише за видом діяльності зазвичай не забезпечує однорідності утворених страт, проте страти є у середньому більш однорідними ніж стратифікація за регіональною ознакою.
Розмір підприємства також є важливим критерієм для стратифікації. Зазвичай у світовій практиці розмір підприємства характеризується ознакою чисельності працівників. Інколи використовують дві ознаки: кількість працівників та обсяг реалізації продукції (послуг), якщо вони передбачені програмою обстеження або ця інформація є наявною у базі вибірки.
Особливої уваги потребують малі страти (страти з невеликою кількістю підприємств). Зазвичай такі страти обстежуються повністю, оскільки дуже важко отримати точні результати через невеликий їх обсяг (не працює закон великих чисел). При великій подрібненості страт (наприклад, через велику кількість критеріїв стратифікації або ж значної їх деталізації) такі страти значно вичерпують резерв вибіркової сукупності, який має обмеження. Граничний розмір вибірки є важливим параметром з тих, що встановлюються апріорі замовником обстеження, якщо такий є. Замовник, у свою чергу, виходить із міркувань фінансових, людських та часових витрат, а також звітного навантаження на респондентів. На міжнародному рівні єдині для усіх країн-учасниць параметри вибірки задаються з метою забезпечення порівнянності даних і відповідного рівня якості.
Таким чином, необхідно намагатися зменшувати кількість малих страт за рахунок їх об’єднання з близькими їм стратами. Проте ймовірно, що при цьому утворена об’єднана страта буде менш однорідною, ніж дві дрібні, з яких вона складається. Тому при об’єднанні страт необхідно обрати узагальнений критерій, який враховував би ці два фактори і вказував би на ефективність такого об’єднання, наприклад, t-критерій близькості середніх.
В загальному вигляді, об’єднання страт прийнятне, якщо виконуються такі умови:
страти близькі за видом діяльності та не є більш укрупненими, ніж це необхідно для статистичних публікацій;
середні значення ознаки в цих стратах є близькими (t-критерій);
страти не містять нетипових підприємств, які істотно впливають на середнє значення ознаки;
до об’єднання залучається якомога більша кількість малих страт.
Нетипові підприємства можуть суттєво впливати на середнє значення ознаки у страті. При об’єднанні двох страт, одна з яких (або ж обидві) містить таке нетипове (нетипові) підприємство, може суттєво погіршуватись однорідність об’єднаної страти, ось чому вимагається виконання третього пункту.
За способом проведення будемо виділяти два види об’єднань: послідовне та паралельне. Послідовне відбувається наступним чином. Формується перша об’єднана страта і обчислюється загальний обсяг вибірки. Якщо він зменшився, це означає, що об’єднання викликає зниження обсягу вибірки (при фіксованому обсязі вибірки – зниження похибки). Якщо ж загальний обсяг збільшився, то страти об’єднувати не варто і необхідно залишити показники сукупності на попередньому рівні. Далі формується наступна страта, для якої виконуються аналогічні обрахунки і т.д.
Проте таке об’єднання має той недолік, що на кожному наступному кроці отримується інша структура основи вибірки. А тому оцінка впливу об’єднання на результат на різних кроках (тобто для різних страт) є слабко порівнюваною. Тому автор віддає перевагу паралельному об’єднанню.
Паралельне об’єднання відбувається наступним чином: об’єднані страти формуються за описаними вище умовами і після кожного такого об’єднання обчислюється загальний обсяг вибірки (враховуючи усі інші страти). Якщо загальний обсяг вибірки зменшився, це означає, що об’єднання дає позитивний ефект і тому таке об’єднання приймається. Якщо ж загальний обсяг збільшився, то це означає, що об’єднання не дає позитивного ефекту і страти об’єднувати не варто.