Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Экомониторинг.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
1.1 Mб
Скачать

2.2. Вибір методу відбору одиниць для спостережень

Існує ряд вивчених способів, за якими можна вилучити елементи вибірки з генеральної сукупності елементів та оцінити величину індикаторів стану системи, що досліджується. Для кожного такого способа можливо, знаючи бажаний рівнь точності оцінок індикаторів, приблизно оцінити належний розмір вибірки. На рішення щодо способу вилучення і розміру вибірки має впливати можливість, вартість і тривалість його реалізації. Далі розглянемо кілька користних для практики методів випадкового відбору.

2.2.1. Простий випадковий відбір

Для планування простого випадкового відбору одиниць треба визначити генеральну сукупність, тобто, скласти нумерований список одиниць системи, якщо кількість одиниць скінчена (наприклад, нумерований список мешканців багатоквартирної будівлі), або визначити шкалу ознаки одиниці, за якою одиниці можуть бути упорядковані за зростанням ознаки (наприклад, час, відстань).

Далі, за допомогою таблиці або генератора випадкових чисел (наприклад, процедура-функція СЛЧИС() з бібліотеки Microsoft Excel® визначають випадкові числа, кількість яких дорівнює обраному розміру вибірки, та обирають для вимірювання одиниці, номера або ознаки яких співпадають з випадковими числами. Після вимірювання величини будь-якого параметра в кожній обраній одиниці отримують вибірку спостережень , ,..., , де розмір вибірки менше розміру генеральної сукупності.

Оцінка величини індикатора . Ця оцінка виконується за формулами

,

що є середнім арифметичним результатів вимірювань.

Кількісною характеристикою величини можливої похибки оцінки є вибіркова стандартна похибка результатів вимірювання, що має вигляд

.

Інтервал, де очикувано, з довірчою імовірністю (величину 0< <1 називають рівнем значущості), знаходиться дійсна величина індикатора визначається нерівністю

;

; ,

де величини і називають нижньою і верхньою границею довірчого інтервалу для дійсной величини індикатора ; - величина квантіля розподіла Стьюдента з числом степінів свободи. Ця величина обраховується, наприклад, функцією СТЬЮДРАСПОБР з бібліотеці Microsoft Excel®. Таким чином, довірча імовірність характеризує надійність оцінки індикатора , а напівширина довірчого інтервалу

є характеристикою точності цієї оцінки. На практиці, звичайно, величину рівня значущості обирають рівною =0,05.

Також прийнято характеризувати похибку оцінювання величини індикатора величиною відносної похибки (коефіцієнт варіації оцінки), яка визначається рівнянням

.

З цього рівняння знаходять необхідний розмір вибірки для забезпечення бажаної точності оцінювання індикатора.

Якщо розмір (кількість одиниць) генеральної сукупності значно перевищує розмір вибірки ( ), розрахункові формули спрощуються и набувають вигляду

; ;

;

.

Таким чином, загальна процедура оцінки величини будь-якого індикатора стану системи за даними випадкових вибіркових спостережень включає, по-перше, розрахунок вибіркової (за даними вимірювань) величини індикатора, по-друге, визначення стандартного відхилення вибіркової величини, і, по-третє, визначення довірчого інтервалу для дійсної величини індикатора. Розмір вибірки обирається виходячи з бажаної величини коефіцієнта варіації оцінки індикатора або точності оцінки. Але проблема полягає в тому, що формула для розрахунку коефіцієнта варіації оцінки містить стандартну похибку і вибіркове середнє , які до початку обстеження є невідомими величинами. На практиці оцінку цих величин можна отримати наступними способами:

  • виконати обстеження у два етапи, вилучаючи спочатку пробну вибірку з розміром ;

  • за її даними отримуючи значення і і визначають необхідну величину ;

  • за даними попередніх обстежень сукупності, що досліджується, або подібних до неї сукупностей.

Після попередньої оцінки величини і розрахунок необхідного розміру вибірки виконуть за формулою

.

де - бажана величина коефіцієнта варіації (відносної похибки) оцінки.

У більшості обстежень збирають інформацію не за одним, а кількома параметрами. Одним з методів визначення розміру вибірки в такому разі складається в тому, щоб вказати границі похибок для індикаторів, які вважаються найбільш важливими. Потрібний розмір вибірки визначається спочатку окремо для кожного з цих найважливіших індикаторів.

Після того, як значення для окремих індикаторів розраховані, можна розглянути ситуацію в цілому. Може так трапитися, що усі отримані значення достатньо близькі одно до одного. Якщо найбільше значення є прийнятним з точки зору бюджета обстеження, то воно і обирається. Часто, однако, значення сильно розрізняються, при цьому вибір найбільшого з них є небажаним за фінансовими міркуваннями або тому, що загальний рівень точності буде значно вищім ніж передбачалося спочатку. В такому разі, щоб виправдати застосування меньшого значення , бажано рівень точності для окремих параметрів знизити. В деяких випадках значення , що потрібні для вивчення різних індикаторів, настільки розходяться, що може стати доцільним взагалі відмовитися від спостереження за окремими параметрами, оскільки точність оцінки відповідних індикаторів буде абсолютна недостатньою за наявними ресурсами для обстеження.

Робочий приклад 1. З капустяного поля вилучена проста випадкова вибірка розміром =50 качанів. Середня вага качана у вибірці складає =3,5 кг, а стандартна похибка =0,5 кг. Нехтуючи долею відбору ( =0) оцініть:

  1. середню вагу качана на полі;

  2. кількість качанів у вибірці для забезпечення відносної похибки =0,02=2%.

Розрахунок:

1) За довідковими даними знаходимо =2,01; =0,142;

= =3,36 кг; = =3,64 кг; таким чином середня вага качана на полі знаходиться в межах 3,36 кг < < 3,64 кг.

2) У даному випадку ( =0) розрахунок потрібної кількості качанів у вибірці розраховуємо за спрощеною формулою

=206.

Для забезпечення бажаної точності оцінки до вибірки, що вже є, треба добрати ще приблизно 150 качанів.

Оцінка сумарного значення . Ця оцінка виконується досить просто з використанням попередніх формул, а саме:

;

;

;

.

Робочий приклад 2. За вихіднимі даними попереднього прикладу визначити, який урожай отримаюоть з капустіного поля, якщо на ньому зросли 10000 качанів.

Розрахунок: з використанням даних попередніх розрахунків урожай складе величину у межах від 3,36кг*10000=33600кг=33,6т до 3,64кг*10000=36,4т.

Оцінка відношення сумарних або середніх значень .

Вибіркова оцінка відношення розраховується за формулою

;

величина стандартного відхилення оцінки визначається формулою

,

а коефіцієнт варіації оцінки співвідношенням

.