
- •О.Г. Кальман, і.О. Христич
- •Затверджено
- •Розділ III. Статистичне спостереження
- •Розділ VII. Абсолютні та відносні величини
- •Розділ X. Ряди динаміки
- •Розділ XI. Індекси
- •Розділ XIII. Міжнародна правова статистика
- •Передмова
- •Розділ I Предмет і метод і статистичної науки
- •§ 1. Поняття та історія розвитку статистики
- •§ 2. Предмет статистичної науки
- •§ 3. Методологія, методи та етапи статистичної науки
- •§ 4. Види господарського обліку
- •§ 5. Галузі статистичної науки та їх взаємозв'язок з іншими науками
- •§ 6. Нормативне забезпечення та організація статистики в Україні
- •Питання та завдання для самоконтролю
- •Розділ іі Предмет і метод правової статистики та значення її показників у забезпеченні правопорядку
- •§ 1. Поняття правової статистики та історія її розвитку в Україні
- •§ 2. Предмет, завдання та мета правової статистики
- •§ 3. Взаємозв'язок правової статистики і загальної теорії статистики
- •§ 4. Етапи та методи правової статистики
- •§ 5. Галузі правової статистики та їх взаємозв’язок з іншими правовими науками
- •§ 6. Структура статистичного апарату в органах суду, органах прокуратури та органах внутрішніх справ
- •§ 7. Значення даних правової статистики для зміцнення правопорядку в країні
- •Питання та завдання для самоконтролю
- •Розділ ііі Статистичне спостереження
- •§ 1. Сутність і організаційні форми статистичного спостереження
- •§ 2. Мета та план статистичного спостереження
- •§ 3. Об'єкти правової статистики. Особливості відображення об'єктів у правовій статистиці
- •§ 4. Одиниці сукупності, спостереження, виміру
- •§ 5. Програма статистичного спостереження
- •§ 6. Види статистичного спостереження
- •§ 7. Способи статистичного спостереження
- •§ 8. Помилки спостереження і види контролю даних
- •Питання та завдання для самоконтролю
- •§ 1. Поняття про статистичні формуляри
- •§ 2. Види документів первинного обліку для реєстрації та обліку злочинів в органах внутрішніх справ, прокуратури, податкової міліції та Служби безпеки України
- •§ 3. Види документів первинного обліку органів суду
- •§ 4. Поняття про статистичну звітність
- •§ 5. Види статистичної звітності в органах внутрішніх справ та органах прокуратури
- •§ 6. Види статистичної звітності в органах суду та органах юстиції
- •§ 7. Види статистичної звітності в органах, які ведуть боротьбу з адміністративними правопорушеннями
- •Питання та завдання для самоконтролю
- •§ 1. Поняття статистичного зведення та його види
- •§ 2. Основні вимоги, завдання та види групувань
- •§ 3. Основні питання методології статистичних групувань
- •§ 4. Групування (класифікації) в правовій статистиці
- •§ 5. Статистичні ряди розподілу
- •§ 6. Статистичні таблиці
- •§ 1. Поняття про статистичні графіки
- •§ 2. Основні елементи статистичних графіків
- •§ 3. Види графіків та правила їх побудови
- •§ 1. Поняття про узагальнюючі показники
- •§ 2. Абсолютні статистичні величини
- •§ 3. Поняття відносних величин та форми їх вираження
- •§4. Види відносних величин
- •§ 1. Поняття середньої величини
- •§ 2. Види середніх величин та техніка їх обчислення
- •§ 3. Поняття моди та медіани
- •§ 4. Показники варіації та способи їх обчислення
- •§ 1. Основні поняття теорії імовірності
- •§ 2. Поняття закону великих чисел. Динамічні та статистичні закономірності
- •§ 3. Вибірковий метод та його значення для вивчення правових явищ
- •§ 4. Основні положення вибіркового спостереження
- •§ 5. Способи відбору одиниць у вибіркову сукупність
- •§ 1. Поняття про статистичні ряди та їх види
- •§ 2. Види рядів динаміки та правила їх побудови
- •§ 3. Основні показники рядів динаміки і техніка їх обчислення
- •§ 4. Вивчення закономірностей ряду динаміки
- •§ 5. Інтерполяція, екстраполяція та прогнозування з використанням рядів динаміки
- •§ 1. Поняття індексного методу
- •§ 2. Правила побудови індивідуальних індексів
- •§ 3. Правила побудови та обчислення загальних індексів. Агрегатний індекс - основна форма загального індексу
- •§ 4. Поняття середніх індексів
- •§ 5. Базисні та ланцюгові індекси
- •§ 1. Поняття про взаємозв'язок статистичних показників
- •§ 2. Види та форми зв'язків між явищами
- •§ 3. Прийоми виявлення щільності зв'язку між показниками досліджуваних явищ
- •§ 1. Поняття, завдання і методи міжнародної правової статистики
- •§ 2. Правова статистика міжнародних організацій
- •§ 3. Організація правової статистики у зарубіжних країнах
§ 4. Основні положення вибіркового спостереження
При вибірковому спостереженні можуть виникати помилки реєстрації і похибки вибірки (репрезентативності).
Помилки реєстрації, як і при суцільному статистичному спостереженні, являють собою розбіжність між зафіксованими даними в процесі спостереження і дійсними даними. Вони можуть бути випадковими і систематичними. Як правило, помилки реєстрації при вибірковому спостереженні трапляються рідко, тому що значно менший обсяг роботи припадає на одного реєстратора, самі реєстратори завжди більш кваліфіковані, ніж при проведенні суцільного спостереження.
Як уже відзначалося, похибки репрезентативності притаманні будь-якому вибірковому спостереженню. Завдання організації правильного проведення вибіркового спостереження — це вибір такої похибки репрезентативності, яка б задовольняла дослідника при даному спостереженні.
Зупинимося на основних термінах вибіркового спостереження. Основні поняття: генеральна і вибіркова сукупності. Генеральна сукупність — це вся сукупність одиниць, з якої проводиться відбір частини одиниць для вибіркового спостереження. Відібрана в певний спосіб частина генеральної сукупності для вибіркового спостереження називається вибірковою сукупністю. Узагальнюючі показники генеральної сукупності називаються генеральними, а відповідні показники вибіркової сукупності — вибірковими. Позначення показників генеральної та вибіркової сукупностей наведено втабл.13.
Таблиця 13 Позначення показників генеральної та вибіркової сукупності
Показник
|
Позначення
|
|
у генеральній сукупності
|
у вибірковій сукупності
|
|
Кількість одиниць
|
N
|
п
|
Середнє значення ознаки
|
х
|
х
|
Частина одиниць, що мають дану ознаку
|
Р
|
\У
|
Частина одиниць, що не мають даної ознаки
|
^=1-р
|
1-У/
|
. Переваги вибіркового спостереження перед суцільним реалізуються лише при додержанні наукових принципів його організації і проведення, насамперед неупередженого, випадкового відбору одиниць для спостереження. Вибіркова сукупність повинна повністю відтворювати склад генеральної сукупності. Принцип випадковості відбору забезпечує всім одиницям генеральної сукупності рівні можливості потрапити у вибіркову сукупність.
При проведенні вибіркового спостереження слід спиратися на знання закону великих чисел і теорії імовірності. Але незалежно від того, яким чином проводився відбір одиниць сукупності, завжди будуть розбіжності між характеристиками генеральної і вибіркової сукупностей, пов'язані із сутністю вибіркового методу. Частина завжди відрізняється від цілого. Розбіжності між показниками генеральної і вибіркової сукупностей називаються похибками репрезентативності. Існування їх пояснюється тим, що вибіркова су-
купність не зовсім точно відображає склад генеральної сукупності. Середня в генеральній сукупності відрізняється від середньої у вибірковій сукупності на величину похибки репрезентативності:
де Д (дельта) — похибка репрезентативності.
Наприклад, після проведення вибіркового спостереження з'ясувалось, що середній вік рецидивістів дорівнює 32 рокам (х). Розрахована похибка репрезентативності (А) становить +5%, інакше кажучи — 1,6 роки (32х5%, або 32 х 0,05 = 1,6). Відповідно до наведеної формули середній вік рецидивістів у всій сукупності (32,0 ± 1,6) коливатиметься в межах від 30,4 до 33,6 років. Таким чином, ми вирішили головне завдання вибіркового спостереження — за здобутими нами вибірковими показниками (одержаними внаслідок проведеного дослідження) з'ясувати, чому дорівнюватимуть відповідні показники генеральної сукупності, які нам невідомі.
Згідно з теоремою Чебишева з уточненнями Ляпунова в математиці було доведено, що при достатньо великій кількості обстежених одиниць сукупності середня величина досліджуваної ознаки у вибірковій сукупності відрізнятиметься від середньої величини в генеральній сукупності на величину
де Д (дельта) — гранична похибка вибірки, тобто похибка репрезентативності; р- (мю) — середня похибка вибірки; / — коефіцієнт, що залежіть від імовірності, з якою можна гарантувати певний розмір похибки репрезентативності. Якщо / = 0, то імовірність також дорівнює 0; якщо 1= 0,5, то імовірність дорівнює 0,383, або 38,3%; якщо ї= 1, то імовірність дорівнює 0,683, або 68,3%; якщо ї= 2, то імовірність дорівнює 0,954, або 95,4%; якщо /= З, то імовірність дорівнює 0,997, або 99,7 %; якщо 1= 4, то імовірність" становить 0,999936 і т.под. При цьому слід враховувати, що даний коефіцієнт може приймати не тільки цілі числа, а й дробові значення (інші умовні позначення містяться у табл. 13).
Із наведеної формули випливає, що похибка репрезентативності залежить від багатьох чинників: імовірності, з якою ми бажаємо одержати результат; кількості одиниць вибіркової сукупності (чим менше одиниць складатиме вибіркова сукупність, тим більше буде ;
похибка репрезентативності, і навпаки); однорідності досліджуваної сукупності (чим більш різнорідною є сукупність, тим більше буде похибка репрезентативності) і від способу відбору одиниць у вибіркову сукупність.
Як правило, при вибірковому спостереженні перед дослідником для успішного його проведення необхідно поставити два взаємопов'язаних завдання: 1) визначення необхідної кількості одиниць вибіркової сукупності, тобто скільки одиниць обстежуватиметься; та 2) розрахунок похибки репрезентативності з встановленим рівнем імовірності, тобто межі можливих відхилень вибіркового показника від відповідного показника в генеральній сукупності.
Багаторічна практика свідчить про те, що довірча імовірність 95,4 % (для / = 2) є оптимальною для більшості розрахунків у різних галузях господарства, тим більше для правових явищ. Тому для полегшення досить громіздких розрахунків похибки вибіркового спостереження існують спеціальні таблиці, застосовуючи які можна визначити або величину похибки репрезентативності при певній кількості спостережень з довірчою імовірністю 95,4% (табл. 14), або кількість вибіркових спостережень при заданій величині похибки репрезентативності з довірчою імовірністю 95,4 % (табл. 15) без використання вищенаведених формул. Застосування таблиць (14 або
Таблиця 14 Величина похибки вибірки при даній кількості спостережень
ї
|
• • " '
|
||||||||||
Величина показника, %
|
Кількість спостережень
|
||||||||||
100
|
200
|
300
|
400
|
500
|
600
|
700
|
800
|
900
|
1000
|
||
5(95)
|
4,4
|
3,1
|
2,8
|
2,5
|
1,9
|
1,8
|
1,6
|
1,5
|
1,4
|
1,4
|
|
10 (90)
|
6,0
|
4,3
|
3,5
|
3,0
|
2,7
|
2,5
|
2,3
|
2,1
|
2,0
|
1,9
|
|
15(85)
|
7,2
|
5,1
|
4,1
|
3,6
|
3,2
|
2,9
|
2,7
|
2,5
|
2,4
|
2,3
|
|
20 (80)
|
8,0
|
5,7
|
4,6
|
4,0
|
3,6
|
3,3
|
3,0
|
2,8
|
2,7
|
2,5
|
|
25 (75)
|
8,7
|
6,2
|
5,0
|
4,3
|
3,9
|
3.5
|
3,3
|
3,1
|
2,9
|
2,7
|
|
30 (70)
|
9,2
|
6,5
|
5,3
|
4,6
|
4,1
|
3,7
|
3,5
|
3,2
|
3,1
|
2,9
|
|
35 (65)
|
9,6
|
6,8
|
5,5
|
4,8
|
4,3
|
3,9
|
3,6
|
3,4
|
3,2
|
3,0
|
|
40 (60)
|
9,9
|
7,0
|
5,6
|
4,9
|
4,4
|
4,0
|
3,7
|
3,5
|
3,3
|
3,1
|
|
45 (55)
|
10,0
|
7,1
|
5,7
|
5,0
|
4,5
|
4,1
|
3,8
|
3,5
|
3,3
|
3,1
|
|
50
|
10,0
|
7,1
|
5,8
|
5.0
|
4,5
|
4,1
|
3,8
|
3.5
|
3,3
|
3,2
|
15) значно спрощує розрахунки і дає змогу швидше одержати результати. Вперше в навчальній літературі з правової статистики аналогічні таблиці було наведено у підручнику С. Остроумова «Со-ветская судебная статистика» (М., 1970).
Таблиця 14 дає можливість відповісти на питання, яку мінімальну кількість одиниць сукупності необхідно включити до вибіркової сукупності, щоб очікуваний результат похибки репрезентативності коливався в установлених межах.
На підставі даних, наведених у табл. 14, видно, що чим більше одиниць потрапляє до вибіркової сукупності, тим менше буде можливою похибка вибірки, і навпаки. Це зрозуміло, бо при значному збільшенні одиниць, які потрапили до вибіркової сукупності, ми проводитиме суцільне спостереження.
Як можна і треба користуватися табл. 14? Наприклад, припустимо, що на основі обстеження 200 осіб, яких засуджено за тяжкі насильницькі злочини, було встановлено, що 65% з них вчинено в стані алкогольного сп'яніння. Нас цікавить, наскільки достовірним є цей результат, тобто в яких межах коливається дане значення в усій генеральній сукупності.
Заданими табл. 14 визначаємо, що на перетині горизонтального рядка з числом 65 з вертикальною другою графою з числом 200 знаходиться число 6,8. Це означає, що частка засуджених, що вчинили тяжкі насильницькі злочини в стані сп'яніння, може коливатися в межах від 58,2 % до 71,8 % (65% ± 6,8 %).
Якщо табл. 14 відсутня, то в цьому випадку всі розрахунки необхідно проводити на базі раніше наведеної формули (с. 212). Так, для приклада, який наведено і обчислено за допомогою табл. 14, де і = 2; и1 = 0,65; п = 200, ми одержимо похибку репрезентативності внаслідок такого розрахунку:
У конкретно-правових дослідженнях, як правило, відсоток похибки середнього значення задається самим дослідником на основі програми спостереження і відповідно до даних раніш проведених досліджень. Як правило, вважається допустимою гранична похибка вибірки (похибка репрезентативності) в межах 3 — 5 %.
Якщо допустити похибку вдвічі більшу, то обсяг вибірки можна зменшити в чотири рази, і навпаки, якщо необхідно зменшити похибку вибірки вдвічі, то обсяг вибірки треба збільшити в чотири рази.
Слід звернути увагу на те, що табл. 14 побудовано для власне випадкового способу відбору одиниць у вибіркову сукупність, тому її з більшим ступенем вірогідності можна використовувати при механічному і типовому способах відбору одиниць у вибіркову сукупність. При серійному (гніздовому) способі відбору одиниць у вибірку використовувати дані, наведені в таблицях 14 і 15, не можна. (Більш докладно способи відбору одиниць у вибіркову сукупність викладено в наступному підрозділі цього розділу підручника.)
Найважливіше завдання при проведенні вибіркового дослідження правових явищ — це визначення репрезентативного обсягу вибіркового спостереження, тобто скільки необхідно проаналізувати одиниць з генеральної сукупності, щоб одержана випадкова похибка середнього значення досліджуваної ознаки не перевершувала визначеної величини похибки репрезентативності з достатньою імовірністю.
Спираючись на математичні теореми закону великих чисел, можна встановити, що при зменшенні обсягу вибірки в декілька квадратів разів похибка середнього значення збільшується в стільки ж разів, і навпаки, зменшення похибки середнього значення вибірки в декілька разів призводить до збільшення обсягу вибірки в стільки ж квадратів разів. Отже, визначення величини похибки середнього значення ознаки для встановлення обсягу вибірки є дуже важливим.
При практичному застосуванні формул дослідник завжди стикається з тим, що необхідні дані про коливання ознаки в генеральній сукупності. Як правило, на практиці для визначення обсягу вибірки вдаються до даних попередніх досліджень або проводять так звані пробні обстеження і на їх основі визначають орієнтовні розміри коливання ознаки.
Взагалі слід пам'ятати, що головне при організації вибіркового спостереження — це доведення його обсягу до допустимого мінімуму. При цьому не слід прагнути до надмірного зменшення меж похибки вибірки, бо це може призвести до невиправданого збільшення обсягу вибірки і, отже, до підвищення витрат на проведення вибіркового спостереження. В той же час не можна і надмірно збільшувати розмір похибки репрезентативності, оскільки в цьому випадку хоча і відбудеться зменшення обсягу вибіркової сукуп-
ності, але це призведе до погіршення достовірності одержаних результатів.
Наведемо приклад визначення чисельності вибірки на основі табл. 15. Припустимо, що величина досліджуваного показника дорівнює 40 % (частка (питома вага) тяжких злочинів в області), а похибка репрезентативності, яку вважаємо допустимою при даному дослідженні, не повинна перевищувати ± 4 %. За табл. 15 визначаємо, що мінімальний обсяг вибіркової сукупності повинен скласти 600. Отже, щоб наше вибіркове дослідження було репрезентативним з довірчою імовірністю в 95,4 % за наших вихідних даних, нам необхідно обстежити як мінімум 600 засуджених.
Таблиця 15
Кількість спостережень, які необхідно провести при заданій похибці репрезентативності (обсяг вибіркової сукупності)
Величина показника,%
|
Величина похибки репрезентативності, %
|
|
|||||
1
|
2
|
3
|
4
|
5
|
10
|
||
10
|
3600
|
900
|
400
|
230
|
150
|
37
|
|
20
|
6400
|
1600
|
710
|
400
|
260
|
65
|
|
40
|
9600
|
2400
|
1070
|
600
|
390
|
97
|
|
45
|
9900
|
2500
|
1100
|
620
|
400
|
100
|
|
55
|
9900
|
2500
|
1100
|
620
|
400
|
100
|
|
65
|
9100
|
2300
|
1010
|
570
|
370
|
92
|
|
70,
|
8400
|
2100
|
930
|
530
|
340
|
85
|
|
80
|
6400
|
1600
|
710
|
400
|
260
|
65
|
Обсяг вибіркової сукупності також обчислюється на базі раніш наведеної формули (якщо відсутня табл. 15). Формула для встановлення обсягу вибіркової сукупності шляхом її нескладного перетворення матиме такий вигляд:
де л — обсяг вибіркової сукупності; v— частина одиниць, які мають дану ознаку; / — коефіцієнт, квадрат якого гарантує вірогідність довірчого інтервалу в 95,4 %; Д — похибка репрезентативності.
За даними, обчисленими на базі табл. 15, де І2 = 4; v = 40 % (0,40); Д2 = ± 4 % (± 0,04), у вибіркову сукупність необхідно взяти 600 одиниць, щоб із імовірністю 95,4% можна було стверджувати, що похибка репрезентативності при обчисленні частки сукупності не відхилятиметься більше ніж на ± 4%, якщо відомо, що значення частки у сукупності досягає 40%, тобто за наведеною формулою
Якщо внаслідок обчислення ми одержимо обсяг вибіркової сукупності у вигляді не цілого числа, то необхідно прийняти її у вигляді найбільшого числа, наприклад, щоб з імовірністю 95,4% можна було стверджувати, що похибка репрезентативності при обчисленні частки сукупності не відхилятиметься більше ніж на ± 4%. Значення частки у сукупності досягає 25%, тобто за наведеною формулою
жали, що обсяг вибіркової сукупності повинен становити 468,75 одиниць (тим більше, що аналогічні дані в таблицях 14 і 15 відсутні), отже, у вибіркову сукупність необхідно взяти 470—500 одиниць, щоб якість нашого вибіркого спостереження не погіршилася.
У більшості випадків при вибіркових дослідженнях дані аналізуються і збирають не по одному, а по декількох ознаках одночасно. У цьому випадку необхідний обсяг вибіркової сукупності визначається по кожній з цих ознак, а потім для дослідження приймається максимальна величина по одній з найбільш істотних ознак.
За наявності якісної сукупності альтернативних ознак (подія може або настати, або не настати), якщо невідома реальна величина коливання ознаки, його величина приймається рівнозначною 50% (більш докладно це відображено в розділі VIII підручника).