- •С татистика
- •Для самостійної роботи з дисципліни
- •1. Предмет і методи статистики
- •1.1.Загальне поняття про статистику та історія її виникнення
- •1.2. Предмет статистики
- •1.3. Методи статистики
- •1.4. Основні завдання статистики та її організація
- •2. Статистичне спостереження
- •2.1. Статистичне спостереження як метод інформаційного забезпечення
- •2.2. Програмно-методологічні питання статистичного спостереження
- •2.3.Організаційні питання статистичного спостереження
- •2.4. Форми, види, способи статистичного спостереження
- •3. Статистичні зведення, групування, таблиці
- •3.1. Суть статистичного зведення
- •3.2. Класифікації та групування
- •3.3. Прийоми статистичних групувань
- •3.3.1.Вибір ознаки групування
- •3.3.2.Визначення числа груп і розміру інтервалу
- •3.4. Ряди розподілу та їх види
- •3.5.Статистичні таблиці
- •Правила складання статистичних таблиць:
- •Статистичні показники
- •4.1.Суть і види статистичних показників
- •4.2. Абсолютні статистичні величини, їх суть, види, одиниці виміру
- •4.3. Відносні статистичні величини, їх суть, види та форми виразу
- •4.3.1.Види відносних величин
- •4.4. Середні величини, їх суть, умови використання, способи обчислення
- •4.4.1. Умови застосовування середніх
- •4.6. Обчислення середньої арифметичної інтервального ряду розподілу
- •5. Показники варіації
- •5.1.Необхідність вивчення варіації
- •5.2. Показники варіації
- •5.3. Характеристики форми розподілу
- •5.4. Дисперсія альтернативної ознаки
- •5.5. Види та взаємозв’язок дисперсій
- •6. Вибіркове спостереження
- •6.1.Суть вибіркового спостереження, його переваги перед суцільним спостереженням
- •6.2. Наукова організація вибіркового спостереження
- •6.3. Різновиди вибірок
- •6.4. Обчислення помилок вибірки
- •6.5. Визначення обсягу вибірки і способи поширення вибіркових даних
- •6.6. Способи поширення вибіркових даних на генеральну сукупність
- •6.7. Статистична перевірка гіпотез
- •7. Методи аналізу взаємозв’язків
- •7.1.Поняття про кореляційний аналіз
- •7.2. Коефіцієнт регресії
- •7.3. Визначення щільності зв’язку
- •7.4. Рангова кореляція Спірмена та Кендала
- •7.5. Аналіз взаємозв’язків між атрибутивними ознаками
- •8. Ряди динаміки
- •8.1. Суть і складові елементи динамічного ряду
- •8.2. Характеристики інтенсивності динаміки
- •8.3. Найважливіші прийоми аналізу рядів динаміки
- •1. Спосіб укрупнення інтервалів.
- •Вивантаження вагонів за відділенням залізниці (тис. Ум. Ваг.)
- •Вивантаження вагонів за відділенням залізниці (тис. Ум. Ваг.)
- •Середньомісячне вивантаження вагонів за відділенням залізниці (тис. Ум. Ваг.)
- •2. Метод рухливих (плинних) середніх.
- •Рухливі тричленні середні вивантаження вагонів за відділенням залізниці
- •Рухливі тричленні середні вивантаження вагонів за відділенням залізниці
- •8.4. Сезонні коливання
- •9. Індекси
- •9.2. Методологічні основи побудови зведених індексів
- •9.3. Принципи побудови агрегатних індексів
- •9.4. Взаємозв’язки індексів
- •Перетворення агрегатних індексів у середні
- •9.6. Індекси середніх величин
- •9.7. Територіальні індекси
- •10. Приклади розв’язування типових задач
- •10. 1. Зведення та групування даних
- •10.2.Статистичні показники
- •10.3. Показники варіації
- •10.4. Вибіркове спостереження
- •10.5. Методи аналізу взаємозв’язків
- •10.6.Ряди динаміки
- •Розв’язання.
- •10.7.Індекси
- •11. Варіанти контрольних робіт
- •12. Література
- •12.1.Основна література
- •12.2. Додаткова література
6.4. Обчислення помилок вибірки
Всі види відбору (крім механічного) можуть бути повторними і безповторними. Механічний відбір завжди безповторний.
Методи відбору:
1. Безповторний - коли відібрана у вибірку одиниця сукупності не повертається у генеральну і більше у відборі не приймає участі. Тобто збільшується можливість інших одиниць попасти у вибірку.
2. Повторний - коли відібрана у вибірку одиниця сукупності реєструється, повертається у генеральну сукупність і знову може бути відібрана.
Безповторний відбір дає точніші результати порівняно з повторним, оскільки за однакового обсягу вибірки без повторні дослідження охоплюють більше одиниць сукупності, ніж повторні.
Повторний та безповторний методи відбору залежно від характеру відбору одиниць поділяються на три види:
індивідуальний – відбір окремих одиниць сукупності;
груповий (серійний) – відбір груп (серії)одиниць;
комбінований – комбінація індивідуального і групового.
Від основи вибірки залежить спосіб добору елементів сукупності для обстеження.
Для узагальнюючої характеристики похибок вибірки розраховують середню похибку репрезентативності, яку називають стандартною. Стандартна похибка вибірки є середнім квадратичним відхиленням вибіркових оцінок від значення параметра в генеральній сукупності. Розмір похибки залежить від чисельності вибіркової сукупності – чим більше одиниць відібрано, тим менша похибка; від варіації ознаки у генеральній сукупності – чим більша варіація ознаки, тим більша у середньому і похибка вибірки.
Середня помилка власне випадкової та механічної вибірок обчислюється за формулами (таб.6.4.1):
Таблиця 6.4.1
Спосіб відбору |
Без повторний відбір |
Повторний відбір |
Для середнього значення ознаки |
|
|
Для частки |
|
|
де N − обсяг сукупності; n − обсяг вибірки; σ2 – дисперсія генеральна.
Оскільки на практиці генеральна дисперсія нам не відома, то використовують формули для повторної вибірки , для безповторної вибірки відомі з теорії ймовірностей. Тоді або .
При практичному використанні наведених формул слід враховувати, що:
дисперсія частки , де p i q – частки вибірки, елементам яких відповідно властиве і невластиве дане значення ознаки;
у великих за обсягом сукупностях (30 і більше одиниць) поправка не вносить істотних змін у розрахунки, а тому враховується лише у малочислених вибірках;
коригуючий множник для безповторної вибірки при малих величинах наближається до 1, а тому при 1-5%-ній вибірці розрахунок ведеться за формулою для повторної вибірки; при 10%-вій вибірці коригуючий множник становить 0, 949, при 20%-вій – 0,894.
Крім стандартної похибки вибірки обчислюють похибку граничну – максимально можливе відхилення вибіркової оцінки від значення параметра в генеральній сукупності для заданої ймовірності F(x).
Гранична похибка вибірки: . Довірче число t вказує, як співвідносяться гранична та стандартна похибки.
Формула граничної похибки випливає з основних положень теорії вибіркового методу.
Однією з головних теорем, покладених в основу теорії вибіркового методу, є теорема П. Л. Чебишева, за допомогою якої він довів, що з ймовірністю, скільки завгодно близькою до одиниці, можна стверджувати, що при достатньо великому числі незалежних спостережень вибіркова середня буде мало відрізнятися від генеральної середньої при проведенні повторної вибірки.
Академік А. А. Марков довів збереження цієї умови для незалежних спостережень. Академік А. М. Ляпунов дослідив, що ймовірність відхилень вибіркової середньої від генеральної середньої при достатньо великому обсязі вибірки та обмеженій дисперсії генеральної сукупності підпорядковується закону нормального розподілу. Ймовірність цих відхилень при різних значеннях t визначається за формулою
.
Значення цього інтеграла при різних значеннях t табульовані і наводяться в спеціальних таблицях.
Для , ; для , ; для , .
Це означає, що наприклад, з ймовірністю 0,954 можна стверджувати, що похибка репрезентативності вибірки не перевищує ±2μ .
Зі збільшенням вибіркової сукупності підвищується точність вибіркових даних. Проте іноді доводиться обмежуватися малою кількістю спостережень. Вибіркову сукупність, яка складається з порівняно невеликої кількості одиниць (20 ... 30), називають малою вибіркою. Математичною статистикою доведено, що й при малих вибірках характеристики вибіркової сукупності можна поширити на генеральну. Проте обчислення середньої та граничної похибок мають свої особливості.
При малих вибірках дисперсію обчислюють з урахуванням кількості ступенів вільності варіації.
Ступенем вільності варіації називають кількість одиниць, здатних змінюватися після того, як для всіх одиниць вибірки було визначено їх загальну характеристику.
Англійський вчений Ст’юдент винайшов закон розподілу відхилень вибіркових середніх від генеральної для малих вибірок. За цим законом він побудував таблиці, в яких наводяться значення критерію t для малих вибірок.
Згідно з розподілом Ст’юдента ймовірна оцінка того, що гранична похибка не перевищить t–кратну середню похибку в малих вибірках, залежить від значення t та кількості ступенів свободи .
У практиці вибіркових спостережень використовують два типи оцінок − точкові і інтервальні.
Точкова оцінка − це значення параметра за даними вибірки: вибіркова середня − та вибіркова частка .
Інтервальна оцінка − це інтервал значень параметра, розрахований за даними вибірки для певної імовірності.
Межі довірчого інтервалу визначають на основі точкової оцінки та граничної похибки вибірки:
для середньої ;
для частки .
У статистичному аналізі часто постає потреба порівняти похибки вибірки різних ознак або однієї і тієї ж самої в різних сукупностях.
Такі порівняння виконують за допомогою відносної похибки, яка показу, на скільки відсотків вибіркова оцінки може відхилятися від параметра генеральної сукупності. Відносна стандартна похибка середньої – це коефіцієнт варіації вибіркових середніх:
.
На практиці достатнім рівнем точності вважається . Іноді використовують граничну відносну похибку, яка враховує ймовірність статистичного висновку:
.