
- •С татистика
- •Для самостійної роботи з дисципліни
- •1. Предмет і методи статистики
- •1.1.Загальне поняття про статистику та історія її виникнення
- •1.2. Предмет статистики
- •1.3. Методи статистики
- •1.4. Основні завдання статистики та її організація
- •2. Статистичне спостереження
- •2.1. Статистичне спостереження як метод інформаційного забезпечення
- •2.2. Програмно-методологічні питання статистичного спостереження
- •2.3.Організаційні питання статистичного спостереження
- •2.4. Форми, види, способи статистичного спостереження
- •3. Статистичні зведення, групування, таблиці
- •3.1. Суть статистичного зведення
- •3.2. Класифікації та групування
- •3.3. Прийоми статистичних групувань
- •3.3.1.Вибір ознаки групування
- •3.3.2.Визначення числа груп і розміру інтервалу
- •3.4. Ряди розподілу та їх види
- •3.5.Статистичні таблиці
- •Правила складання статистичних таблиць:
- •Статистичні показники
- •4.1.Суть і види статистичних показників
- •4.2. Абсолютні статистичні величини, їх суть, види, одиниці виміру
- •4.3. Відносні статистичні величини, їх суть, види та форми виразу
- •4.3.1.Види відносних величин
- •4.4. Середні величини, їх суть, умови використання, способи обчислення
- •4.4.1. Умови застосовування середніх
- •4.6. Обчислення середньої арифметичної інтервального ряду розподілу
- •5. Показники варіації
- •5.1.Необхідність вивчення варіації
- •5.2. Показники варіації
- •5.3. Характеристики форми розподілу
- •5.4. Дисперсія альтернативної ознаки
- •5.5. Види та взаємозв’язок дисперсій
- •6. Вибіркове спостереження
- •6.1.Суть вибіркового спостереження, його переваги перед суцільним спостереженням
- •6.2. Наукова організація вибіркового спостереження
- •6.3. Різновиди вибірок
- •6.4. Обчислення помилок вибірки
- •6.5. Визначення обсягу вибірки і способи поширення вибіркових даних
- •6.6. Способи поширення вибіркових даних на генеральну сукупність
- •6.7. Статистична перевірка гіпотез
- •7. Методи аналізу взаємозв’язків
- •7.1.Поняття про кореляційний аналіз
- •7.2. Коефіцієнт регресії
- •7.3. Визначення щільності зв’язку
- •7.4. Рангова кореляція Спірмена та Кендала
- •7.5. Аналіз взаємозв’язків між атрибутивними ознаками
- •8. Ряди динаміки
- •8.1. Суть і складові елементи динамічного ряду
- •8.2. Характеристики інтенсивності динаміки
- •8.3. Найважливіші прийоми аналізу рядів динаміки
- •1. Спосіб укрупнення інтервалів.
- •Вивантаження вагонів за відділенням залізниці (тис. Ум. Ваг.)
- •Вивантаження вагонів за відділенням залізниці (тис. Ум. Ваг.)
- •Середньомісячне вивантаження вагонів за відділенням залізниці (тис. Ум. Ваг.)
- •2. Метод рухливих (плинних) середніх.
- •Рухливі тричленні середні вивантаження вагонів за відділенням залізниці
- •Рухливі тричленні середні вивантаження вагонів за відділенням залізниці
- •8.4. Сезонні коливання
- •9. Індекси
- •9.2. Методологічні основи побудови зведених індексів
- •9.3. Принципи побудови агрегатних індексів
- •9.4. Взаємозв’язки індексів
- •Перетворення агрегатних індексів у середні
- •9.6. Індекси середніх величин
- •9.7. Територіальні індекси
- •10. Приклади розв’язування типових задач
- •10. 1. Зведення та групування даних
- •10.2.Статистичні показники
- •10.3. Показники варіації
- •10.4. Вибіркове спостереження
- •10.5. Методи аналізу взаємозв’язків
- •10.6.Ряди динаміки
- •Розв’язання.
- •10.7.Індекси
- •11. Варіанти контрольних робіт
- •12. Література
- •12.1.Основна література
- •12.2. Додаткова література
6.5. Визначення обсягу вибірки і способи поширення вибіркових даних
Проектуючи вибіркові обстеження, визначають мінімально достатній обсяг вибірки, за якою вибіркові оцінки репрезентували б основні властивості генеральної сукупності.
Чисельність вибірки залежить від таких факторів:
а) варіації досліджуваної ознаки. Чим більша варіація, тим більшою має бути чисельність вибірки, і навпаки;
b) розміру можливої граничної похибки вибірки. Чим менший розмір можливої похибки, тим більшою має бути чисельність вибірки;
с) значення ймовірності, з якою гарантуватимуть результати вибірки. Чим більша ймовірність, тим більшою має бути чисельність вибірки;
d) способу добору одиниць у вибіркову сукупність.
Для власне випадкової та механічної вибірки при повторному відборі
;
при без повторному −
.
Для
визначення обсягу вибірки n
використовують
оцінки дисперсій
аналогічних
пробних обстежень; якщо такі обстеження
відсутні, можна скористатися
співвідношенням:
,
а для частки взяти значення дисперсії
.
6.6. Способи поширення вибіркових даних на генеральну сукупність
Кінцевою метою будь-якого вибіркового спостереження є поширення його характеристик на генеральну сукупність. Розрізняють два способи поширення даних вибіркового спостереження: прямий перерахунок та метод коефіцієнтів.
Прямий перерахунок використовують у тому випадку, коли треба визначити обсяг ознаки у генеральній сукупності. Робиться це так: середній розмір ознаки, обчислений в результаті вибіркового спостереження, треба помножити на чисельність одиниць генеральної сукупності.
Якщо вибіркове спостереження проводять з метою уточнення результатів суцільного спостереження, застосовують метод коефіцієнтів.
Припустимо,
що суцільний перепис показав, що об’єм
ознаки m.
Під час контрольної перевірки 10%
елементів сукупності було встановлено,
якщо при суцільному спостереженні обсяг
ознаки становив m,
то при контрольному –
.
Таким чином не враховано
ознаки, якщо
,
або враховано лишніх
ознаки, якщо
.
Числа
або
є поправочними коефіцієнтами.
Відбір
вважається задовільним, якщо
.
Якщо
,
вибірка вважається не репрезентативною
і відбір повторюється або ж збільшується
чисельність вибірки.
6.7. Статистична перевірка гіпотез
Статистична гіпотеза — це певне припущення щодо властивостей генеральної сукупності, яке можна перевірити спираючись на результати вибіркового спостереження. Суть перевірки гіпотез полягає в тому, щоб визначити, узгоджуються чи ні результати вибірки з гіпотезою, випадковими чи невипадковими є розбіжності між гіпотезою і даними вибірки. Найчастіше гіпотеза, яку належить перевірити, формулюється як відсутність розбіжності (нульова розбіжність) між невідомим параметром генеральної сукупності G і заданою величиною А, а тому її позначають H0. Зміст гіпотези записують після двокрапки, наприклад Н0: G = А.
Кожній нульовій гіпотезі протиставляють альтернативну На. При формулюванні На враховується вагомість відхилень (G - А): для додатних відхилень На: G > А, для від’ємних — На: G < А, для тих і інших - На: G ≠ А.
Якщо вибіркові дані суперечать гіпотезі H0, вона відхиляється, коли ці дані узгоджуються з гіпотезою H0, вона не відхиляється. Спираючись на результати вибірки, статистична перевірка гіпотез неминуче пов’язана з ризиком прийняття помилкового рішення: ризик І — відхилення правильної нульової гіпотези, ризик II — невідхилення нульової гіпотези, коли насправді правильною є альтернативна. Ці ризики конкуруючі, і зменшення імовірності α одного зумовлює збільшення ймовірності β іншого. Оскільки уникнути ризиків неможливо, а наслідки їх, як правило, різновагомі, то в кожному конкретному дослідженні прагнуть мінімізувати той ризик, який пов’язаний з більшими втратами. Ймовірності ризиків наведено в табл.6.7.1.
Таблиця 6.7.1.
Правильна гіпотеза |
Прийнята гіпотеза |
|
H0 |
Hа |
|
H0 |
1-α |
α |
Hа |
Β |
1-β |
Правило, за яким гіпотеза H0 відхиляється або не відхиляється (приймається), називається статистичним критерієм. Математичною основою будь-якого критерію є статистична характеристика Z, значення якої визначається за даними вибірки, а закон розподілу відомий. Кожне значення характеристики Z має певну ймовірність Р (Z). Якщо вибіркове значення Z малоймовірне, гіпотеза H0 відхиляється.
Межу малоймовірності Z називають рівнем істотності α. Очевидно, що α — це ймовірність ризику І, а тому залежно від змісту гіпотези H0 і наслідків її відхилення рівень істотності визначають у кожному конкретному дослідженні. Зазвичай вибирають один із рівнів α, для яких табульовані значення статистичних характеристик критеріїв. Це α = 0,10; 0,05; 0,025; 0,01.
Значення статистичної характеристики критерію Z1-α поділяє множину вибіркових значень Z на дві частини: а) область допустимих значень і б) критичну область. Якщо вибіркове значення Z потрапляє у критичну область, гіпотеза H0 відхиляється, якщо в область допустимих значень — не відхиляється. Саме тому значення Z1-α називають критичним.
Залежно від того, як сформульована альтернативна гіпотеза, критична область може бути односторонньою (ліво- чи правосторонньою) або двосторонньою (рис. 6.7.1).
α
Z
α
/2
α
/2
Z
Рис. 6.7.1. Лівостороння та двосторонньою критичні області
Статистична гіпотеза перевіряється в такій послідовності:
а) формулюють нульову H0 та альтернативну На гіпотези;
б) вибирають статистичну характеристику Z, за значеннями якої перевіряють правильність гіпотези H0 ;
в) визначають рівень істотності α і відповідне йому критичне значення Z1-α; залежно від формулювання гіпотез H0 і На критична область може бути одно- або двосторонньою;
г) за результатами вибірки розраховують фактичне (вибіркове) значення статистичної характеристики Z, яке порівнюють з критичним Z1-α ; якщо Z> Z1-α , гіпотеза H0 відхиляється, при Z < Z1-α - не відхиляється.