
- •Теорія ймовірностей та математична статистика.
- •Тема 1. Предмет, методи, основні задачі та поняття теорії ймовірностей.
- •Тема 7. Закони великих чисел та центральна гранична теорема
- •Тема 8. Основні поняття математичної статистики: вибіркові спостереження та вибіркові оцінки
- •Тема 9. Методи параметричного та непараметричного оцінювання параметрів
- •Тема10. Методи перевірки статистичних гіпотез
- •§1. Випадкові події. Класифікація подій
- •§2. Операції над подіями
- •§3. Частота події і її властивості
- •§4. Ймовірність події
- •§5. Аксіоматична побудова теорії ймовірності
- •§1. Операції над ймовірностями
- •Ймовірність об’єднання несумісних подій
- •2. Ймовірність перетину подій
- •Ймовірність об’єднання сумісних подій
- •§2. Формула повної ймовірності. Формула Байеса
- •§1. Схема Бернуллі
- •§2. Наймовірніше число успіхів у схемі Бернуллі
- •§3. Граничні теореми теорії ймовірності
- •1. Локальна теорема Муавра-Лапласа
- •2. Інтегральна ознака Муавра-Лапласа
- •3. Гранична теорема Пуассона
- •§1. Випадкові величини та їх розподіл
- •1. Дискретна випадкова величина та її закон розподілу ймовірностей
- •Неперервна випадкова величина та її закони розподілу
- •3. Диференціальна функція розподілу
- •§2. Числові характеристики випадкових величин
- •Дисперсія і середнє квадратичне відхилення.
- •§1. Закони розподілу дискретних випадкових величин
- •§2. Закони розподілу неперервної випадкової величини
- •§3. Закони розподілу, зв’язані з нормальним
- •Лекція 6. Закон великих чисел
- •§1. Нерівність Чебишева
- •§2. Теорема Чебишева
- •§3. Теорема Бернуллі
- •§4. Центральна гранична теорема Ляпунова
- •§1. Статистичний розподіл вибірки та його геометричне зображення
- •§2. Числові характеристики вибірки
- •Лекція 8. Статистичні оцінки параметрів генеральної сукупності
- •§1. Точкові статистичні оцінки параметрів
- •Розглянемо наступну загальну задачу. Маємо випадкову величину х, закон розподілу якої має невідомий параметр а. Потрібно на основі даних вибірки знайти добру оцінку параметру а.
- •§2. Інтервальні статистичні оцінки параметрів
- •Довірчі інтервали для оцінки математичного
- •Довірчі інтервали для математичного сподівання
- •§3. Довірчий інтервал для оцінки середнього квадратичного відхилення
- •Гіпотез
- •§ 2. Критична область. Загальна методика побудови критичних областей
- •§ 3. Перевірка правдивості статистичних гіпотез про рівність двох генеральних середніх.
- •§4. Перевірка гіпотези про нормальний закон розподілу генеральної сукупності. Критерій узгодженості Пірсона
- •§5. Порівняння двох середніх генеральних сукупностей,
- •§1. Рівняння парної регресії
- •§2. Вибірковий коефіцієнт кореляції та його властивості,
- •§1. Багатофакторна регресія
- •§2. Нелінійна регресія
- •Контрольна робота
- •Контрольна робота
Довірчі інтервали для математичного сподівання
при
невідомому
Нехай тепер випадкова величина Х генеральної сукупності розподілена нормально, але середнє квадратичне відхилення невідоме. Потрібно оцінити невідоме математичне сподівання з допомогою довірчих інтервалів, тобто задача пункту 1), але тепер невідоме.
Перш
ніж розв’язувати цю задачу, введемо
деякі поняття. Незалежні умови, що
накладаються на ni
(чи Wi),
називаються в’язами. Наприклад,
-
тобто вимога того, щоб співпадали
теоретичні та вибіркові значення
середнього арифметичного та дисперсії
і т.д. Різниця між числом інтервалів
та числом в’язей називається
числом ступенів вільності
k=n-r,
де r
– число в’язей.
Отже, користуючись розподілом Стьюдента, можна знайти довірчий інтервал:
,
(2)
що
накриває параметр m
з надійністю
.
Тут
та S
шукається по вибірці, а по таблиці 3
(див. додаток) по заданих n
можна знайти
.
Приклад 2. вибіркове обслідування прибутків за місяць підприємців дало результати, дані яких записані у вигляді розподілу:
Прибуток (тис.грн.) хі |
11 |
33 |
44 |
55 |
66 |
77 |
Частота ni |
11 |
11 |
22 |
33 |
22 |
11 |
Побудувати інтервал довір’я для математичного сподівання m, допустивши, що генеральна сукупність Х розподілена нормально з надійністю .
Рішення.
Обчислимо
.
За
надійністю
і числом ступенів вільності k=10-1=9
за таблицею 3 знаходимо
. Тоді згідно формули (2):
.
§3. Довірчий інтервал для оцінки середнього квадратичного відхилення
Нехай випадкова величина Х генеральної сукупності розподілена нормально. Потрібно оцінити невідомий параметр – генеральне середнє квадратичне відхилення за “виправленим” вибірковим середнім відхиленням SВ. Поставимо перед собою задачу знаходження довірчого інтервалу, що накриває параметр , з заданою надійністю .
Вимагаємо
виконання рівності
, або
.
Для того, щоб можна було користуватись таблицею 4 (див. додаток), перетворимо нерівність
в
рівносильну нерівність
.
Поклавши
, отримаємо
.
(1)
Залишається знайти q. Практично для знаходження q користуються таблицею додатку 4. Для цього по вибірці обчислюємо S і по таблиці q, а згідно (1) знаходимо довірчий інтервал, що накриває з заданою надійністю .
Приклад 1. (приклад 2 з §2) n=10, .
Рішення.
З таблиці 4 знайдемо по
,
.
Зауваження.
Якщо q>1,
то
.
Лекція 9. МЕТОДИ СТАТИСТИЧНИХ ПЕРЕВІРОК
Гіпотез
§ І. Статистичні гіпотези. Статистичний критерій перевірки нульової гіпотези.
На практиці часто приходиться на основі результатів випробувань (вибірки) знати закон розподілу генеральної сукупності. Якщо закон розподілу невідомий, але є підстава вважати, що він має певний вигляд (наприклад назвемо його R), то висувають гіпотезу: генеральна сукупність розподілена за законом R, тобто в цій гіпотезі мова йтиме про вигляд передбаченого розподілу.
Можливі випадки, коли закон розподілу відомий, але його параметри невідомі. Якщо є підстава припустити, що його невідомий параметр а рівний певному значенню а0 , то висувають гіпотезу: а= а0; в цьому випадку гіпотеза припускає оцінку параметру конкретного розподілу.
Можливі й інші гіпотези: про рівність параметрів двох чи декількох розподілів, про незалежність вибірок, про значимість вибіркового коефіцієнта кореляції тощо.
Статистичною називають гіпотезу про вигляд невідомого розподілу або про параметри невідомих розподілів. Наприклад, статистичними є гіпотези:
генеральна сукупність розподілена за нормальним законом;
коефіцієнт кореляції генеральної сукупності системи (х, у), розподіленої нормально, відмінний від нуля.
Перевірку гіпотез на основі вибіркових статистичних даних називають статистичною перевіркою гіпотез.
Одну з висунутих гіпотез виділяють в ролі основної і позначають, як правило Н0 (нульова), поряд з нею висувають альтернативну (конкуруючу) гіпотезу, яка суперечить основній і позначають Н1.
Наприклад, якщо нульова гіпотеза полягає в припущенні, що математичне сподівання певного розподілу mx рівне 5, то альтернативна гіпотеза, зокрема, може полягати в тому, що mx 5. Коротко це записують так:
Н0: mx = 5; Н1: mx 5.
Розрізняють також гіпотези за кількістю припущень. Простою називається гіпотеза, що має лише одне припущення, інакше гіпотеза є складною, тобто складається зі скінченного чи нескінченного числа простих гіпотез.
Наприклад. Якщо - параметр показникового розподілу, то гіпотеза Н0: = 2 – проста. Якщо ж гіпотеза Н0: > 5, то складна, бо складається з нескінченної множини простих гіпотез: Н1: = аі, де аі – довільне число, більше .
Очевидно, що на основі статистичних даних дуже важко, іноді і неможливо, робити безпомилкові висновки щодо гіпотез. В підсумку може бути прийняте неправильне рішення, тобто можуть бути допущені помилки двох родів.
Помилка першого роду полягає в тому, що буде відхилена правильна гіпотеза.
Помилка другого роду полягає в тому, що буде прийнята неправильна гіпотеза.
Правильне рішення може бути прийняте також у двох випадках:
а) гіпотеза приймається, причому і в дійсності вона правильна;
б) гіпотеза відхиляється, причому і в дійсності вона неправильна.
Ймовірність здійснити помилку першого роду позначають через і називають її рівнем значимості. Число задають малим і найчастіше використовують значення , що дорівнюють 0,05; 0,001 і т.д. Якщо, наприклад, =0,01, то це означає, що в одному випадку зі 100 є ризик допустити помилку першого роду (відхилити гіпотезу Н0).
Для перевірки нульової гіпотези використовують спеціально підібрану випадкову величину, точний чи наближений розподіл якої відомо. Цю величину позначають через Ф, якщо вона розподілена нормально, F – по закону Фішера-Снедекора, Т – по закону Стьюдента, 2 – по закону “хі квадрат” і т.д. оскільки зараз конкретний вигляд розподілу до уваги не береться, то позначають цю величину взагалі через К.
Статистичним критерієм (просто критерієм) називають випадкову величину К, що служить для перевірки нульової гіпотези. Для різних гіпотез ці критерії є різними.
Наприклад, а) коли перевіряють гіпотезу про рівність дисперсії двох нормальних генеральних сукупностей, то в ролі критерію К беруть відношення виправлених вибіркових дисперсій:
.
Ця величина випадкова, тому в різних випробуваннях дисперсії приймають різні, наперед невідомі значення і розподілені за законом Фішера-Снедокора.
б) найбільш розповсюдженим критерієм перевірки гіпотези Н0 про закон розподілу ознаки генеральної сукупності є критерій узгодженості:
де m – число інтервалів, на які розбита вибірка, n – об’єм вибірки, ni – частота і-го інтервалу, і – ймовірність попадання значень ознаки в і-ий інтервал, яка обчислюється для теоретичного закону розподілу.
Спостережуваним значенням Ксп називається значення критерію, обчислене по результатах вибірки.