
- •Теорія ймовірностей та математична статистика.
- •Тема 1. Предмет, методи, основні задачі та поняття теорії ймовірностей.
- •Тема 7. Закони великих чисел та центральна гранична теорема
- •Тема 8. Основні поняття математичної статистики: вибіркові спостереження та вибіркові оцінки
- •Тема 9. Методи параметричного та непараметричного оцінювання параметрів
- •Тема10. Методи перевірки статистичних гіпотез
- •§1. Випадкові події. Класифікація подій
- •§2. Операції над подіями
- •§3. Частота події і її властивості
- •§4. Ймовірність події
- •§5. Аксіоматична побудова теорії ймовірності
- •§1. Операції над ймовірностями
- •Ймовірність об’єднання несумісних подій
- •2. Ймовірність перетину подій
- •Ймовірність об’єднання сумісних подій
- •§2. Формула повної ймовірності. Формула Байеса
- •§1. Схема Бернуллі
- •§2. Наймовірніше число успіхів у схемі Бернуллі
- •§3. Граничні теореми теорії ймовірності
- •1. Локальна теорема Муавра-Лапласа
- •2. Інтегральна ознака Муавра-Лапласа
- •3. Гранична теорема Пуассона
- •§1. Випадкові величини та їх розподіл
- •1. Дискретна випадкова величина та її закон розподілу ймовірностей
- •Неперервна випадкова величина та її закони розподілу
- •3. Диференціальна функція розподілу
- •§2. Числові характеристики випадкових величин
- •Дисперсія і середнє квадратичне відхилення.
- •§1. Закони розподілу дискретних випадкових величин
- •§2. Закони розподілу неперервної випадкової величини
- •§3. Закони розподілу, зв’язані з нормальним
- •Лекція 6. Закон великих чисел
- •§1. Нерівність Чебишева
- •§2. Теорема Чебишева
- •§3. Теорема Бернуллі
- •§4. Центральна гранична теорема Ляпунова
- •§1. Статистичний розподіл вибірки та його геометричне зображення
- •§2. Числові характеристики вибірки
- •Лекція 8. Статистичні оцінки параметрів генеральної сукупності
- •§1. Точкові статистичні оцінки параметрів
- •Розглянемо наступну загальну задачу. Маємо випадкову величину х, закон розподілу якої має невідомий параметр а. Потрібно на основі даних вибірки знайти добру оцінку параметру а.
- •§2. Інтервальні статистичні оцінки параметрів
- •Довірчі інтервали для оцінки математичного
- •Довірчі інтервали для математичного сподівання
- •§3. Довірчий інтервал для оцінки середнього квадратичного відхилення
- •Гіпотез
- •§ 2. Критична область. Загальна методика побудови критичних областей
- •§ 3. Перевірка правдивості статистичних гіпотез про рівність двох генеральних середніх.
- •§4. Перевірка гіпотези про нормальний закон розподілу генеральної сукупності. Критерій узгодженості Пірсона
- •§5. Порівняння двох середніх генеральних сукупностей,
- •§1. Рівняння парної регресії
- •§2. Вибірковий коефіцієнт кореляції та його властивості,
- •§1. Багатофакторна регресія
- •§2. Нелінійна регресія
- •Контрольна робота
- •Контрольна робота
§1. Статистичний розподіл вибірки та його геометричне зображення
Нехай вивчається деяка випадкова величина Х, закон розподілу якої невідомий. З цією метою над випадковою величиною Х проводиться ряд незалежних випробувань (вимірів). Результати вимірювань заносять в таблицю, що називають статистичним рядом, яка є первинною формою опису статистичного матеріалу і може бути оброблена різними способами, наприклад:
а) статистичним розподілом вибірки називається таблиця, в якій вказані значення х ознаки Х у зростаючому порядку (в цьому випадку значення утворюють дискретний варіаційний ряд, самі значення ознаки називаються варіантами), а також відповідні частоти або відносні частоти
Варіанти Х |
Х1 |
Х2 |
… |
Хі |
… |
Хk |
Частота ni |
n1 |
n2 |
… |
ni |
… |
nk |
Відносна частота
|
|
|
… |
|
… |
|
де
n=n1+n2+…nk,
,
якщо i>j,
;
б) якщо згрупувати значення ознаки в зростаючому порядку в інтервалі довжиною h (крок інтервалу), то одержимо інтервальний варіаційний ряд. Вказавши число ni значень ознаки, що попали в і-ий інтервал, і звівши дані в таблицю, одержимо статистичний розподіл інтервального варіаційного ряду
Варіант-інтервал h=xi-xi-1 |
[x0,x1] |
[x1,x2] |
… |
[xi-1,xk] |
… |
[xk-1,xk] |
Частота ni |
n1 |
n2 |
… |
ni |
… |
nk |
Відносна частота Wi |
W1 |
W2 |
… |
Wi |
… |
Wk |
де
весь інтервал значень
.
в) статистичною (емпіричною) функцією розподілу вибірки називається закон зміни частоти події X<x в даному статистичному матеріалі:
,
(1)
де
n(x)
– число значень варіант, для яких
, n
– об’єм
вибірки; тобто щоб знайти, наприклад,
F*(x3),
потрібно число варіант, менших х3,
розділити на весь об’єм
вибірки n.
Аналогом теоретичної диференціальної функції (густини) розподілу служить щільність відносної частоти
.
(2)
На відміну від
емпіричної функції розподілу вибірки
функція розподілу F(x)
генеральної сукупності називається
теоретичною
функцією
розподілу. Різниця між ними полягає в
тому, що теоретична функція F(x)
визначає ймовірність події X<x,
а емпірична функція F*(x)
визначає відносну частоту цієї ж події.
По теоремі Бернуллі при
по
ймовірності. Іншими словами, при великих
n
числа F*(x)
і F(x)
мало різняться одне від одного в
розумінні, що
.
Звідси можна зробити висновок про
доцільність використання емпіричної
функції розподілу вибірки для наближеного
представлення теоретичної (інтегральної)
функції розподілу генеральної сукупності.
Такий висновок підтверджується ще й тим, що F*(x) має всі властивості F(x). Дійсно, з означення функції F*(x) випливають її властивості:
1)
2) F*(x) - неспадна функція;
3) якщо х1 – найменша варіанта, то F*(x)=0 при x<x1, якщо xk – найбільша варіанта, то
F*(x)=1 при x>xk.
Отже, емпірична (статистична) функція розподілу вибірки є оцінкою теоретичної функції розподілу генеральної сукупності.
Для наочного зображення статистичних розподілів використовують графіки та діаграми: полігон, гістограму, кумуляту, огіву.
Полігон частот – многокутник (ламана), побудований в системі координат (x,ni) або (x,Wi) (полігон частот або відносних ачастот). Для його побудови на осі абсцис відкладають варіанти хі, а на осі ординат – відповідні їм ni чи Wi. Точки (xi,ni) чи (xi,Wi) з’єднують відрізками прямих і отримують полігон частот.
Гістограма
– діаграма в системі координат
. Її доцільно будувати у випадку
неперервної ознаки, для чого інтервал,
в якому містяться всі спостережувані
значення ознаки розбивають на декілька
часткових інтервалів довжиною
і знаходять для кожного часткового
інтервалу ni
– суму частот
ваірант, що попали в і-ий
інтервал. Для її графіка будується
ступінчата фігура, що складається з
прямокутників, основами яких є частинні
інтервали довжиною h,
а висоти рівні відношенню
або
.
Отже, на осі абсцис відкладаються
частинні інтервали, а над ними проводять
відрізки, паралельні осі абсцис на
висоті
. Тоді площа і-го
частинного прямокутника рівна
- сумі частот варіант (відносних частот)
і-го
інтервалу, а площа гістограми частот
рівна об’єму
вибірки
чи
.
Кумулята – ламана лінія в системі координат (x,F*(x)) (для дискретного варіаційного ряду).
Огіва – крива в системі координат (x,F*(x)) (для інтервального ряду).
Приклад 1. Скласти таблицю статистичного розподілу розміру Х чоловічого взуття, яке продане магазином протягом дня: 39, 40, 41,40, 43, 41, 44, 42,40,42, 41, 41, 43, 42, 39, 42, 43, 41, 42, 41, 38, 42, 42, 41, 40, 41, 43, 39, 40, та побудувати полігон та кумуляту.
Рішення. Таблиця розподілу дискретного ряду має вигляд:
№ п/п |
Варіанта Х- розмір взуття |
Частота ni |
Частота Ni |
n(x) |
F*(x) |
1 |
38 |
1 |
1/30 |
1 |
1/30 |
2 |
39 |
3 |
1/10 |
4 |
2/15 |
3 |
40 |
5 |
1/6 |
9 |
3/10 |
4 |
41 |
9 |
3/10 |
18 |
3/5 |
5 |
42 |
7 |
7/30 |
25 |
5/6 |
6 |
43 |
4 |
2/15 |
29 |
29/30 |
7 |
44 |
1 |
1/30 |
30 |
1 |
Приклад 2. Побудувати гістограму відносних частот розподілу в першому стовпці вказано частинні інтервали, в другому – сума частот варіант частинного інтервалу:
2 – 5 9
5 – 8 10
8 – 11 25
11 – 14 6
-
Частинні інтервали з кроком h=3
Сума відносних частот варіант інтервалу Wi
Густина частоти
2-5
9/50
3/50
5-8
10/50
1/15
8-11
25/50
1/6
11-14
6/50
1/25
Рішення.
Складемо таблицю, де n=9+10+25+6=50,
.