- •1 Основні поняття математичної статистики
- •1.1 Задачі математичної статистики
- •1.2 Основні поняття вибіркового методу
- •1.3 Емпірична функція розподілу, гістограма
- •1.4 Емпіричні моменти
- •1.5 Збіжність емпіричних характеристик до теоретичних
- •1.7 Питання і вправи
- •2 Точечнеа оцінка
- •2.1 Параметричні сімейства розподілів
- •2.2 Крапкові оцінки. Незміщенність, спроможність оцінок
- •2.3 Методи знаходження оцінок: метод моментів
- •2.4 Спроможність оцінок методу моментів
- •2.5 Методи знаходження оцінок: метод максимальної правдоподібності
- •Питання і вправи
- •3.1 Способи порівняння оцінок
- •3.2 Средньоквадратичний підхід. Eфективності оцінок
- •3.3 Єдиність еффективної оцінки в класі з фіксованим зсувом
- •3.5 «Швидкість» збіжності оцінки до параметра
- •3.6 Асимптотична нормальність й цпт
- •3.8 Асимптотичний підхід до порівняння оцінок
- •3.9 Запитання і вправи
1.4 Емпіричні моменти
Знання моментів розподілу також багато чого може сказати про його вид і властивості. Введемо емпіричні (вибіркові) аналоги невідомих теоретичних (істинних) моментів розподілу.
Нехай Е = ЕХ1 = a, D = DX1 = 2, E = ЕХ1k = mk — теоретичне середнє, дисперсія, k-й момент. Добре відомі їх вибіркові «двійники»:
Коротко визначити зміст правого і лівого стовпців таблиці можна так: невідоме «середнє по просторі» заміняється «середнім за часом» (цитата, група 476).
1.5 Збіжність емпіричних характеристик до теоретичних
Ми ввели три види емпіричних характеристик, призначених для заміни (оцінювання) невідомих теоретичних характеристик розподілу: емпіричну функцію розподілу, гістограму, вибіркові моменти. Зрозуміло, що будь-яке наближення гарне, якщо з ростом обсягу вибірки різниця між істинною характеристикою і вибірковою прагне до нуля. Таку властивість емпіричних характеристик («оцінок») називають здатністю. Переконаємося, що наші вибіркові характеристики такою властивістю володіють.
Властивості емпіричної функції розподілу
Теорема 1. Нехай X = (Х1,..., Хп) — вибірка об’єму п з невідомого розподілу F з функцією розподілу F. Нехай Fn* — емпірична функція розподілу, побудована по цій вибірці. Тоді для кожного у є R
Зауваження 2. Fn*(y) — випадкова величина, тому що вона є функцією від випадкових величин Х1,..., Хп. Те ж саме можна сказати про гістограму і вибіркові моменти.
Доведення
теореми 1.
По
визначенню,
Випадкові величини I(Х1 < у), I(X2 < у),... незалежні й однаково розподілені, їхнє математичне очікування скіннченно:
тому
застосуємо ЗБЧ Хінчіна (а
що це таке?), і
Насправді, вірний більш загальний результат, що показує, що збіжність емпіричної функції розподілу до теоретичного має «рівномірний» характер.
Теорема 2 (Гливенко, Кантеллі). Нехай X = (Х1,..., Хп) — вибірка обсягу п з невідомого розподілу У с функцією розподілу F. Нехай Fn* — емпірична функція розподілу, побудована по цій вибірці. Тоді
Якщо функція розподілу F безупинна, то швидкість збіжності до нуля в теоремі Гливенко- Кантеллі має порядок 1/n, як показує
Теорема З (Колмогоров). Нехай X = (Х1,...,Хп) — вибірка обсягу п з невідомого розподілу У з неперервною функцією розподілу F. Нехай Fn* — емпірична функція розподілу. Тоді
де випадкова величина З має розподіл Колмогорова з функцією розподілу
Випишемо ще ряд властивостей емпіричної функції розподілу, що нам будуть потрібні надалі. Це добре знайомі властивості середнього арифметичного п незалежних доданків, що мають до того ж розподіл Бернуллі.
Властивість 1. Для кожного y R
, тобто
величина Fn*(y)
—
«незміщена»
оцінка для F(y);
І, тобто
величина Fn*(y)
«асимптотично нормальна»;
має біноміальний розподіл Bn,F(y).
У перших
трьох пунктах стверджується, що
випадкова величина Fn*(y)
має
математичне очікування
F(y),
має
убутну зі швидкістю 1/n дисперсію
і, на додаток до теореми
Зауваження 3. Корисно порівняти (3) з теоремою Колмогорова.
Зауваження 4. Усі визначення, як те: «оцінка», «незміщеність», «заможність», «асимптотична нормальність» будуть дані в главі 2. Але зміст цих термінів повинний бути цілком зрозумілий уже зараз.
Доказ властивості 1.
1) Випадкові величини I(Х1 < у), I(Х2 < у),... однаково розподілені, тому (де використовується однакова распреділеність?)
2) Випадкові величини I(Х1 < у), 1(Х2 < у),... незалежні й однаково розподілені, тому (де використовується незалежність?)
Ho di(x <y) = F(y)(1 - F(y)), оскільки І(Х < у) BF(y).
3)
Скористаємося ЦПТ Ляпунова (а
що це таке?).
4) Оскільки I(Х1 < у) (число успіхів в одному іспиті) має розподіл Бернуллі ВF(y) (ще раз - чому?), те п • Fn*(y) = ni=1 I(X1 < y) біноміальний розподіл Вn,F(y) (чому? і при чому тут зміст біноміального розподілу? а також при чому тут його стійкість по сумуванню?).
Властивості гістограми Нехай — щира невідома щільність розподілу В (якщо В абсолютно безупинно). Нехай, крім того, число k інтервалів групи не залежить від п. Див. зауваження 5 для випадку, коли k = k(n). Справедлива
Теорема 4. При п для будь-якого j = 1,..., k
Якщо, до того ж, щира щільність f(x) безупинна на інтервалі aj , то інтеграл праворуч дорівнює lj • f(uj), де uj - деяка крапка усередині інтервалу угруповання aj (знайдеться по теоремі про середній).
Вправа. Довести теорему 4, використовуючи (1) і ЗБЧ.
Теорема затверджує, що (для безупинної щільності) висота стовпця гістограмми, побудованого над інтервалом угруповання, з ростом обсягу вибірки зближається зі значенням щільності розподілу в одній із крапок цього інтервалу. Або (для довільної щільності) площа відповідного стовпця гістограмми зближається з площею над тим же інтервалом під графіком щільності.
Вправа. Намалювати твердження теореми 4 на графіку щільності / гістограмми.
Зауваження 5. Помітимо, що чим більше інтервалів угруповання, тим краще. Але це «чим більше» має свої границі: якщо брати число інтервалів, скажемо, порядку п, те з ростом п гістограмма не буде поточечно сходитися до щільності.
Справедливо наступне твердження: якщо щільність розподілу елементів вибірки є безупинною функцією і k(n)/n 0, то має місце поточечна збіжність гістограмми до щільності (див. зауваження 1).
Зі своєї сторони, можу запропонувати завжди брати число інтервалів, скажемо, рівне цілої частини від кореня п'ятого ступеня з п (помноженого на е, якщо обсяг вибірки більше 413):
Властивості вибіркових моментів
Лема 1. Вибіркове середнє X є незміщеною і заможною оцінкою для теоретичного середніх (математичного чекання):
ЕХ = ЕХ1 = а — незміщеність;
X p ЕХ1 = а — заможність.
Лема 2. Вибіркові дисперсії 2 і s02 є заможними оцінками для дисперсії. При цьому 2* — зміщена, a s02 — незміщена оцінка дисперсії:
— зміщена;
— незміщена;
— обидві оцінки достовірні.
Лема 3. Вибірковий k-й момент Xk є незміщеною і достовірною оцінкою для теоретичного k-го моменту:
EXk = EX1k_ = mk — незміщеність;
Xk p EX1 k= mk при п — заможність.
Доказ леми 1.
Вправа. Довести лему 3.
Доказ леми 2.
1) У перших, розкривши дужки, корисно переконатися в тім що
2) Друге твердження випливає з першого, тому що
3) З (2)
і ЗБЧ,
Крім
того,
.
Якщо обсяг вибірки дуже великий, часто працюють не з елементами вибірки, а з групованими даними. Приведемо ряд понять, зв'язаних з угрупованням. Для простоти будемо поділяти область вибіркових даних на k однакових інтервалів А1,..., Ak довжини А:
Як колись, нехай Vj — число елементів вибірки, що потрапили в інтервал aj і j — частота влучення в інтервал a (оцінка імовірності влучення в інтервал):
На
кожнім з інтервалів aj
будують
прямокутник з висотою
,
і одержують гістограмму.
можна вважати «огрубленою» вибіркою, у якій усі Хi, що попадають в інтервал aj, замінені на aj. По цій вибірці можна побудувати такі ж (але більш грубі) вибіркові характеристики, що і по вихідній (позначимо їхній так само), наприклад вибіркове середнє
чи вибіркову дисперсію
Вправа.
1) Знайти математичне чекання і дисперсію випадкової величини, що приймає значення a1,..., ak
с імовірностями, відповідно, 1, . . . , k.
2) Знайти математичне чекання і дисперсію випадкової величини, що приймає значення X1,..., Хп із рівними імовірностями.
Вправа.** Зрозуміти, до чого попередня вправа.
Указівка. Обґрунтувати фразу: вибіркові характеристики (вибіркове середнє, вибіркова дисперсія, вибіркова функція розподілу, вибірковий k-й момент і ін.) є звичайні характеристики (математичне чекання, дисперсія, функція розподілу, k-й момент і т.д.) вибіркової випадкової величини, що приймає значення Х_,..., Хп із рівними імовірностями.
Крива, що з'єднує крапки (а0 , 0) , (а0 , f1) , ... , (а0 , fk) , (аk , 0) називається полігоном (частот). На відміну від гістограмми полігон — безупинна функція (ламана).