- •Практичне заняття №3.
- •3.1 Мета роботи
- •3.2 Програма роботи
- •3.3 Основні теоретичні положення
- •3.3.1 Означення та основні властивості оцінок
- •3.3.2 Теоретичне порівняння оцінок
- •3.3.3 Статистичне порівняння оцінок
- •3.4 Порядок виконання роботи за допомогою пакета spss
- •3.5 Обробка результатів
- •3.6 Контрольні запитання
Практичне заняття №3.
ОЦІНКИ
3.1 Мета роботи
Метою роботи є вивчення та статистичне моделювання основних методів побудови точкових оцінок параметрів розподілу випадкових величин і кількісне порівняння цих оцінок за допомогою статистичного моделювання.
3.2 Програма роботи
Необхідно виконати наступне.
Згенерувати 20 вихідних вибірок рівномірно розподіленої випадкової величини з об’ємами
n=10, n=40, n=160.
Для вибірок кожного з об’ємів:
Визначити оцінки верхньої межі розподілу методом моментів, методом максимальної правдоподібності та методом порядкових статистик для всіх 20-ти вибірок;
Отримати графік залежності оцінок від вибірок;
Визначити параметри кожної з оцінок: максимум, мінімум, розмах, середнє значення, середньоквадратичне відхилення (СКВ).
По результатах моделювання скласти підсумкову таблицю параметрів різних оцінок при різних об’ємах вибірки; отримати графік залежності СКВ оцінок від об’єму вибірки; зробити висновки відносно загальних властивостей модельованих оцінок – змістовності, незміщеності та ефективності.
3.3 Основні теоретичні положення
3.3.1 Означення та основні властивості оцінок
Нехай x1, ..., xn — вибірка , тобто n незалежних дослідів випадкової величини X , що має функцію розподілу F(x | a), яка залежить від невідомого параметра a. Часто виникає необхідність оцінити значення параметра a.
Оцінкою â = (x1, ..., xn) називається функція спостережень, що використовується для наближеного визначення невідомого параметра. Значення â оцінки є випадковою величиною, оскільки (x1, ..., xn) — випадкова величина (багатомірна).
Властивості оцінок:
Оцінка â= (x1, ..., xn) називається змістовною, якщо при n â a по ймовірності при
будь-якому значенні a.
Оцінка â = (x1, ..., xn) називається незміщеною, якщо при будь-якому a
Mâ = M(x1, ..., xn) = a.
Оцінка * називається оптимальною, якщо для неї середній квадрат помилки
M(â- a)2= M[*(x1, ..., xn) - a]2= min M[(x1, ..., xn) - a]2
є мінімальним серед усіх оцінок {}.
Змістовність означає, що оцінка наближається до невідомого параметра при збільшенні кількості даних. Зрозуміло, що ця властивість є обов’язковою. При відсутності змістовності функція (x1, ..., xn) не може вважатися оцінкою.
Незміщеність - властивість оцінок, яка проявляється при фіксованому n . Означає ця властивість відсутність помилки “у середньому”, тобто при систематичному використанню.
Незміщеність є бажаною властивістю оцінки. Але багато оцінок цієї властивості не мають і є зміщеними.
Критерієм оптимальності (якості) оцінки прийнято квадрат помилки (â - a)2. У більш загальній ситуації, якщо критерієм якості служить деяка величина L(â, a), що називається функцією втрат (чи функцією штрафу). Оптимальна оцінка – це та, для якої величина ML(â, a) мінімальна; остання є функція невідомого a і називається функцією умовного ризику. Зрозуміло, що оптимальної оцінки може не існувати (тому що характеристикою є функція, а не число).
Розглянемо наступний приклад. Нехай на заводі є велика партія з N (тисячі) транзисторів, які використовуються для зборки деякого приладу. Вихідні параметри приладу (наприклад: надійність, рівень шуму, імовірність виходу з режиму і т.д.) залежать від зворотних струмів транзисторів; зворотний струм у різних екземплярів різний, і тому можна вважати його випадковою величиною, причому, як відомо технологам, розподіленою рівномірно в діапазоні від 0 до Imax, де Imax —поріг відбраковування, встановлений на заводі-виробнику транзисторів. Отже, вихідні параметри приладу визначаються величиною Imax. Припустимо, що за деякими причинами значення Imax виробнику приладів невідомо. Зрозуміло, що в цьому випадку з партії потрібно випадковим вибором витягти n (порівняно небагато: десятки) транзисторів, виміряти їхній струм, і за вимірами оцінити Imax (невідомий параметр а). Таким чином, виникає
статистична задача: за спостереженнями x1, ..., xn над випадковою величиною , розподіленою рівномірно на відрізку [0, a], оцінити невідомий параметр a.
Порівняємо три способи оцінювання (три оцінки):
оцінку, отриману методом моментів,
â1
=
,
(3.1)
оцінку, отриману методом максимальної правдоподібності (після виправлення зміщеності),
â2
=
max
xi
(3.2)
і оцінку, отриману методом порядкових статистик,
â3
= 2
0.5
= x(k)
+ x(k+1),
(3.3)
де
0.5
=
—
вибіркова квантиль порядку 0.5, тобто
вибіркова медіана;
x(k)
—
член варіаційного ряду з номером k;
тут вважаємо n = 2k.
Точність цих оцінок можна порівняти теоретично й експериментально (статистично).
Зауваження. Точність, однак, не є єдиним критерієм якості оцінок. Дуже важливою є, наприклад, властивість стійкості оцінки до зміни закону чи розподілу, до засмічення; у цьому розумінні, як виявляється, â3 — найбільш гарна, а â2 — найменш. Дійсно, нехай, наприклад, у нашу вибірку випадково потрапило спостереження, що різко перевершує всі інші (у випадку з партією тріодів, потрапився тріод, що не пройшов відбраковування); при цьому значення оцінки â2 різко зміниться, тоді як значення â3 залишиться майже незмінним.
