
- •Основні поняття та методи теорії ймовірності та математичної статистики
- •Основні характеристики випадкових величин.
- •Випадкова величина (подія).
- •Імовірність та частота випадкової події
- •Класичне визначення ймовірності
- •Статистичне визначення ймовірності
- •Основні властивості ймовірності
- •Геометрична ймовірність
- •Апріорна і апостеріорна ймовірність. Формула Байєса.
- •Способи задачі випадкової величини
- •Частотне представлення випадкової величини.
- •Функція розподілу випадкової величини (події)
- •Густина (щільність) розподілу безперервної випадкової величини
- •Числові характеристики розподілу випадкової величини
- •Моменти випадкової величини. Середньо квадратичне відхилення
- •Квантілі розподілу
- •Нормальний розподіл.
- •Крива Гауса і функція Лапласа.
- •Основні властивості нормального розподілу
- •Визначення параметрів функції розподілу
- •Генеральна сукупність і випадкова вибірка
- •Гістограма розподілу
- •Метод максимальної правдоподібності
- •Математичне очікування та дисперсія нормального розподілу.
- •Природа статистичних рішень. Алгоритми їх отримання.
- •Інтервальне оцінювання. Оцінка абсолютної похибки статистичної помилки. Довірчі інтервали і довірчі рівні
- •Перевірка статистичних гіпотез
- •Поняття про статистичну гіпотезу
- •Принципи побудови критеріїв узгодження
- •Загальний принцип вибору критичної області критерію
- •Перевірка гіпотези про вид розподілу
- •Критерій узгодження Колмогорова
- •Критерій узгодження к.Пірсона
- •Перевірка гіпотези про нормальність розподілу через моменти вищого порядку
- •Перевірки гіпотези однорідності
- •Гіпотеза однорідності двох вибірок
- •Перевірка вибірки на наявність промахів
- •Гіпотези, що використовують критерій Стюдента
- •Оцінка математичного очікування нормального розподілу
- •Гіпотеза порівняння двох середніх
- •Оцінка дисперсії нормального розподілу випадкової величини
- •Порівняння двох дисперсій
Способи задачі випадкової величини
Викладений у попередніх розділах матеріал дозволяє зробити наступний висновок – для того, що б однозначно задати випадкову подію необхідно визначити множину її допустимих значень і для кожного елемента цієї множини визначити ймовірність.
Частотне представлення випадкової величини.
Сумарна ймовірність всіх можливих значень випадкової події (величини) X, що визначена на множині допустимих значень, елементами якої єxi, рівна одиниці:
Цей один з основних висновків теорії ймовірності. Базується на тому що , одна з подій множини допустимих значень в ході випробовування обов’язково реалізується. Тобто реалізація одного зі значень множини є достовірною подією і її ймовірність, за властивістю рівна 1. Крім того, оскільки елементами множиниє несумісні події, то за властивістю , їх ймовірності можна сумувати.
Якщо випадкова подіяXзадана на множині дискретних значеньX = {x1,x2,…, xn}, і має зчисленну кількість елементівn, то таку випадкову величину можна задати імовірнісним рядом. Для того множину значень слід перебудувати у варіаційний ряд і кожного елемента множини задати ймовірність. У загальному вигляді імовірнісний ряд приведений у таблиці ___.
xi |
x1 |
x2 |
x3 |
… |
xn |
p(xi) |
p(x1) |
p(x2) |
p(x3) |
… |
p(xn) |
Зрозуміло, що сумарна ймовірність певним чином розподілена між елементами множини допустимих значень. Такий спосіб представлення випадкової події називається частотним. Прикладом може слугувати частотне представлення випадкової події при підкиданні ігрового кубика. У розділі 1.2.1 було показано, що ймовірність появи кожної з елементарних подій множини допустимих значень в випробовування проявляються з імовірністю 1/6. В такому випадку легко записати ймовірнісний ряд для цієї події (табл.____).
-
Кількість очок
1
2
3
4
5
6
Імовірність події
p(xi)
1/6
1/6
1/6
1/6
1/6
1/6
Значення функції розподілу
F(Xxi)
1/6
2/6
3/6
4/6
5/6
6/6=1
Зручність цього методу сумнівна. Для безправних величин він взагалі не може бути реалізований – об’єм значень є незчисленним. Для дискретних випадкових величин, множина допустимих значень має великий об’єм, даний метод можливий, але є труду ємким у побудові і незручним в використанні. Крім того, дуже часто сусідні елементи варіаційного ряду множини значень мають близькі значення. Суттєво не відрізняються і значення їх імовірностей. У результаті ряд втрачає наочність і інформативність, тому що представляє собою довгий список близьких по значенню пар чисел. Тому, для представлення випадкової величини, найчастіше використовуються аналітичні функції, що зв’язують елементи множини значень з їх імовірністю.
Функція розподілу випадкової величини (події)
У наукових дослідженнях дослідник практично завжди має справу з випадковими величинами. Функція розподілу цих величин є різні. Дуже часто вигляд функції розподілу несе значну інформацію про предмет дослідження. Так, наприклад, у хімії полімерів широко використовується поняття молекулярно-масового розподілу. Полімерні молекули, на відміну від низькомолекулярних сполук, під час синтезу не утворюються зі строго однаковою молекулярною масою. Різниця між молекулярними масами окремих макромолекул є значною. Молекулярну масу полімерних молекул можна розглядати як випадкову величину та досліджувати її функцію розподілу. Встановлено, що якщо при полімеризації домінує мономолекулярний обрив макрорадикалу, тоді молекулярно-масовий розподіл має експоненціальний характер. Якщо ж обрив відбувається по квадратичному закону – крива густини розподілу має характер близький до нормального. Так, по характеру розподілу можна робити дуже суттєві висновки про механізм протікання реакції полімеризації. Другим прикладом може слугувати дослідження гідродинамічних процесів у хімічних апаратах. У цьому випадку є дуже поширеними дослідження з використанням трасерів – сполук, концентрацію яких легко визначити. У проточному режимі експлуатації апарату їх вводять у вхідний потік, а в вихідному потоці регіструють функцію розподілу концентарції трасера в часі. По вигляду цієї функції можна робити такі важливі висновки для експлуатації апарату як наявність в ньому застійних зон або внутрішніх байпасів (проскоків) – факторів, що мають значений негативний вплив на якість продукції.
Будь яке співвідношення, що встановлює зв’язок між елементів множини значень X та їх імовірностями p(xi) , називається законом розподілу. Імовірнісний ряд є найпростішим і найменш зручним законом розподілу. Як було показано вище, більш менш успішно його можна використовувати для дискретних випадкових величин з невеликою ємністю множини значень. При збільшенні ємності цієї множини, значення ймовірність кожного окремого елемента зменшується, і, для частини, стає незначною. Переважно кількість елементівнастільки велика, що для більшості ймовірність може бути прирівняна до нуля, притому подія, що їм відповідає, може реалізуватись. Це в першу чергу стосується випадкових величин, що визначенні на безперервній множині значень. Для них взагалі немає змісту говорити про ймовірність конкретного значення випадкової величини з безкінечної їх кількості. Значно зручніше користуватися ймовірністю подіїP(Xxp), деxp– будь яке дійсне або натуральне число, значення якого попадає в множину значень випадкової величини2. Читати цей запис слід наступним чином – ймовірність появи при випробовувань значень випадкової величини менших заxp. Формально, при такому способі представлення величини, вказується не ймовірність окремого значення (ймовірність елементарної події), а ймовірність реалізації всіх значень, що попадають в проміжок від найменшого до заданого (ймовірність складної події, яка складається із суми елементарних незалежних подій). Так задана ймовірність є функцією відxpта може бути записана наступним рівнянням:
.
F(xp)називається функцією розподілу випадкової величини. Прочитати цей запис можна так – ймовірність реалізації значень випадкової величиниXменших заxpрівнаF(xp).
Приклад 3. У прикладі буде побудована функція розподілу випадкової величини яка виникає при однократному підкиданні ігрового кубика. Для цього зайдемо ймовірність події P(Xx3). У чому полягає подіяX x3у випадку підкидання ігрового кубика? Вона полягає в тому, що при випробовуванні випадуть значення очок 1, 2 або 3. Ймовірність кожної з цих елементарних подій (табл.___.) рівніP(1) = P(2) = P(3) = 1/6. ПодіяX x3є складною й за теоремою сумування ймовірностейF(3) = P(Xx3)= P(1) + P(2)+ P(3) = 3/6. У загальному випадку функція розподілу для цієї події запишеться:
.
Розраховані за цією формулою значення функції розподілу приведені в таб.___ поруч з ймовірнісним рядом цієї випадкової величини.
Продемонструвати зміст формули можна знову ж таки на прикладі ігрового кубика.
Так якщо вибрати, у відповідності до , xp=3, тоді функція розподілу прийме значенняF(3)=3/6. Що ймовірність складної випадкової події, яка полягає у випадінні або 1 або 2 або 3, при однократному підкидання кубика, становить 0,5. На рис.__ функція розподілу представлена графічно. По осі ординат відкладені значення випадкової величини, а по осі абсцис значення функції розподілу, що їм відповідають.
Безпосередньо з визначення функції розподілу випливає, що вона є не спадаючою функцією, тобто, якщо x1 x2, тоF(x1) F(x2). В загальному вигляді функція розподілу наведена на рис._а. Різниця двох ординат функції розподілу, що відповідають значеннямx1таx2, дає значення ймовірності того, що значення випадкової величини будуть знаходитись в інтервалі міжx1таx2:
Приклад
__. Продовження прикладу ___. Розглянемо
дію рівняння на прикладі функції
розподілу випадкової величини, що
виникає при однократному підкиданні
ігрового кубика. Дана функція відображена
на рис.__. Оцінимо ймовірність подіїP(3<
X5).
За рівнянням --P(3<X5)=F(5)-F(3)=5/6-3/6=2/6.
Таким чином, імовірність подіїP(3<X5)=1/3.
Але в даному випадку слід бути уважним
при інтерпретації. Що, власне є подією(3<X5)?
При яких елементарних подіях вона
реалізується? Потрібно звернути увагу
на те, що ліва гілка нерівності нестрога.
Тобто елементарна подія – випало 3 очки,
не включена. Дана подія реалізується,
якщо випадає5або4очки
(рис__). ВідповідноP(3<X5) = P(4) + P(5)=1/6+1/6=2/6=1/3.
Цей результат відповідає отриманому
по рівнянню .
Чому ж
часто в рівнянні нерівність записують
строго --
?
Тому що так вона більш предметна.
Підсвідомо, у наведеному вище прикладі,
є бажання включити 3 в діапазон визначення.
Але це приводить до значної помилка.
При включені 3 в діапазон імовірність
повинна стати ½. Розрахунок же по формулі
дальше дасть 1/3. Більш менш значна помилка
виникає лише у випадках подібних до
розглянутого в прикладі. Точніше, вона
виникає лише тоді, коли вклад імовірності
окремої події є вагомим. Але це, в
основному, дискретні випадкові величини
з невеликою областю значень. Для них
взагалі використовувати функцію
розподілу недоцільно. У прикладі це
було продемонстровано тим, що зустрічний
розрахунок, через імовірність сумарної
події, був простішим ніж розрахунок
через функцію розподілу. У випадку ж
безперервних випадкових подій ситуація
міняється. Імовірність строго окремої
елементарної події є настільки незначною,
що включення її значення ніяк не впливає
результат. Сприйняття формули при тому
збільшується.
Значення функції розподілу при граничних значеннях аргументу відповідно рівні 0 та 1:
Для
безперервної випадкової величини
функція розподілу (рис.__а) має ті ж
властивості що функція розподілу
дискретної величини, крім того, що вона
є уже безперервною не спадаючою функцією.Але не слід забувати, що як
і для функції розподілу дискретної
величини, фізичний зміст має лише різниця
між значеннями функції для двох
аргументів. Значення функції від одного
конкретного аргументу змісту не має.
Якщо підставити в рівняння функції розподілу визначене значення аргументу, наприклад, x=0.2 і отримати F(0.2)=0.6, то в жодному випадку не можна стверджувати, що ймовірність реалізації значення 0,2 складає 0,6. Це означає , що ймовірність появи значення випадкової величини з проміжку (-, 0,2] є 0,5. Взагалі то ймовірність конкретного окремо взятого аргументу, а не проміжку значень, є нульовою – за рівнянням F(0.2) - F(0.2)=0.6-0,6=0. Це має фізичний зміст. Ми не можемо говорити про конкретне значення випадкової неперервної величини , а можемо лише вказувати діапазон її можливої або найбільш вірогідної реалізації. Для хіміків цей тезис не є новим – не можна говорити проконкретне місцезнаходження електрона із заданою енергією (імпульсом), можна говорити лише про об’єм вірогідного знаходження – орбіталь.