Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

01_розділ

.doc
Скачиваний:
11
Добавлен:
19.03.2015
Размер:
819.2 Кб
Скачать

ν(А) = n(A) / n , (N = 1) (1.7)

N N

νs(А) = ∑ nj(A) / ∑ nj = ns(A) / ns . (1.8)

j=1 j=1

Для прикладу, наведеного до рис.1.1, згідно з формулою (1.7) очевидно, що подія А – "радіоактивне забруднення" – має відносну частоту появи у серії ν(А) = 40/100 = 0,4 або 40%. При цьому, якби ми не апріорно встановили абсолютну частоту появи подій, а реально сезонно або щорічно повторили за схемою рис.1.8 N разів послідовні виміри радіоактивної забрудненості на 100 обраних дослідних ділянках ґрунту геосистеми, то скористалися б уже формулою (1.8).

Рис.1.8 – "Ланцюжок" повної групи елементарних наслідків серії імовірнісного експерименту з визначення появи події А та абсолютної частоти такої появи

Зрозуміло, що загальна відносна частота подій νs(А) буде змінюватися як із зміною кількості наслідків кожного експерименту (n), так і зі зміною кількості його серій (N). А проте, важливим дослідно встановленим у теорії ймовірностей фактом є властивість стійкості частот. Вона полягає у тому, що при збільшенні загальної кількості елементарних наслідків імовірнісного експерименту відносні частоти подій коливаються навколо певних чисел, що не залежать ні від кількості наслідків експерименту у серії, ні від кількості цих серій, причім частоти (1.8) необмежено наближаються до зазначених чисел при n → ∞ і N → ∞. Такі числа, пов'язані з кожною подією випадкового експерименту, звуться ймовірностями подій і понятійно визначаються аксіоматичним шляхом, тобто їхнє існування постулюється ([4, 7]).

При цьому класичне визначення ймовірності базується на принципі рівних можливостей. За ним елементарні події розглядаються як рівноможливі наслідки експерименту, а ймовірність випадкової події визначається як відношення кількості сприятливих наслідків (тих, що спричинюють подію) до загальної кількості всіх рівноможливих наслідків. Для ілюстрації останнього визначення звичайно наводять вже теж віднесені до класичних приклади з експериментами з киданням гральної кості – випадіння будь-якої грані з шести можливих – тощо. У цьому випадку ймовірність зазначеного випадіння приймається 1/6, що загалом і пояснює термін "рівноможливий".

А проте, принцип рівних можливостей стосовно фактографічних даних географічної, та й іншої спорідненої природничої інформації, якщо і виконується, то дуже рідко, що насамперед пов'язане з асиметричністю та нерівномірністю як емпіричних, так і теоретичних розподілів значень геопараметрів, які є числовими відбитками елементарних подій (див. далі р.2-5). Через це та низку інших особливостей моніторингу довкілля (див. р.2) апріорне визначення ймовірності будь-якої події стає практично неможливим, для цього потрібен дещо інший підхід, який враховує і класичний підхід до визначення ймовірності як частковий випадок.

За таким підходом, по-перше, визначення ймовірності певним чином диференціюється для "власне" випадкових подій і для числового відбитку елементарних і випадкових подій згідно з формулами (1.5)-(1.6) та формулами в кінці цього розділу, причому ймовірність елементарних подій у числовому вираженні у цілому не є рівноможливою, за винятком певних випадків. По-друге, для будь-якої події розрізняють емпіричну та теоретичну її ймовірність.

Емпіричну ймовірність події А ототожнюють з її загальною відносною частотою появи {νs(А), де остання за формулою (1.8)}, тобто вважають відношенням загальної кількості подій з А до загальної кількості наслідків імовірнісного експерименту. Вважають, що при нескінченному збільшенні кількості таких наслідків (як для кожної серії експерименту, так і за числом його серій) емпірична ймовірність прямує, як до своєї границі, до теоретичної ймовірності. Отже, формально і у нежорсткому поданні, теоретичну ймовірність будь-якої випадкової події А {P(А)} як границю її емпіричної ймовірності можна подати за виразом

N N

P(А) = lim νs(А) = lim ( ∑ nj(A) / ∑ nj ) = lim (ns(A) / ns) . (1.9)

n → ∞ n → ∞ j=1 j=1 n → ∞

N → ∞ N → ∞ N → ∞

Ймовірність випадкових подій за виразом (1.9) і вводиться на підмножинах таких подій з σ-алгебри F як імовірнісна міра Р . Вона, як функція підмножин випадкових подій, володіє властивостями, що визначаються аксіомами ймовірності. Такі аксіоми ймовірності та властивості імовірнісної міри, які однаковим чином стосуються і емпіричних, і теоретичних ймовірностей, зводяться до такого (перші три позиції є власне аксіомами ймовірності, а інші – їхніми наслідками у вигляді властивостей).

  1. Кожній випадковій події A F поставлене у відповідність число P(А) (як невід'ємна функція підмножин таких подій), що набирає значення з [0, 1] і зветься ймовірністю А. Значення P(А) можна подавати як у частках одиниці, так і у відсотках.

Для коментарів за певними аксіомами та властивостями імовірнісної міри та їхнього наочного уявлення будемо повторно звертатися до рис.1.1-1.6, інколи модифікуючи такі коментарі та супроводжуючи їх розглядом прикладів з тими ж, обраними для цього, радіоактивно забрудненими або незабрудненими ділянками ґрунту гіпотетичної геосистеми. Принципи побудови зазначених рисунків, викладені на початку цього розділу, будуть тепер більш зрозумілими, якщо зважити на те, що площа на рисунках, як міра, пропорційна на просторі елементарних подій Ω ймовірності як мірі у її межах [0, 1] або [0, 100 %] для відповідних ситуацій і операцій з підмножинами випадкових подій. При цьому у коментарях і прикладах для спрощення будемо використовувати відносну частоту появи подій у одній серії, тобто їхню емпіричну ймовірність за змістом формули (1.7), границею якої є теоретична ймовірність, виходячи з того, що таке використання емпіричної ймовірності замість теоретичної не впливає на зміст аксіом та властивостей імовірнісної міри, які тут розглядаються. Ця емпірична ймовірність у зазначених прикладах буде називатися просто "ймовірність" і позначатися, як і у формулах аксіом і властивостей, символом "Р".

  1. Якщо А і В несполучні події, то ймовірність їхньої суми як події визначається за формулою

Р (А + В) = Р(А) + Р(В) . (1.10)

Ця аксіома добре зрозуміла, якщо повернутися до змісту рис.1.4 і згадати, що, сумою подій, за її визначенням, є подія, коли відбувається хоч одна "подія-доданок". Ясно, що у такому випадку ймовірність суми має враховувати обидві площі підмножин А і В.

Побудуємо за принципами рис.1.8 "ланцюжок" повної групи елементарних наслідків імовірнісного експерименту з визначення появи несполучних подій А і B (рис.1.9), враховуючи і можливість наявності наслідків експерименту з подією ĀВ, тобто подією добутку протилежних до А і B подій, що відбуваються одночасно, яка доповнює А і B до множини Ω. Сума границь відносних частот появи (а отже ймовірностей) кожної з подій А і В, визначена згідно з результатами рис.1.9 {див. (1.7)-(1.9)}, і дасть нам ймовірність суми цих подій (рис.1.10, де площа всього простору Ω, як його імовірнісна міра, становить 1 або 100%, див. третю аксіому).

Рис.1.9 – "Ланцюжок" повної групи елементарних наслідків серії імовірнісного експерименту з визначення появи несполучних подій А і В та абсолютних частот такої появи

На основі прикладу до рис.1.4 та відповідно до змісту рис.1.9-1.10, ймовірністю суми несполучних подій А і В, тобто подією "радіоактивне забруднення будь-яким з двох забрудників" (або радіоцезієм, або трансурановими елементами), буде сума ймовірностей кожної з цих подій {для А відносна частота появи – 40 випадків із 100, тобто ймовірність Р(А) = 40/100 = 0,4; аналогічно для В її Р(В) = 30/100 = 0,3}, а отже Р(А + В) = 0,4+0,3 = 0,7 або 70%. Тобто ймовірність виявити з повного набору ділянок ґрунту геосистеми ділянку, забруднену або радіоцезієм, або трансурановими елементами, становить 70%. Разом з тим зрозуміло, що ймовірність виявити незабруднену ділянку буде становити 100% – 70% = 30%.

Рис.1.10 – Несполучні випадкові події А і В та ймовірність їхньої суми А + В (А В) як події

Як узагальнення другої аксіоми існує також т.зв. розширена аксіома додавання ймовірностей. Вона полягає у тому, що якщо Ai є будь-якою послідовністю попарно несполучних подій (тобто подій, підмножини яких попарно неперетнуті), то ймовірність суми цих подій є сумою їхніх ймовірностей, отже

Р ( Ai) = P (Ai) . (1.11)

i i

Ця розширена аксіома встановлює властивість адитивності імовірнісної міри, яка може бути сформульована і таким чином. Якщо подія А полягає у здійсненні хоча б однієї з попарно несполучних подій, тобто

А = А1 + А2 + … + Аn = Аi , (1.12)

i

то ймовірність події А дорівнює сумі ймовірностей зазначених подій-складників

Р(А) = Р (∑ Ai) = ∑ P (Ai) . (1.13)

i i

Формули (1.11) і (1.13) застосовні як для випадкових подій, так і для елементарних подій, що спричинюють результувальну випадкову подію. Крім того, для повної групи випадкових подій, а отже для попарно несполучних подій, стосовно яких, за аналогією до (1.3),

А1 А2 Аn = Аi = Ω , (1.14)

i

ймовірність їхньої суми дорівнює 1 як ймовірність достовірної події згідно з наступною, третьою аксіомою. Зазначене є правомірним і для ймовірності суми повної групи елементарних подій за формулою (1.3).

  1. Ймовірність достовірної події дорівнює 1, тобто Р(Ω) = 1.

Цю аксіому добре ілюструє рис.1.2 з урахуванням верхньої межі зміни ймовірності за першою аксіомою.

З наведених вище аксіом ймовірності випливають такі вже властивості імовірнісної міри.

  1. Якщо Ø є неможливою подією, то Р(Ø) = 0.

  2. Ймовірність протилежної до А події, тобто події Ā визначається як

Р(Ā) = 1 – Р(А) , (1.15)

що є зрозумілим, згадуючи формулу (1.2) та третю аксіому, а також коментарі до рис.1.2.

  1. Якщо подія А спричинює подію В, що записується через оператор "" як А В і означає, що подія В здійснюється завжди, коли здійснюється подія А, то Р(А) ≤ Р(В).

  2. Для будь-яких двох подій А і В ймовірність їхньої суми визначається як

Р (А + В) = Р(А) + Р(В)Р (А В) . (1.16)

Зрозуміло, що для суми несполучних подій формула (1.16) перетворюється на формулу (1.10), позаяк останній складник (1.16) стає неможливою подією з ймовірністю 0 згідно з четвертою властивістю. Власне зміст (1.16) стає зрозумілим, якщо звернутися до рис.1.5 і згадати, що для перетнутих підмножин А і В подію А + В можна подати у двох рівнозначних варіантах: А  {В – (АВ)} чи B  {A – (АВ)}, суми ймовірностей будь-якого з котрих і призводять до запису (1.16).

Побудуємо за принципами рис.1.9 "ланцюжок" повної групи елементарних наслідків імовірнісного експерименту з визначення появи сполучних подій А і B (рис.1.11), враховуючи, крім ĀВ (див. коментарі до рис.1.9), і можливість наявності наслідків експерименту з подією АВ, тобто власне подією добутку А і B , які відбуваються одночасно. Через останнє є певна специфіка у побудові та використанні зазначеного ланцюжка. Вона полягає у тому, що наслідки ωi з подією АВ за її змістом дублюються одночасно і на додаткових осях: і для події А, і для події В, що зображено на рис.1.11 маркерами "". А отже такі наслідки практично повторно враховуються спочатку у сумі абсолютних частот, а потім і у ймовірностях подій А і В за формулами (1.7)-(1.9). Саме тому сума ймовірностей кожної з подій А і В, визначена згідно з результатами рис.1.9, має бути зменшена на ймовірність події перетину АВ, що в результаті і призведе до визначення ймовірності суми цих сполучних подій Р (А + В) за формулою (1.16) (рис.1.12).

Рис.1.11 – "Ланцюжок" повної групи елементарних наслідків серії імовірнісного експерименту з визначення появи сполучних подій А і В та абсолютних частот такої появи

Згідно з гіпотетичною ситуацією, розглянутою у прикладі до рис.1.5, з урахуванням прикладу до рис.1.9-1.10 та відповідно до змісту рис.1.11-1.12, ймовірністю суми сполучних подій А і В, тобто знову-таки подією "радіоактивне забруднення будь-яким з двох забрудників", буде сума ймовірностей кожної з цих подій {Р(А) = 40/100 = 0,4; Р(В) = 30/100 = 0,3}, але зменшена через необхідність неповторення підмножини АВ на ймовірність такої події {для АВ ймовірність її появи – 10 випадків із 100, тобто Р(АВ) = 10/100 = 0,1}. А отже для сполучних подій Р(А + В) = 0,4+0,3–0,1 = 0,6 або 60%. Тобто ймовірність виявити з повного набору ділянок ґрунту геосистеми ділянку, забруднену або лише радіоцезієм, або лише трансурановими елементами, при наявності ділянок, одночасно забруднених обома забрудниками, становить 60%. Це і відрізняє дану ситуацію від ситуації, коли одночасно забруднені ділянки ґрунту відсутні (див. коментарі до рис.1.9-1.10). При цьому, а проте, ймовірність того, що будь-яка ділянка буде взагалі незабрудненою знову-таки буде становити 100% – 70% = 30%.

Рис.1.12 – Сполучні випадкові події А і В та ймовірність їхньої суми А + В (А В) як події

  1. Для події А, що є сумою будь-яких подій А1, А2, А3, … , Аn,

Р(А) = Р (∑ Ai) , Р (∑ Ai) ∑ P (Ai) . (1.17)

i i i

Загалом для перетнутих підмножин двох подій А і В, а отже сполучних подій, схема яких зображена, наприклад, на рис.1.12, розглядають і таке поняття, як умовна ймовірність відносно події. Умовною ймовірністю події А відносно події В, для якої Р(В) > 0, зветься вираз Р (А/В) (буквально – "ймовірність події А, якщо відбулася подія В певної ймовірності"), що визначається за формулою

Р (А/В) = Р (А В) / Р(В) . (1.18)

З (1.18) випливає так звана формула добутку ймовірностей, за якою через певні умовні ймовірності можна визначити ймовірність події добутку А і В, чого не можна зробити, наприклад, простою перестановкою складників у (1.16), а отже

Р (А В) = Р (А/В) Р(В) = Р (В/А) Р(А) , (1.19)

де у кінці використаний і запис "ймовірність події В, якщо відбулася подія А".

Зважаючи на (1.19), можна визначити і взаємозалежність Р (А/В) і Р (В/А) через т.зв. формулу Байєса (спрощений варіант), а саме

Р (А/В) = Р (В/А) Р(А) / Р(В) . (1.20)

Пояснимо зміст останніх формул на такому прикладі, оперуючи для спрощення міркувань з емпіричною ймовірністю за змістом формули (1.8), але позначаючи її як і формулах, що коментуються, символом "Р" та називаючи просто "ймовірність". Нехай тепер вже не через апріорне задавання абсолютної частоти подій, а за результатами десятирічного моніторингу встановлено, що для обраних для спостережень 310 водойм, які розміщені в межах певної басейнової геосистеми, ймовірність їхнього токсичного забруднення постійним джерелом такого забруднення (подія А) становить Р(А) = 0,236 (7300 випадків, тобто водойм з подією А, із загальної кількості проведених дослідів 31010= 31000), а тимчасовим джерелом (подія В), відповідно, Р(В) = 0,161 (5000 випадків із 31000). Ймовірність події АВ, тобто того, що будь-яка з усіх 310 водойм може бути одночасно забруднена і постійним, і тимчасовим джерелом, як ми вже з'ясували раніше, не може бути простою арифметичною сумою ймовірностей подій А і В (див. схему рис.1.12), позаяк крім перетнутих підмножин цих подій залишається варіант наявності водойм, забруднених тільки постійним, або тільки тимчасовим джерелом. Припустимо, що за результатами вже спеціального аналізу інформації визначено, що за розрахунковий період спостережень у 1400 випадках із 7300, тобто із загального числа випадків з подією А – забруднення постійним джерелом, було достеменно встановлено наявність забруднення і тимчасовим джерелом (подія В), тобто ймовірність події В відносно події А становить Р (В/А) = 1400/7300 = 0,192 (19,2 %). Остання величина позначає ймовірність того, що будь-яка із водойм, забруднених тимчасовим джерелом, може бути одночасно забрудненою і постійним джерелом.

Звідси за (1.19) Р (АВ) = Р (В/А) Р(А) = 0,1920,236 = 0,045. Отже, ймовірність одночасного забруднення будь-якої водойми геосистеми і постійним, і тимчасовим джерелом токсичного забруднення становить лише 0,045 або 4,5%.

До того ж, без спеціального аналізу інформації, за формулою (1.20) можна розрахувати ймовірність події А відносно події В, а саме Р (А/В) = = Р (В/А) Р(А) / Р(В) = 0,1920,236/0,161 = 0,281 (28,1%). Звідси вже "чисельно" зрозуміло, наскільки ймовірність того, що будь-яка із водойм, забруднених постійним джерелом, буде одночасно забрудненою і тимчасовим джерелом (28,1%), вища за ймовірність того, що будь-яка із водойм, забруднених тимчасовим джерелом, буде одночасно забрудненою і постійним джерелом токсичного забруднення (19,2%).

Аналогічно до (1.19) для групи сполучних подій А1, А2, А3, … , Аn існує і загальна формула добутку ймовірностей, а саме

n n–1

Р ( Ai ) = P(A1) P (A2/A1) P ( An/ Ai ) . (1.21)

i=1 i=1

Зазначимо, що всі міркування щодо умовної ймовірності та формули (1.18)-(1.21) стосуються подій, які звуться залежними.

Тому розглянемо ще один аспект аналізу сполучних подій, а саме умови їхньої т.зв. незалежності. Події А і В звуться незалежними, якщо ймовірність події їхнього добутку дорівнює добутку їхніх ймовірностей, а отже

Р (А В) = Р (А) Р(В) . (1.22)

Якщо підставити Р (АВ) з (1.22) у (1.19), то побачимо, що для незалежних подій А і В

Р (А/В) = Р (А) , Р(В/А) = Р(В) , (1.23)

тобто у цьому випадку на ймовірність події А ніяким чином не впливає ймовірність події В, чи навпаки, чому і кажуть, що події не залежать одна від одної.

Стосовно прикладу з водоймами геосистеми, щойно наведеного для умовних ймовірностей, можна зазначити таке. Незалежність подій А і В у цьому прикладі можна трактувати як факт, що дія джерел постійного і джерел тимчасового токсичного забруднення на водойми абсолютно не пов'язані між собою, а отже для будь-якої водойми забруднення постійним джерелом не чинить ніякого впливу на її забруднення тимчасовим джерелом (і навпаки). Така ситуація може виникнути, наприклад, якщо подія А (постійне забруднення) буде пов'язана з дифузійними джерелами забруднення водойм, розміщеними на водозборі, коли токсичні інгредієнти потрапляють у воду насамперед за рахунок поверхневого і ґрунтового стоку. Подія ж В (тимчасове забруднення) буде при цьому пов'язана, наприклад, із тимчасовим скиданням підприємствами у водойми забруднених вод. Залежність же подій А і В для міркувань стосовно формул (1.18)-(1.21) могла б бути зумовленою, наприклад, у випадку, коли і постійне, і тимчасове забруднення водних об'єктів викликається одними і тими ж джерелами, що діють з різною періодичністю та інтенсивністю впливу, тощо.

Формулу (1.22) для групи сполучних незалежних подій А1, А2, А3, … , Аn можна подати у вигляді

Р ( Ai ) = P (Ai) , (1.24)

i i

тобто ймовірність добутку зазначених подій дорівнює добутку всіх їхніх ймовірностей.

Характерним прикладом зміни підходів до оцінювання імовірнісної міри різних за сутністю випадкових подій може бути відстеження трансформації універсальної формули ймовірності суми будь-яких двох подій (1.16) за складником Р (АВ). Так, для несполучних подій цей складник відсутній, а для сполучних (і тільки для сполучних) подій він присутній і у випадку залежності подій – визначається за формулою (1.19), а при їхній незалежності – за формулою (1.22).

Підсумовуючи розгляд у цілому всіх трьох складових частин імовірнісного простору, можна остаточно визначитись із останнім поняттям і поняттям "випадкова величина" у точному розумінні.

Отже, простір елементарних подій Ω з вирізненою на ньому σ-алгеброю випадкових подій F, для якої визначено імовірнісну міру Р(А) події А F, причім нормовану міру, тобто Р(Ω) = 1, називають імовірнісним простором і позначають {Ω, F, P}.

Числовий відбиток випадкової події А – функція Х = X(ω) від елементарних подій (наслідків) ω  Ω, визначена на імовірнісному просторі {Ω, F, P}, що описує імовірнісний експеримент, в якому виміряна X(ω), значення якої х утворюють довільну, відповідну їм числову множину Е на числовій осі, зветься випадковою величиною.

Згідно з її змістом, випадкову величину визначено, якщо відомі наслідки експерименту ω. При розгляді дійсних випадкових величин X(ω) за простір елементарних подій Ω ≡ Е приймають певну множину дійсних чисел. Кожний елементарний наслідок експерименту (досліду) ω є дійсним числом х  Ω (ωiхj). Той факт, що ми можемо вимірювати випадкову величину X(ω) у нашому досліді, означає тезу, що "можливо спостерігати подію: значення величини X(ω) належить діапазону її значень Е, чи інтервалу цього діапазону, якими б не були цей діапазон чи інтервал". Така теза записується як

{ω : X(ω) E} F . (1.25)

Отже, випадкова величина може розглядатися як F-вимірна функція

X(ω) = X(x) ≡ x . (1.26)

Випадкова величина може бути дискретною або неперервною (чи дискретного або неперервного типу).

Дискретна випадкова величина, яка позначається X(ω)д, – це випадкова величина, сукупність (множина) всіх можливих значень якої х є лічильною, тобто така, всі елементи якої можна перелічити та перенумерувати. Отже дискретною випадковою величиною буде та, що може набирати нумеровані лише цілі або лише раціональні значення.

За найпростіший приклад дискретної випадкової величини може правити число очок, яке випадає при киданні гральної кості. Така випадкова величина може набирати одне з шести своїх значень: 1, 2, 3, 4, 5 або 6. Іншим прикладом зазначеної величини є число лісових пожеж у літній період. Щорічні кількості таких пожеж за багатоліття і утворять сукупність значень X(ω)д, припустимо: 3, 8, 6, 12, 4, 5, 3, 8 і т.д. До простих прикладів дискретного випадкового геопараметра можна віднести також двоваріантні зміни типу "замерзання (числовий індикатор 1) – незамерзання (числовий індикатор 0)" річки тощо (див. детальніше щодо таких специфічних випадків у р.5).

Як дискретні випадкові величини – геопараметри – загалом можуть розглядатися, наприклад, змінні у багаторічному розрізі:

  • число діб з несприятливими температурними явищами (заморозками на ґрунті і т.ін.) для певного сезону чи місяця року;

  • число пересихань тимчасових водотоків у літній період;

  • кількість видів або асоціацій рослинності у певних геосистемах чи їхніх елементах;

  • чисельність певних популяцій геосистеми тощо.

А проте, у географії значно частіше мають справу з фактографічною інформацією, що за змістом відображає неперервні випадкові величини.

Неперервною випадковою величиною, що позначається X(ω), зветься та, можливі значення якої х цілковито заповнюють довільний проміжок числової вісі (весь діапазон X(ω) Е – або довільний інтервал цього діапазону), а отже всіх їх неможливо перелічити та перенумерувати.