Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

01_розділ

.doc
Скачиваний:
11
Добавлен:
19.03.2015
Размер:
819.2 Кб
Скачать

Тобто випадкова величина неперервного типу може набирати будь-яких дійсних значень з інтервалу чи діапазону цієї величини. Інша річ, що при перервному вимірі, що найчастіше трапляється при моніторингу довкілля, чи будь-якій іншій фіксації таких значень для їхнього аналізу, ми будемо мати справу з фіксованими значеннями X(ω) із специфікою визначення їхньої імовірнісної міри, розглянутою далі. Такі фіксовані значення х випадкової неперервної величини, як перетини заданих перпендикулярів до осі 0х з цією віссю, можна перенумерувати при символьному їхньому запису з безлічі таких значень на множині Е числової осі 0х.

Примітка. Як X(ω) інколи позначається і довільна випадкова величина при її характеристиці у цілому.

Простим прикладом неперервних випадкових величин є помилки визначення геопараметрів, що виникають за рахунок точності приладів, апаратури, а також за рахунок обмеженості та дискретності спостережень.

Неперервними випадковими величинами є вельми значна кількість власне фактографічних геопараметрів зі змінними у часі (за багатоліття, щодобово тощо) та/або за тривимірним простором (територією) геосистеми їхніми значеннями, наприклад:

  • гідрометеорологічні показники (температура повітря, інтенсивність і шар опадів, швидкість вітру, висота снігового покриву тощо);

  • гідрологічні та гідрохімічні показники (рівні та витрати води, швидкості течії, шари стоку, вміст забруднювальних речовин у воді і т.ін.);

  • вміст поживних речовин, гумусу та забруднювальних інгредієнтів у ґрунті та його гранулометричний склад, показники ерозії ґрунтів тощо;

  • складники продуктивності ландшафту (біомаси, енергії);

  • безліч інших (ландшатно-геохімічних, радіоекологічних тощо) показників, що формують фактографічну географічну інформацію.

Загальна сукупність всіх окремих вимірів значень якогось з наведених вище геопараметрів як випадкових величин (вимірів висоти снігового покриву у окремій точці, питомої радіоактивності окремого зразка ґрунту тощо) власне і розглядається як загальна сукупність (множина) ω таких вимірів-результатів певного імовірнісного експерименту, враховуючи і його серії (див. попередній текст).

Крім того, більш точне, на відміну від (1.6)-(1.9), подання взаємозв'язку значень випадкової величини з аксіоматикою елементарних і випадкових подій, включаючи їхню теоретичну та емпіричну імовірнісну міру, може у підсумку бути зроблене таким чином. Подію А при тотожному перетворенні її у будь-яку випадкову величину X(ω) із загальним довільним інтервалом її значень [а, b) з діапазону Е, тобто при АX(ω), слід розглядати як суму повної групи (зрозуміло попарно несполучних) випадкових подій, що є складниками загальної події А, а отже, використовуючи обернену тотожність,

X(ω) А = ∑ Аi = А1 + А2 + … + Аn = А1 А2 Аn =

i

= Аi = Ω , (1.27)

i

де події Аi слід інтерпретувати їхніми числовими відбитками у загальному інтервалі випадкової величини {аX(ω) < b} (області її значень як функції), який може охоплювати хоч би і весь діапазон Е, окремо для дискретної та неперервної випадкових величин таким чином.

  1. Для дискретної випадкової величини X(ω)д кожна подія Аi ототожнюється із певним числовим значенням зазначеної величини з їхньої сукупності {x1, x2, } у загальному інтервалі [а, b), тобто

Аi {X(ω)д = xi} . (1.28)

Згідно з (1.28) ймовірність кожної події Аi, а отже ймовірність кожного конкретного значення величини X(ω)д скорочено позначається як pi (так звана "точкова" ймовірність) і визначається як

Р(Аi) = P {X(ω)д = xi} ≡ pi . (1.29)

Взаємозв'язок pi з її емпіричним аналогом за підходами формул (1.7)-(1.9) слід розуміти таким чином, спеціально не маркуючи наслідки експерименту для кожної його серії.

Отже, якщо позначити через n(xi) = ni загальну кількість подій з xi у певному імовірнісному експерименті та у всіх його серіях (за їхньої наявності) або, скорочено, абсолютну частоту xi, а через n – загальну кількість наслідків такого експерименту або загальну кількість вимірів X(ω)д у певному досліді, то відносна частота xi або емпірична ймовірність xiν(xi) – визначиться за формулою (зважаючи і на те, що ∑ ni = n)

i

ν(xi) = ni / n νi . (1.30)

Тоді формально і нежорстко теоретична ймовірність pi за (1.29) може бути подана як границя емпіричної ймовірності xi при нескінченному збільшенні числа вимірів у досліді, у т.ч. за рахунок його серій, а отже

pi = lim νi = lim (ni / n) . (1.31)

n → ∞ n → ∞

  1. Для неперервної випадкової величини X(ω) згідно з розкритою вище її сутністю, яка призводить до неможливості перелічити всі її значення, подія Аi ототожнюється з певними заданими інтервалами значень такої неперервної величини в загальному інтервалі [а, b), включаючи і нескінченно малий інтервал. При цьому принципово можливі два випадки.

У першому випадку загальний інтервал [а, b) розбивається на довільні, як правило рівномірні (див. р.4) напіввідкриті інтервали типу {[а, x1), [x1, x2) … [xi, b)}, де {x1, x2, } теж довільні фіксовані значення X(ω) (що звуться також квантилями, див. далі р.4), а отже подія Аi для, наприклад, першого із зазначених несполучних інтервалів виглядає як

А1 {a X(ω) < x1} , (1.32)

і т.д. для всіх інтервалів.

Відповідно, ймовірність кожної події типу (1.32) запишеться як ймовірність потрапляння X(ω) у заданий інтервал (тобто ймовірність того, що X(ω) набере значення із заданого інтервалу), а отже

P(А1) = P {a X(ω) < x1} , (1.33)

тощо.

Аналогічно до (1.30), якщо в результаті проведеного імовірнісного досліду з будь-яким – перервним чи неперервним виміром величини – визначити n{a X(ω) < x1} як абсолютну частоту потрапляння фіксованих у досліді значень X(ω) у певний інтервал [а, x1) або, скорочено, абсолютну частоту інтервалу [а, x1), та n{a X(ω) < b} як загальну кількість фіксованих значень X(ω) у досліді або його серіях у загальному інтервалі [а, b), то відносна частота або емпірична ймовірність інтервалу [а, x1) значень X(ω)ν{a X(ω) < x1} – визначиться як

ν{aX(ω) < x1} = n{aX(ω) < x1} / n{aX(ω) < b} , (1.34)

Примітка. Емпіричні ймовірності за (1.30) та (1.34) можна подавати як у частках, так і у відсотках.

Теоретичну ймовірність події за (1.33) формально і вельми нежорстко, а лише за змістом взаємозв'язку, можна вважати границею емпіричної ймовірності за (1.34) при нескінченному збільшенні загальної кількості фіксованих значень випадкової величини у досліді, тобто

P {aX(ω) < x1} = lim ν{aX(ω) < x1} =

n{a X(ω) < b) → ∞

= lim (n{aX(ω) < x1} / n{aX(ω) < b}) . (1.35)

n{a X(ω) < b) → ∞

А проте, конкретні оцінювання за лівою частиною запису (1.35), тобто за формулою (1.33), мають свою специфіку через неперервність значень X(ω), для врахування якої загалом використовують залежності типу P {X(ω) < x} і інші. Така специфіка розглянута у р.2 і р.4, а вихідне розуміння проблеми можна отримати при розгляді другого заданого випадку для неперервної випадкової величини.

Другий випадок для X(ω) загалом зумовлений певними міркуваннями, теж більш детально розкритими у наступному розділі. А саме, якщо випадкова величина є неперервною, тобто набирає будь-яких значень з довільного інтервалу, включаючи загальний, то для неї вже не можна визначити ймовірність того, що вона набере якогось конкретного значення ("точкову" ймовірність), позаяк у будь-якому скінченному інтервалі міститься нескінченна кількість значень X(ω). А проте, для нескінченно малого інтервалу відношення ймовірності конкретного значення X(ω), як відбитку події Аi, до довжини інтервалу прямує до постійної величини, що скорочено для певного значення x зветься його щільністю ймовірності та позначається у вигляді визначеної функції як f(x) (вона загалом зветься диференціальним законом розподілу ймовірностей значень неперервної випадкової величини, див. р.2). Саме в такому розумінні для події Аi у вигляді довільного фіксованого значення xi неперервної випадкової величини можна у цілому записати

Аi {X(ω) = xi} , (1.36)

і стосовно щільності ймовірності

f(Аi) = f {X(ω) = xi} = lim {P {x X(ω) < x + Δx} / Δx} fi , (1.37)

Δx → 0

де Δx – приріст (інтервал) значень X(ω).

Отже, згідно з (1.36) можна говорити не про "точкову" ймовірність, а про "точкову" щільність ймовірності події Аi, чисельним відбитком якої є фіксована xi за (1.36). Відповідно до міркувань щодо формули (1.35) таку теоретичну "точкову" щільність ймовірності можна формально уявляти як границю відношення відносної частоти нескінченно малого інтервалу X(ω) до довжини такого інтервалу, тобто

fi = lim (ν{х X(ω) < x + Δx } / Δx) =

n{a X(ω) < b) → ∞

Δx → 0

пом

= lim {(n{a X(ω) < x + Δx } / n{a X(ω) < b}) Δx} . (1.38)

n{a X(ω) < b) → ∞

Δx → 0

Слід зазначити, що раніше наведений вираз (1.33) також подається певним чином через щільність розподілу ймовірностей відповідних значень неперервної випадкової величини, як і через т.зв. функцію розподілу, що стосується і (1.37). Таким питанням, включаючи і розподіл дискретної величини за (1.29), присвячено розділи 2-4, а наразі розглянемо способи змістовної та графічної інтерпретації поняття випадкової величини стосовно географічної інформації на прикладі конкретних геопараметрів.

Вельми характерним прикладом дискретної випадкової величини як геопараметра, що вже зазначалось, може бути багаторічна мінливість характеристик певних температурних явищ, несприятливих щодо корисних для людини функцій геосистеми, особливо у деякі сезони чи місяці року. Нехай таким явищем будуть заморозки на ґрунті, коливання кількості діб з якими у травні кожного року для обраного дослідного полігона довільної геосистеми відстежувалися на протязі 20-річного періоду (1981-2000 рр.). Побудуємо за вищевикладеними принципами (див. рис.1.7-1.9 і рис.1.11) "ланцюжок" серії зазначених спостережень (рис.1.13)

Скористаємося складниками формули (1.30) та підрахуємо на спеціальній додатковій осі рис.1.13 абсолютну частоту ni кожного, визначеного за 20 років у досліді, значення X(ω)д (хі від 1 до 6 діб). При цьому будемо зважати, що згідно з символікою рис.1.13 такі частоти можна розрахувати як кількість всіх реалізацій (ωjхi) певного значення хi у експерименті, не забуваючи, що кількість всіх елементарних наслідків цього експерименту (ωjхi), позначена у (1.30) як n, тобто загальна кількість визначення значень X(ω)д, становить 20 (за кількістю років спостережень).

Тепер вже безпосередньо за (1.30) визначимо саме емпіричну ймовірність νі кожного значення величини X(ω)д, тобто кожного спостереженого значення випадкового геопараметра "число діб з заморозками на ґрунті у травні", позначивши таку ймовірність у відсотках теж на ще одній спеціальній осі. На цьому графічне тлумачення типового імовірнісного досліду з дискретним випадковим геопараметром практично закінчене на рівні розглянутих у цьому розділі закономірностей. За результатами рис.1.13, наприклад, видно, що найбільш ймовірним значенням числа діб з заморозками на ґрунті у травні для досліджуваного полігона є 4 доби, що встановлене за серією 20-річних спостережень.

Перейдемо до графічної інтерпретації вже типового неперервного випадкового геопараметра. За нього може правити, наприклад, така неперервна випадкова величина, як рівень забрудненості ґрунту радіоцезієм. Припустимо, що зазначений геопараметр вимірюється на заданому профілі, довжиною 5 км, досліджуваної басейнової геосистеми. Одну серію імовірнісного експерименту стосовно відстеження 137Cs у ґрунті можна подати як вимірювання цього геопараметра у певних точках заданого профілю, розташованих рівномірно на відстані 100 м одна від одної. При цьому початково для кожної точки (зразка) визначається питома радіоактивність у Бк/кг сухої маси, яка потім перераховується у густину випадів 137Cs на ґрунт (густину забрудненості) вже у кБк/м2.

Рис.1.13 – "Ланцюжок" повної групи елементарних наслідків серії імовірнісного експерименту з визначення на дослідному полігоні коливань щорічної кількості діб з заморозками на ґрунті у травні за 20-річний період як значень дискретної випадкової величини X(ω)д – геопараметра

Отже, всі отримані на точках профілю значення питомої активності радіоцезію і утворять сукупність фіксованих значень випадкового геопараметра "рівень забрудненості ґрунту 137Cs". Аналогічну початкову обробку результатів зазначеного імовірнісного експерименту, про що вже йшла мова, ми б все рівно виконали навіть у випадку неперервного запису радіоактивності на профілі, наприклад шляхом аеро-гамма-вимірювань ([10]). Далі, зважаючи на вже викладені особливості аналізу неперервних випадкових величин, перейдемо до інтервальної обробки отриманої географічної інформації згідно з формулами (1.32)-(1.35), зробивши певні спрощення у символьних записах.

А саме, довільні розрахункові інтервали за (1.32) подамо, починаючи з першого, як

[а, x1) = Δx1 тощо, (1.39)

абсолютну частоту розрахункового інтервалу за (1.34), починаючи з першого, як

n{aX(ω) < x1} = nx1) тощо, (1.40)

загальну кількість фіксованих значень X(ω) у досліді за (1.34), як

n{a X(ω) < b} = nx) , (1.41)

емпіричну ймовірність розрахункового інтервалу за (1.34), починаючи з першого, як

ν{aX(ω) < x1} = νx1) і т.д. (1.42)

Після таких замін, використовуючи задані інтервали Δxі і принципи, обґрунтовані раніше, побудуємо "ланцюжок" серії імовірнісного експерименту з визначення, на основі вимірювань, фіксованих значень обраного випадкового геопараметра неперервного типу (рис.1.14). Аналогічно тому, як це ми робили для дискретної випадкової величини, але вже у "інтервальному" виконанні, послідовно визначимо за (1.34) з урахуванням (1.39)-(1.42): абсолютну частоту nx1) кожного з вирізнених семи інтервалів Δxі за кількістю всіх фіксованих значень X(ω), що потрапили у кожний інтервал, враховуючи, що загальна кількість визначення фіксованих значень випадкового геопараметра nx) дорівнює 50 (за кількістю точок на профілі, тобто 5000 м / 100 м = 50), та емпіричну ймовірність кожного інтервалу νxі). При всьому знову використаємо дві додаткові спеціальні вісі (див. рис.1.14).

Рис.1.14 – "Ланцюжок" повної групи елементарних наслідків серії імовірнісного експерименту з інтервального визначення фіксованих значень випадкового неперервного геопараметра X(ω) – рівнів забрудненості ґрунту радіоцезієм – на 5-кілометровому профілі досліджуваної басейнової геосистеми

Графічна інтерпретація типового неперервного випадкового геопараметра за завданнями цього розділу закінчена, а, як приклад одного з використань її результатів, зазначимо, що згідно з інформацією рис.1.14 найвищу ймовірність (32%) має потрапляння значень X(ω) у інтервал [15, 20). Тобто найбільш ймовірними рівнями забрудненості радіоцезієм ґрунту за дослідженим у одній серії профілем басейнової геосистеми є всі дійсні значення від 15 (включно) до 20 кБк/м2 (виключаючи безпосередньо останнє).

Більш детально способи узагальнення та тлумачення фактографічних географічних даних розглянуто у р.4. У даному ж розділі була поставлена мета визначитись лише з вихідними методологічними підходами до імовірнісного аналізу геопараметрів як випадкових величин, що є числовими відбитками елементарних і випадкових подій. У такому аспекті на підсумок зазначимо ще кілька принципових для подальшого розуміння змісту цього підручника моментів.

По-перше, типові приклади інтерпретації географічної інформації як випадкових величин дискретного або неперервного типу, наведені на рис.1.13-1.14, за їхніми умовами обидва ілюструють наслідки однієї серії імовірнісного експерименту (досліду), що базується на певній кількості фактичних вимірів чи фіксацій динамічних геопараметрів. Максимально можливе збільшення кількості таких вимірів – елементарних наслідків досліду – звичайно підсилило б стійкість отриманих рішень, насамперед стосовно імовірнісної міри, нескінченно наближаючи сукупність вибіркових значень певного випадкового геопараметра до його генеральної сукупності, про що вже йшла мова. Таке розширення інформаційної бази імовірнісного експерименту, як ми вже визначили при розгляді загальних формул (1.7)-(1.8), принципово можливе двома шляхами: за рахунок збільшення кількості вимірів у одній серії досліду та за рахунок повторення його серій.

Так для типового прикладу з визначенням значень дискретного геопараметра, наведеного на рис.1.13, розширення інформаційної бази досліду принципово можна було б досягти:

  • збільшенням періоду спостережень (не за 20-річний, а за максимально можливий згідно з умовами досліду період);

  • спеціально обумовленим додаванням результатів паралельних чи окремих серій досліду для інших полігонів досліджуваної геосистеми тощо.

У характерному прикладі з вимірюванням значень неперервного геопараметра (рис.1.14), що як тип превалює у географічній інформації, бажане збільшення наслідків імовірнісного досліду у цілому могло б бути забезпечене:

  • збільшенням кількості вимірювань (кількості фіксованих значень геопараметра) у довільній серії досліду:

  1. за рахунок зменшення відстані між фіксованими точками профілю, де вимірювались значення геопараметра;

  2. за рахунок збільшення довжини спостережницького профілю (звичайно в межах досліджуваної геосистеми);

  • проведенням повторних серій досліду за інший часовий період для обраного профілю;

  • проведенням паралельних серій досліду на декількох профілях басейнової геосистеми з дотриманням всіх принципів попередніх абзаців.

Вимірювання значень випадкового неперервного геопараметра за схемою рис.1.14 можна було б подати і у іншому розрізі, коли, наприклад, вимірювалися б фіксовані значення у одній точці профілю, але за багаторічний період. Тоді б розширення інформаційної бази досліду, послідовність наслідків якого була б вже змінною у часі, теж могло б бути забезпечене використанням зазначених вище підходів: об'єднанням результатів для сусідніх на профілі точок чи додаванням результатів з точок інших профілів і т.ін.

По-друге, у наведених на рис.1.13-1.14 типових прикладах показники часу та простору (в даному випадку відстань, а загалом це може бути також висота чи площа тощо) не є безпосередніми аргументами випадкових геопараметрів будь-якого типу, що видно навіть із запису їх як функцій {X(ω)д або X(ω)}. За допомогою таких показників лише розрізняється послідовність елементарних наслідків імовірнісного досліду, результатом чого і є об'єднані сукупності значень випадкових величин. Якщо ж будь-які із зазначених просторово-часових показників чи їхні комбінації будуть правити за додатковий, крім ω, аргумент випадкових величин, то ми будемо мати справу з т.зв. випадковою функцією геопараметра, причім останню можна подати у вигляді випадкового процесу або випадкового поля геопараметра. Основним положенням теорії випадкових функцій та її прикладним застосуванням присвячена уся друга частина даного підручника.

Підсумовуючи матеріал цього розділу, де ми познайомилися з базовими поняттями про імовірнісний простір і випадкову величину, зазначимо, що характеристиками випадкової величини є закон розподілу її значень та певні форми такого закону, моменти та деякі інші числові характеристики та узагальнювальні показники емпіричного та теоретичного розподілу, розглянуті у наступних розділах.

Запитання та завдання до розділу 1 для самоконтролю

1.Що є складниками імовірнісного простору?

2.Чим відрізняються елементарна та випадкова події?

3.Яким є зміст поняття "порожня підмножина"?

4.Чим відрізняються сполучні та несполучні події?

5.Якою є відмінність суми та добутку двох випадкових подій?

6.Чим принципово відрізняються сума двох несполучних і сума двох сполучних подій?

7.Чим характеризується повна група елементарних подій?

8.За яких умов клас (систему) підмножин F називають σ-алгеброю випадкових подій?

9.Що таке тотожний числовий відбиток випадкової події?

10.У чому полягає властивість стійкості частот?

11.Сформулюйте та дайте тлумачення другої та третьої аксіом ймовірності, у т.ч. стосовно географічної інформації.

12.Сформулюйте властивості імовірнісної міри.

13.Яким є зміст поняття "умовна ймовірність відносно події"?

14.Прокоментуйте формули добутку ймовірностей і Байєса на прикладі певної географічної інформації.

15.Дайте тлумачення незалежності випадкових подій на прикладі чинників стану геосистем.

16.Яким чином трансформується універсальна формула ймовірності суми будь-яких двох подій в залежності від різних за сутністю подій-складників цієї формули?

17.Сформулюйте поняття імовірнісного простору та випадкової величини у точному розумінні.

18.Що таке дискретна випадкова величина? Наведіть приклади таких величин для геопараметрів.

19.Що таке неперервна випадкова величина? Наведіть приклади неперервних величин для геопараметрів.

20.Чим принципово відрізняється зв'язок значень дискретної та неперервної випадкової величини з їхньою імовірнісною мірою?

21.Яким чином будується "ланцюжок" повної групи елементарних наслідків серії імовірнісного експерименту з інтервального визначення фіксованих значень випадкової величини?

22.Назвіть декілька способів розширення інформаційної бази імовірнісного досліду з визначення значень дискретного та неперервного випадкового геопараметра.

Проблемні теми для рефератів

1. Несполучні та сполучні події.

2. Аксіоми ймовірності.

3. Дискретні геопараметри.

4. Інформаційна база дослідів з визначення випадкових геопараметрів.