Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ms_lec

.pdf
Скачиваний:
65
Добавлен:
10.12.2018
Размер:
4.58 Mб
Скачать

рівнів, розміщений в стовпчику В, який починається з клітинки В3 як зображено на рис. 16.6. Вставимо цей ряд в стовпчик С, починаючи з клітинки С4 і відкинувши останнє значення yn

позначимо його як В1 y1, y2 , y3 , , yn 1 . Скопіюємо ці два ряди, починаючи з четвертої стрічки, тобто з В4 і С4 і вставимо в стовпчики Е і F, позначивши їх як А2 і В2 відповідно.

Положення рівнів цих рядів має збігатися відносно стрічок. В клітинку І1 вставимо формулу для

 

 

 

 

 

 

 

 

обчислення евклідової відстані між двома точками d

y A1

y A2 2

yB1

yB2

2

, яка у форматі

 

i

j

i

j

 

 

 

 

 

формул Excel стосовно побудови рекурентної діаграми має такий вигляд

 

 

 

 

 

 

=ЕСЛИ(КОРЕНЬ(($B$4-$E4)^2+($C$4-$F4)^2)< ε;1;0),

 

 

 

 

 

де ε – величина інтервалу для значень відстані d . В даному випадку,

якщо

d

в клітинку

таблиці, яка відповідає відстані між даними точками з координатами

y A1 ;

y B1

і

y A2

; y B2 ,

 

 

 

 

i

i

 

i

i

ставимо 1, а якщо d , тоді – 0.

Рис. 16.6. Побудована в Excel рекурентна діаграма часового ряду.

Відмінність між положенням головної діагоналі рекурентної діаграми приведеної на рис. 16.6 і попередніми прикладами таких діаграм в тому, що початок координат діаграми, отриманої в

151

Excel знаходиться в лівому верхньому куті, в той час як на прикладах початок координат є в лівому нижньому куті.

На відміну від матриці близькості рекурентна діаграма містить лише ті значення відстані, які належать до інтервалу i , але подає їх не обчисленими числовими значеннями, а двійковими

логічними символами, тобто відстань di, j

між точкою xi і x j подається як предикат

 

di , j

1,

di j

,

 

 

di j

,

(16.4)

 

0,

 

де – заданий інтервал.

16.5. Кількісний аналіз рекурентних діаграм

Щоб відійти від лише візуального враження, отриманих в рекурентних діаграм, запропоновано декілька мір складності, з допомогою яких можна кількісно оцінити дрібні структури в їхніх зображеннях. Вони відомі під загальною назвою рекурентний кількісний аналіз, а в їх основі лежать такі артефакти рекурентних діаграм як: щільність рекурентних точок та діагональні і вертикальних лінії структури зображення.

Отже, утворені структури рекурентних діаграм можна деяким чином аналізувати чисельно. Розробляли кількісний аналіз рекурентних діаграм (recurrence quantification analysis, RQA), тобто методи для визначення чисельних показників рекурентної діаграми різні автори. Так, Збілут (Zbilut) і Вебер (Webber) запропонували міри, що використовують щільність рекурентних точок і діагональні структури діаграми, а саме, показник подібності (RR), детермінізм (DET), максимальну довжину діагональних ліній (L), ентропію (ENTR), тренд (TREND). Дещо пізніше Марван (Marwan) запропонував міри, основані на горизонтальних (вертикальних) структурах рекурентних діаграм: завмирання (LAM) і показник затримки (TT). В роботі [5] запропонована міра (CLEAN) оцінки балансу між стохастичною і детерміністичною складової. Як правило, для обчислення заходів використовуються рекурентні діаграми з постійним значенням порога varepsilon.

Міра рекурентності (recurrence rate, RR)

 

1

N

 

 

RR

Rim,

,j ,

(16.5)

N

2

 

i, j 1

 

 

 

 

 

 

показує щільність рекурентних точок, просто підраховуючи їх, включаючи лінію ідентичності. В границі дана міра показує ймовірність знаходження рекурентної точки в рекурентній діаграмі, тобто ймовірність повторення стану системи.

Процеси зі стохастичною поведінкою можуть породжувати дуже короткі діагоналі або взагалі не породжувати їх, у той час як детерміністичні процеси дають довгі діагоналі і малу кількість окремих рекурентних точок. Таким чином, відношення рекурентних точок, складових діагональні структури, до загальної кількості рекурентних точок

DET

l P l

 

(16.6)

Rim, j,

 

 

 

 

 

називається мірою детермінізму (determinism, DET), або передбачуваністю системи. Проте, варта зазначити, що ця міра не має значення реального детермінізму процесу. Порогове значення мінімальної довжини lmin виключає діагональні лінії, утворені тангенціальним рухом траєкторії у

фазовому просторі. Очевидно, що lmin 1 і DET 1. Діагональні структури показують час,

протягом якого ділянка траєкторії підходить досить близько до іншої ділянки траєкторії. Таким чином, ці лінії дозволяють судити про розбіжність елементів траєкторії. Середня довжина діагональних ліній

152

 

N

 

l

 

 

 

lP

L

l lmin

 

 

(16.7)

N

 

 

 

 

l

 

P

l lmin

це середній час, протягом якого дві ділянки траєкторії проходять близько одна до одної, і може розглядатися як середній час передбачуваності.

Також знаходить застосування максимальна довжина діагональних структур Lmax max li : i 1, 2, , Nl або її інверсія дивергенція (divergence, DIV):

DIV

1

 

Lmax .

(16.8)

Встановлено, що довжини діагональних ліній співвідносяться з найбільшим позитивним показником Ляпунова, якщо він існує для даної системи. Різними авторами були запропоновані методи оцінки максимального позитивного показника Ляпунова з використанням довжин діагональних ліній.

Міра ентропії (entropy, ENTR) співвідноситься з ентропією Шеннона (Shannon) частотного розподілу довжин діагональних ліній:

 

 

N

 

 

ENTR

p l ln p l ,

(16.9)

l lmin

 

 

де

 

P l

 

 

 

p l

 

 

,

(16.10)

 

N

 

 

 

 

 

 

P l

 

 

l lmin

і відображає складність детерміністичної складової в системі.

Подана нижче міра представляє собою, по суті, відношення между DET і RR і может быть обчислена з частотного розподілу довжин діагональних ліній:

 

2

 

 

l P l

 

RATIO N

 

 

 

 

 

 

 

.

(16.11)

 

 

 

l P l 2

 

 

 

 

 

 

Евристичне вивчення фізіологічних систем показало, що ця міра може бути використана для розпізнавання фазових переходів у випадках, коли RR зменшується, а DET залишається постійною.

Міра завмирання (laminarity, LAM)

 

P

 

LAM

 

 

(16.12)

R

m, i, j

 

 

 

 

 

визначається відношенням кількості рекурентних точок, що утворюють горизонтальні лінії до загальної кількості рекурентних точок. LAM характеризує наявність станів завмирання системи, коли рух системи по фазовій траєкторії зупиняється або просувається дуже повільно).

Середня довжина горизонтальних структур (trapping time, TT)

 

N

 

 

P i

 

TT

min

 

(16.13)

N

 

 

 

P

 

min

153

називається показником затримки і характеризує середній час, який система може провести в більш-менш незмінному стані. Вплив стохастичної складової процесу призводить до появи на діаграмі окремих точок і дуже коротких діагональних ліній. В основному стохастичні процеси, як уже згадувалося вище, взагалі можуть не породжувати довгих діагоналей (наприклад, узагальнений броунівський рух), а якщо такі і виявляються, то їх поява носить випадковий характер.

Міра відношення кількості точок, які формують діагональні лінії довжиною l lmin , до кількості точок, які формують діагональні лінії l lmin ,

 

lmin 1

 

 

 

l P l

CLEAN

l 1

 

(16.14)

Nl

 

 

P l

 

l

l lmin

називається мірою чистоти (cleanness, CLEAN), вона показує вплив стохастичної складової процесу. Очевидно, що переважання останньої призведе до зростання значення CLEAN.

Контрольні питання

1.Поняття рекурентного аналізу.

2.Проблеми та застосування рекурентних діаграм.

3.Поняття рекурентності та рекурентних діаграм.

4.Суть рекурентних точок.

5.Аналіз рекурентних діаграм.

6.Побудова рекурентних діаграм в Ексель.

7.Кількісний аналіз рекурентних діаграм.

154

ЛАБОРАТОРНА РОБОТА № 16

ПОБУДОВА РЕКУРЕНТНИХ ДІАГРАМ

В різноманітних сферах людської діяльності зустрічаються системи, які характеризуються своєю поведінкою з точки зору її складності, динамічності, особливості існуючих в цій системі процесів. Такі системи опосередковано чи безпосередньо впливають на діяльність людей, оточуюче середовище, а тому необхідно і важливо вивчати, досліджувати і моделювати їх динаміку та передбачати їх поведінку з плином часу. Складні динамічні системи переважно характеризуються нерегулярною динамікою поведінки, проявами якої є, як випадкові, так і детерміновані хаотичні процеси. Спостереження за такими системами та їх експериментальні дослідження подаються часовими рядами – дискретною послідовністю випадкових величин, що є значеннями відповідних показників, впорядкованими за часом їх отримання, які характеризують стан об’єкта спостереження в окремі моменти часу. Іншими словами, сукупність таких вимірів (показників) на протязі певного періоду часу являють собою часовий ряд. Основною метою аналізу часових рядів отримання інформації про властивості і механізм системи, яка генерує даний ряд. Саме вони є основою моделювання таких систем. Часові ряди є дискретними послідовностями чисел, які розподілені регулярно або випадково в часовому інтервалі спостереження за системою. Кожному числу відповідає момент його спостереження, тобто ці числа є впорядковані відносно біжучого часу функціонування системи. Такий спосіб представлення інформації про явища, еволюційні процеси, рухи та динаміку досліджуваної системи є дуже поширеним і зручним. В деяких випадках, дискретні спостереження або вимірювання є цілком природними або, й навіть, єдиним можливим способом збору інформації про систему, а в інших – дискретність використовується для даних в задачах попереднього моделювання, прогнозування та отримання наближених оцінок функціональної придатності системи або пов’язана з вибором способу спостереження.

За останні десятиліття арсенал статистичних методів обробки та аналізу експериментальних даних суттєво поповнився методами нелінійної динаміки. Принципи роботи з такими методами, подані літературними джерелами вказують на те, що більшість методів нелінійної динаміки потребують досить довгих і стаціонарних часових рядів, за винятком, хіба що, методу рекурентного аналізу. Застосування статистичних методів для роботи з часовими рядами певною мірою забезпечує адекватність побудованої моделі досліджуваному явищу, процесу чи об’єкту, проте подати динаміку їх розвитку ними є досить проблематично. Статистичні методи дозволяють успішно розв’язувати задачі визначення форми і тісноти зв’язку між факторами і результативними показниками, дають кількісні оцінки та якісні характеристики об’єктів.

Для проведення рекурентного аналізу при дослідженні динамічних систем не потрібно наявності великого обсягу первинних даних, достатньо часового ряду даних одного вимірювального експерименту. Рекурентні діаграми, отримані в процесі аналізу часових рядів, мають у своїй основі геометричну структуру. Основна діагональ на рекурентній діаграмі має вигляд чорної діагональною лінії – лінії ідентичності. Окремі точки на діаграмі не несуть ніякої інформації, однак, в сукупності дозволяють реконструювати властивості досліджуваного процесу.

В дослідженні процесів з використанням рекурентних діаграм розглядають два типи структур: топологію і текстуру. При цьому топологія, яка відповідає великомасштабним структурам дає загальне уявлення про характер процесу і відносить його в такі класи: однорідні, періодичні, дрейф і білі області. Текстура характеризує дрібномасштабну структурою діаграми і

155

складається з окремих точок та діагональних, горизонтальних і вертикальних ліній.

Основною рисою, яка виділяє аналіз часових рядів серед інших видів статистичного аналізу є суттєвість порядку, в якому відбуваються спостереження. Виявлення закономірностей зміни рівнів ряду і побудова його моделі в цілях прогнозування, і дослідження взаємозв’язків між явищами є метою дослідження часового ряду.

Метою лабораторної роботи є вивчення можливостей використання засобів MS Excel для побудови рекурентних діаграм коротких часових послідовностей.

Застосування методу рекурентних діаграм має важливе значення в тому, що на відміну звичайного подання часового ряду графіком в декартовій системі координат як характерних особливостей послідовності значень рівнів та їхньої тенденції, рекурентні діаграми дають інформацію про іншу його характеристику, а саме – поведінку у фазовому просторі.

Також варта відмітити, що сам по собі рекурентний аналіз, являє собою багате поле для досліджень, як самого методу, так і аспектів його застосування.

1. Поняття рекурентної діаграми та її властивості.

Суть рекурентних діаграм полягає у візуалізації функціональної діяльності та динаміки систем на основі даних спостереження, що дає змогу зрозуміти основні властивості і структури, відображені спостережуваними даними.

Опис динамічних систем, тобто систем, в яких з часом змінюються параметри здійснюють шляхом опису зміни їх станів, вказуючи функціональну залежність стану системи від значень на її входах в конкретні моменти часу. В математичному сенсі, будь-яка динамічна система може бути подана як рух зображуючої точки у фазовому просторі – просторі станів. Основною характеристикою такого простору є його розмірність. Розмірність фазового простору визначається кількістю величин, що характеризують стан системи. Кожна з цих величин є фазовою координатою в цьому просторі, а їх сукупність утворює вектор, який і описує стан системи. кожному стану системи відповідає певна точка фазового простору – зображувальна точка. Послідовність цих точок у фазовому просторі відображає рух системи або, точніше, зміну станів системи, відповідає деякій траєкторії, яку називають фазовою траєкторією. Проекція фазової траєкторії на фазову площину утворює фазовий портрет. Графічне зображення фазової траєкторії дає характеристику поведінки системи.

При дослідженні складних систем досить часто їх можна охарактеризувати навіть єдиним спостережуваним показником, виміряним в дискретні моменти часу t , оскільки заміряти інші

показники, практично, або неможливо або дуже складно. Інтервал t може бути постійною

величиною або випадковою, хоча в останньому випадку це створює додаткові і часом значні труднощі щодо обробки спостережуваних даних.

Взаємодії у складних системах є такими, що отримана фазова траєкторія, в якій зберігається структура оригінальної фазової траєкторії може бути відновлена, у відповідності з теоремою

Такенса [15], з одного часового ряду методом часової затримки. Іншими словами, якщо маємо

часовий ряд X t

x t1 , x t2 , , x tn

, то використовуючи метод затримки, наприклад в нашому

випадку

t

1,

отримуємо ряд

X t x t1 t , x t2 t , , x tn t . Пари значень

x ti ; x ti

t

є фазовими координатами зображуючої точки на фазовій площині, яка відображає

фазову траєкторію станів системи. Графічно, динаміка системи в обмеженій області фазової площини подається зображенням фазових траєкторій. У 1890 році А.Пуанкаре опублікував сформульовану ним теорему рекурентності, а саме: якщо система зводить свою динаміку до обмеженої підмножини фазового простору, то система майже напевно, тобто з вірогідністю, практично рівною одиниці як завгодно близько повертається до певного наперед заданого режиму. Суть цієї фундаментальної властивості полягає в тому, що через деякий час система прагне повернутися до деякого стану, певним чином близькому до минулого і проходить при цьому подібні стани еволюції [10].

Відображення m –мірної фазової траєкторії станів процесу X t на домірну квадратну двійкову матрицю n n , в якій 1 (одиниця) відповідає повторенню стану, тобто стани на момент

156

ti і в момент

 

t j є (майже) еквівалентні, а координатні осі є осями часу називають рекурентною

діаграмою.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рекурентна діаграма описується таким співвідношенням

 

 

 

 

 

 

 

 

 

 

 

Rm,

x x

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i, j

 

i

 

 

i

 

j

 

 

 

 

 

 

де x

x , x

2

, , x

n

R m , i,

j 1, 2, , n ; n

кількість розгляданих станів, тобто кількість

i

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

зображуючих точок;

 

i – розмір околиць точки

в момент i ;

 

 

 

– норма (відстань) і

 

x

 

 

функція

Гевісайда.

Форма околиці, що

характеризується

параметром i , визначається

типом

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

вибраної норми і є центрована відносно точки

 

xi ,

тобто радіус околиці у фазовому просторі з

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

центром в точці xi .

 

У випадку одномірного часового ряду замість околиці фігурує інтервал з

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

серединою в точці

xi . Якщо точка x j виявляється в середині цієї околиці, то такий стан x j

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ri, j 1. Радіус i може бути

вважається подібним до стану

xi , і на діаграмі ставиться точка

постійним для всіх

xi , а може визначатися для кожної точки окремо, щоб в отриману околицю

завжди потрапляла визначена кількість подібних станів. Переважно використовується постійне значення i , що призводить до отримання симетричної рекурентної діаграми відносно лінії

Ri, j 1 при i j – головної діагоналі матриці відстаней. .

Зображення рекурентних діаграм, приведені на рис. 1. відображають поведінку процесу в часі і дають підстави для висновків щодо його характеру та топології і текстури.

2. Побудова рекурентної діаграми у середовищі табличного процесора MS Exсel.

Для ілюстрації методу побудови рекурентної діаграми засобами табличного процесора MS Exсel використано часовий ряд, зазначений у індивідуальному завданні.

Тобто, реалізація даного методу побудови рекурентних діаграм в середовищі табличного процесора MS Excel здійснювалась в рамках експериментальних досліджень операторського персоналу, в сенсі ідентифікації операторів, на підставі індивідуальних часових рядів значень часу розпізнавання в послідовності зображень-тестів об’єктів заданого класу локалізованих на цих зображеннях випадковим чином. Далі для даного часового ряду здійснено затримку t 1, тобто

поряд з ним розміщений той самий ряд, але зміщений відносно себе на одне значення.

Таким чином, ці два ряди є представлені в просторі R1i,, j . Проте, для побудови рекурентної

діаграми ці ряди записують в робочій книзі MS Exсel два рази, тобто перший і третій стовпчики та другий і четвертий є ідентичними як на рис. 2.

На цьому рисунку справа виділено місце для матриці близькостей – зображення рекурентної діаграми. В даному випадку, це має суттєве значення, оскільки рекурентна діаграма одномірного часового ряду є фактично матрицею близькості між зображуючими точками на фазовій площині.

Аналогом радіуса i

 

 

 

 

 

 

 

околиці точки

xi є відстань di, j між точкою з координатами xi ; xi 1 і

точками з координатами

xi j ; xi 1 j

що належать зсунутому ряду.

 

 

В якості аналітичної функції

для обчислення відстані в даному дослідженні використано відстань

 

 

 

 

 

 

 

 

 

Евкліда DЕвкл

N

yi

2

 

 

 

 

 

xi

 

, де N – кількість рівнів часового ряду, а

x і

y порівнювані вектори

 

i 1

 

 

 

 

 

 

 

координат.

На відміну від матриці близькості рекурентна діаграма містить лише ті значення відстані, які належать до інтервалу i , але подає їх не обчисленими числовими значеннями, а двійковими

логічними символами, тобто відстань di, j між точкою xi і x j подається як предикат

157

1,

di j

,

 

di , j

0,

d

 

,

(2)

 

i j

 

 

 

 

 

де – заданий інтервал.

а) однорідна топологія

б) дрейф сигналу

в) осцилююча поведінка

г) контрастна топологія

158

д) ламінарність процесу

Рис. 1. типові динамічні ряди та їх рекурентні діаграми.

Рис. 2. Локалізація даних на робочому аркуші MS Exсel.

Так як матриця близькості є симетричною відносно головної діагоналі, так само і рекурентна діаграма має свою власну таку діагональ, лишень відмінність між ними в тому, що на головній діагоналі матриці близькостей розташовані нулі (відстань між даним елементом і ним самим рівна нулю), а на головній діагоналі рекурентної діаграми розташовані, створені в табличному процесорі MS Exсel, одиниці (як результат значення предикату).

Таким чином, для побудови рекурентної діаграми необхідно подати даний часовий ряд так, як для побудови фазового портрету, тобто змістити ряд відносно себе самого і прийняти значення даного ряду за координати незалежної змінної вздовж осі абсцис, а значення зміщеного ряду прийняти за значення координат залежної змінної вздовж осі ординат. зауважимо, що в цьому випадку кількість зображуючих точок буде N 1, за рахунок втрати одного рівня при зсуванні ряду, першого чи останнього.

Метод побудови рекурентної діаграми. Метод полягає в реалізації на робочому аркуші MS 159

Exсel таких операцій і може бути відповідно проілюстрований такими кроками.

 

Крок 1. Нехай ряд X t x1, x2 , , xN розміщений в стовпчику B так, що

x1 В3 ,

x2 В4 ,

x3 В5 і т.д.

В стовпчику C розмістимо «зміщений» часовий ряд X t t

так, що

x1 C4 ,

x2 C5 , x3

C6 і т.д. Пари значень B i i C i є відповідно абсцисою та ординатою

зображуючої точки на фазовому портреті. Очевидно, що таких пар є N 1. Скопіюємо ці два стовпчики як пари координат зображуючих точок і вставимо їх копію поруч, як зображено на рис. 2, тобто, починаючи з комірок E4 і F4 .

Крок 2. Для побудови рекурентної діаграми потрібно знайти значення предиката (2), визначаючи відстань di, j від кожної зображуючої точки з координатами B i ; C i до кожної

зображуючої точки з координатами E j ; F j , де i, j 4, N 1 . Саме використання обох стовпчиків пар B i ; C i і E j ; F j забезпечує визначення відстані di, j між зображуючи ми

точками та порівняти її величину з наперед заданою величиною . Для цього використовуємо формулу, яка забезпечує обчислення значення відстані Евкліда та порівнює його зі значенням величини

=ЕСЛИ(КОРЕНЬ(($B$4-$E4)^2+($C$4-$F4)^2)<ε;1;0),

(3)

яку поміщаємо в комірку Н3. Шляхом автозаповнення обчислюємо N 1 значення для стовпчика Н, тобто отримуємо послідовність нулів і одиниць в межах Н3:Н( N 1).

Крок 3. Копіюємо формулу (2) з комірки Н3 і вставляємо її в комірку І3. Оскільки усі відстані між точкою B4; C4 і всіма іншими точками, включаючи і цю точку, визначені і знаходяться в стовпчику Н переходимо до точки B5; C5 . Для цього зробимо в формулі (3)

заміну $B$4 і $C$4 на $B$5 і $C$5

 

=ЕСЛИ(КОРЕНЬ(($B$5-$E4)^2+($C$5-$F4)^2)<ε;1;0),

(4)

Далі, використовуючи автозаповнення отримаємо значення відстаней від точки B5;C5 до

всіх інших точок. Перебираючи в такий спосіб точки отримуємо зображення рекурентної діаграми, фрагмент якої зображений за допомогою нулів і одиничок на рис. 3.

Чим менша дисперсія і гладкіший тренд відстань буде меншою. З другої сторони, чим меншим є , тим менше клітинок діаграми буде зайнято одиничками.

Рекурентна діаграма побудована в середовищі табличного процесора MS Exсel має вигляд зображений на рис. 4.

160

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]