- •Diagnostika vybočujících měření
- •Další typy (nelineární) regresních funkcí
- •Mnohonásobná lineární regrese a korelace
- •Časové řady
- •Modely časových řad
- •Neperiodické časové řady
- •Periodické časové řady
- •Posouzení empirických dat s modelem
- •Charakteristiky kvality vyrovnávání
- •Adaptivní modely časových řad
- •Klouzavé průměry
- •Modely pro exponenciální vyrovnávání
- •Modely periodických časových řad (se sezónní složkou)
- •Korelace a autokorelace časových řad Korelace časových řad
- •Autokorelace časových řad
- •Autoregresní modely časových řad
- •Vícerozměrné statistické metody
- •Vícenásobná regrese a korelace
- •Analýza hlavních komponent (pca)
- •Interpretace hlavních komponent Faktorová analýza
Časové řady
Časová řada = posloupnost hodnot nějaké proměnné měřené v určitých po sobě jdoucích okamžicích, které jsou od sebe (obvykle) stejně vzdálené, v ekonomických aplikacích = posloupnost hodnot nějakého (věčně a prostorově vymezeného) ukazatele
Klasifikace = okamžiková X intervalová, neperiodická X periodická, krátkodobá X dlouhodobá
Důvody analýzy = vytvoření modelu (může vysvětlit chování časové řady, například odhalit sezónní složku v datech), prognóza budoucího vývoje, vliv nějaké události na chování časové řady
Úroveň hodnot = charakterizujeme pomocí průměru řady = intervalová (aritmetický průměr) X okamžiková (chronologický průměr = při nestejném intervalu mezi měřením je třeba vážit dílčí průměry)
Očišťování hodnot = dělá se při nestejných intervalech (kalendářní dny, pracovní dny, prodejní dny)
Rychlost změn v čase: relativní charakteristiky (koeficient růstu (tempo), průměrný koeficient růstu) a absolutní charakteristiky:
1. Diference = absolutní přírůstky (úbytky) charakterizující rychlost změn
2. Absolutní diference = charakterizující absolutní zrychlení (zpomalení) časové řady
Průměrný absolutní přírůstek
Modely časových řad
Rozpětí let, čtvrtletí, měsíce, …
Klasické modely časových řad = modely s deterministickými složkami a nezávislými chybami)
Dekompozice modelu (nezávislé náhodné veličiny s N(0,rozptyl)
Sledování dlouhodobé tendence vývoje (růst X pokles) => trend (T)
Periodické kolísání => periodická složka (P)
Nespecifické odchylky náhodného charakteru (náhodné chyby) => bílý šum (e)
Aditivní model (Y = T + P + e) X multiplikativní model (Y = T*P*e)
Neperiodické časové řady
Bez periodické složky
Analytické vyrovnávání časové řady (regresní přístup k trendové složce) => trendová funkce
Nejčastější typy = lineární, kvadratická, logaritmická, exponenciální => doporučuje se transformace času t před výpočtem
Periodické časové řady
Obsahují periodickou složku
Sezónní kolísání = opakování vývoje v průběhu roku u řad, které jsou měřeny měsíčně, čtvrtletně, … (perioda jednou za rok = sezónní složka S)
Cyklické kolísání = cykly s delší periodou než 1 rok (cyklická složka C)
Krátkodobé kolísání = perioda cyklů kratší než 1 rok
Posouzení empirických dat s modelem
Nereziduální směrodatná odchylka (s) závisí na počtu strukturálních parametrů trendové funkce
Index determinace (I na druhou), index korelace (I)
Chyby:
MSE = mean squared error => střední čtvercová chyba
RMSE = root mean squared error => základní průměrná čtvercová chyba
MAE = mean absolute error => střední absolutní chyba
MAPE = mean absolute percent error = střední absolutní procentní chyba (MAPE do 10% = model použitelný, MAPE do 5% = kvalitní model)
Charakteristiky kvality vyrovnávání
Intrapolace = hodnoty časové řady = odhad hodnoty mezi 2 měřeními
Extrapolace = časové řady = prognóza budoucího vývoje
Modely, které dávají dobrý popis minulosti, nemusí nutně dávat kvalitní prognózy do budoucnosti
Následné hodnocení přesnosti predikce = relativní chyba predikce (závisí na predikci v čase na období dopředu a pozorované hodnotě časové řady v čase)
Model časové řady vytvořen na základě prvních n-m hodnot časové řady (časová řada zkrácena o m období), pak použít pro predikci již známých hodnot (teheilův koeficient nesouladu)
0% < T < 5% => chyba predikce malá
5% < T < 10% => střední
10% < T => velká
