- •Diagnostika vybočujících měření
- •Další typy (nelineární) regresních funkcí
- •Mnohonásobná lineární regrese a korelace
- •Časové řady
- •Modely časových řad
- •Neperiodické časové řady
- •Periodické časové řady
- •Posouzení empirických dat s modelem
- •Charakteristiky kvality vyrovnávání
- •Adaptivní modely časových řad
- •Klouzavé průměry
- •Modely pro exponenciální vyrovnávání
- •Modely periodických časových řad (se sezónní složkou)
- •Korelace a autokorelace časových řad Korelace časových řad
- •Autokorelace časových řad
- •Autoregresní modely časových řad
- •Vícerozměrné statistické metody
- •Vícenásobná regrese a korelace
- •Analýza hlavních komponent (pca)
- •Interpretace hlavních komponent Faktorová analýza
Autokorelace časových řad
Hodnoty časové řady jsou nezávislé na hodnotách této řady v předcházejících obdobích
Autokorelace 1. Řádu = hodnota časové řady v čase t závisí na hodnotě této řady v čase t-1
Autokorelace k-tého řádu = hodnoty řady v čase t závisí na hodntě řady v čase t-k
Detekce autokorelace analýzou reziduí, které považujeme za odhady náhodné složky (Durbin-watsonův test = vždy v intervalu od 0 do 4)
Řada bez autokorelace => D = 2
Pozitivní autokorelace => D < 2
Negativní autokorelace => D > 2
Kdy je autokorelace významná? Závisí na rozsahu výběrového souboru n a alfa, tabulka kritických hodnot udává ds a dh
D < Ds => statisticky významná pozitivní autokorelace
Ds < D < Dh => test nerozhodnutelný
D > Dh => rezidua nevykazují pozitivní autokorelaci
Pro test negativní autokorelace použijeme tytéž hodnoty ds a dh odečtené od 4:
4 – D < ds => statisticky významná záporná autokorelace
Ds < 4 – D < dh => test nerozhodnutelný
4 - D > Dh => rezidua nevykazují zápornou autokorelaci
Autoregresní modely časových řad
Regresní model založený na váženém průměru posunutých řad, váhy jsou odhadnuty z regrese
(auto)regresní model založený na lag1 a lag2 = predikce y je vážený klouzavý průměr, kde váhy b1 a b2 lze nalézt pomocí regresní analýzy
K modelování časových řad se složitější strukturou se také využívá boxova-lenkinsonova metodologie, jenž je kombinací autoregresních modelů a modelů klouzavých průměrů pro reziduální složku. V případě nestacionální časové řady se provádí stacionalizace například diferencováním (řád d)
Stacionární časové řady = je taková řada, jejíž vlastnosti se nemění s časem a úrovní a rozptylu časové řady, je tedy konstantní v čase. Výslednými modely jsou: ARIMA (p,d,q) a SARIMA, která obsahuje také sezónní složku
Předpoklady užití = stacionalita (průměr, rozptyl a autokovariance), stejné intervaly mezi měřeními, dostatečný počet pozorování (minimálně 50)
Vícerozměrné statistické metody
Vícerozměrná data = na skupině n objektů sledujeme p znaků
Problém vysoké dimenzionality (dimenzionalita = vlastnost udávající míru něčeho v prostoru)
Konfirmativní analýza = důraz je kladen na odhad parametrů a testování hypotéz
Exploratorní analýza = důraz je kladen na průzkum dat, hledání zákonitostí, vzorů a struktur
Základní skupiny metodu
Metody analýzy korelačních struktur = vícenásobná regresní a korelační analýza, analýza hlavních komponent, faktorová analýza (latentní proměnné = schované)
Metody srovnávání skupin nebo ošetření = vícenásobná analýza rozptylu (MANOVA), kanonická korelace
Metody klasifikace objektů do existujících skupin = diskriminační analýza, logistická regrese
Metody analýzy podobnosti mezi objekty = shluková analýza, vícerozměrné škálování
Vícenásobná regrese a korelace
Regresní model = závisle proměnná Y
Korelační struktura = párové korelační koeficienty (korelační matice je symetrická), parciální korelační koeficienty, korelační index
Analýza hlavních komponent (pca)
Patří mezi nejstarší a nejpoužívanější metody vícerozměrné analýzy
Zavedena Pearsonem (1901) a nezávisle na tom Hotellingem (1933)
Hlavní cíle = zjištění vazeb mezi proměnnými, redukce počtu proměnných a nalezení nových smyslných proměnných
Je to průzkumová analýza
Vlastnosti objektů jsou popsány pomocí velkého počtu proměnných
Podstatou je lineární transformace původních proměnných do menšího počtu nových fiktivních proměnných, tzv. hlavních komponent
Vlastnosti komponent = jsou vzájemně nekorelované, metoda je založena na bezezbytkovém vysvětlení celkové variability, hlavní komponenty jsou uspořádány podle velikosti vysvětleného rozptylu, nejvíce informace o variabilitě proměnných je v první komponentě, nejméně v poslední
V případě normovaných proměnných je korelace mezi hlavní komponentou a proměnou
Postup při PCA:
