- •1)Základní pojmy
- •Grafické znázornění dat
- •2)Pravděpodobnost
- •Náhodný pokus
- •Vlastnosti pravděpodobnosti
- •Distribuční funkce f(X)
- •Vlastnosti:
- •Rozdělení diskrétních náhodných veličin – mají pravděpodobnostní fci
- •Normované normální rozdělení
- •3)Základní statistické charakteristiky
- •Variační koeficient V
- •T bodový odhad populačního parametru θ
- •Intervalový odhad
- •Interval spolehlivosti pro populační průměr
- •Intervalový odhad rozptylu
- •Intervalový odhad relativní četnosti
- •5)Testování statistických hypotéz
- •Parametrické testy
- •1.Etapa : Jednoduchá analýza rozptylu:
- •2.Etapa: Podrobnější vyhodnocení výsledků anovy
- •Kruskalův – Wallisův test
Intervalový odhad rozptylu
Předpoklad: výběr z populace s normálním
rozdělením N(μ, σ2), parametr μ je neznámý
Intervalový odhad relativní četnosti
Odhadujeme parametr p při alternativním rozdělení
5)Testování statistických hypotéz
Statistická hypotéza – tvrzení o tvaru nebo charakteristice rozdělení jednoho či několika statistických znaků.
Parametrické hyp. – týkají se hodnot parametrů rozdělení (pro parametrické testy)
Neparametrické hyp. – tvrzení o zákonu rozdělení ZS (u neparametrických testů)
Nulová hypotéza H0 – testovaná hypotéza, tvrzení o shodě (rovnosti)
Alternativní hypotéza H1 – popírá platnost nulové hypotézy, tvrzení o neshodně
Oboustranná H1: μ1≠μ2
Jednostranná/Pravostranná H1: μ1>μ2
Jednostranná/Levostranná H1: μ1<μ2
Statistický test – postup, jímž na základně náhodného výběru ověřujeme, zda tato hypotéza platí či nikoliv (parametrické, neparametrické)
1) Formulace nulové a alternativní hypotézy H0 a H1
2) Volba hladiny významnosti α (pravděpodobnost (míra rizika), že H0 zamítneme, ačkoliv platí)
3) Volba vhodné testové statistiky T (testu)
4) Výpočet testového kritéria T na základě výběrových dat
5) Vymezení kritického oboru K pro platnost nulové hypotézy H0 (výpočet P(sig)-hodnoty)
Kritický obor K – část oboru možných hodnot
6) Rozhodnutí: T leží v kritickém oboru K (resp. p < α ) → H0 zamítáme T neleží v K (resp. p > α ) → H0 nelze zamítnout
7) Interpretace statistického rozhodnutí
Chyba 1.druhu – zamítnutí správné H0, pravděpodobnost = α
Chyba 2.druhu – přijetí nesprávné H0, pravděpodobnost = β
Síla testu – pravděpodobnost zamítnutí nesprávné nulové hypotézy = (1- β )
Parametrické testy
- testují převážně parametr průměr, ale i rozptyl
- podmínkou je normalita dat (normální rozdělení)
Jednovýběrový
Dvouvýběrový
Jednovýběrový – 1 výběrový soubor a 1 předpoklad
H0 = μ0=μ1 shoda mezi předpokladem a skutečností
H1 = μ0≠μ1 neshoda mezi předpokladem a skutečností
Dvouvýběrový – 2 výběrové soubory, které se porovnávají
1)Nezávislé výběry – 2 statistické jednotky
H0: μ1=μ2 σ12=σ22
H1: μ1≠μ2 σ12≠ σ22
1.Krok – testujeme variabilitu (kolísání) -> Leveneho test (F-test)
2.Krok – testujeme parametr průměr
V SPSS – u 1. Kroku SHODA – beru 1. Řádek
V SPSS – u 1. Kroku NESHODA – beru 2. Řádek
Příklady:
Průměrný tlak u mužů a žen se shoduje
Průměrný počet bodů ze zápočtu u mužů a žen se shoduje
Průměrná doba dojížďky chlapců a dívek do školy se shoduje
2)Závislé výběry – 1 statistická jednotka a k ní 2 informace
H0: μ1=μ2
H1: μ1≠μ2
- testování založeno na párových diferencích
- Párový t-test
Příklady:
Pro každého studenta známe průměrnou dobu dojížďky v lednu a v říjnu
Pro každého studenta víme výsledek z 1. a z 2. Zápočtového testu
Pro každého studenta víme rychlost zachycení tužky dominantní a nedominantní rukou
Vícevýběrový – více než 2 nezávislé výběry
Analýza rozptylu – zobecnění dvouvýběrového t-testu.
- soubor metod, pomocí kterých lze sledovat vliv jednoho nebo více faktorů na populační průměr
H0 : μ1 = μ2 = . . . = μm
H1 : existuje alespoň jedna dvojice populačních průměrů, které se liší
- podstatou ANOVY je najít alespoň jednu dvojici průměrů, která se liší.
