- •Rodzaje badań statystycznych
- •Szeregi statystyczne
- •Szereg szczegółowy ważony
- •Szereg rozdzielczy
- •Rachunek prawdopodobieństwa
- •Rozkład prawdopodobieństwa skokowej zmiennej losowej X spełnia następujące warunki
- •Oczekiwana wartość I odchylenie standardowe zmiennej losowej
- •Wariancja I odchylenie standardowe zmiennej losowej
- •Twierdzenie Czebyszewa
- •Wybrane rozkłady zmiennej losowej skokowej
- •Rozkład jednopunktowy
- •Rozkład dwupunktowy
- •Rozkład dwumianowy
- •Średnia, wariancja I kształt rozkładu dwumianowego
- •Rozkład Poissona
- •Zmienna losowa ciągła I jej rozkłady
- •Rozkłady zmiennej losowej ciągłej
- •Rozkład chi – kwadrat
- •Rozkład t – Studenta
- •Rozkład f – Snedecora
- •Estymacja punktowa I przedziałowa
- •Pobieranie próby losowej
- •Trzy główne aspekty centralnego twierdzenia granicznego
- •Estymatory I ich własności
- •Estymacja przedziałowa parametrów
- •Weryfikacja hipotez statystycznych
- •Hipotezy alternatywne mogą być sformułowane względem hipotezy zerowej
- •Weryfikacja hipotez statystycznych Podstawowe pojęcia
- •Test dla dwóch średnich
- •Test dla wariancji
- •Test dla dwóch wariancji
- •Test dla wskaźnika struktury
- •Test dla dwóch wskaźników struktury
- •Parametryczne testy istotności – Przykłady
- •Testy nieparametryczne
- •Test zgodności - Kołmogorowa
- •Analiza korelacji I regresji .
- •Wyniki obserwacji pogrupowano I zamieszczono w poniższej tablicy
Testy nieparametryczne
Sprawdzanie hipotezy na podstawie testu zgodności
Populacja
generalna ma dowolny rozkład o dystrybuancie należącej do zbioru
rozkładów o określonym typie postaci funkcyjnej dystrybuanty. Mogą
to być dystrybuanty typu ciągłego i skokowego. Z populacji tej
losujemy niezależnie dużą próbę , a wyniki losowania dzielimy na
r rozłącznych klas o liczebności ni
w każdej klasie , przy czym
Podział na klasy tworzy tzw. Rozkład empiryczny . Na podstawie
wyników próby stawiamy hipotezę , że dystrybuanta populacji
należy do klasy określonych dystrybuant, którą będziemy oznaczać
przez
; tzn.
,
gdzie F ( x ) jest dystrybuantą rozkładu populacji. Porównanie
dystrybuanty F ( x) z dystrybuantą empiryczną daje możliwość
weryfikacji postawionej hipotezy. Test zgodności dla tej hipotezy
jest następujący : z hipotetycznego rozkładu należącego do
poszczególnych klas wartości badanej cechy x prawdopodobieństwa
pi,
że zmienna losowa x o rozkładzie
przyjmie wartości należące do klasy o numerze i
( i=1,2,3,...,m ) . Z kolei mnożąc pi
przez liczebność całej próby , otrzymujemy liczebności
teoretyczne
,
które wystąpią w poszczególnych klasach , jeżeli postawiona
hipoteza H0
jest prawdziwa. Statystyką weryfikującą H0
jest hipoteza
:
która
ma przy słuszności założenia H0
rozkład asymptotyczny
o r-1 stopniach swobody , lub r-1-k stopniach swobody ( r – jest
liczbą klas , k – liczbą parametrów , które wyznaczamy dla
funkcji należącej do
).
Obszar krytyczny w tym teście buduje się prawostronnie w oparciu o
rozkład statystyki
.
Z tablic rozkładu , dla ustalonego z góry poziomu istotności
, odczytujemy wartość krytyczną
,
by zachodziło
.
Jeżeli
,
to H0
należy odrzucić , jeżeli
,
to nie ma podstaw do odrzucenia hipotezy.
Przykład 4 Losowa próba n=200 niezależnych obserwacji miesięcznych wydatków na żywność rodzin trzyosobowych dała następujący rozkład tych wydatków ( w tys. zł)
Wydatki |
Liczba rodzin |
1,0 - 1,4 |
15 |
1,4 - 1,8 |
45 |
1,8 – 2,2 |
70 |
2,2 – 2,6 |
50 |
2,6 – 3,0 |
20 |
Na poziomie istotności =0,05 należy zweryfikować hipotezę ,że rozkład wydatków jest normalny.
Rozwiązanie
Stawiamy
hipotezę
,
gdzie
jest klasą wszystkich dystrybuant normalnych. Dwa parametry rozkładu
tej dystrybuanty , średnią
i
odchylenie standardowe
,
szacujemy z próby za pomocą estymatorów
tys.
zł . , s=0,43 tys. zł – są one potrzebne do standaryzacji .
Pozostałe obliczenia znajduję się w tablicy
xi |
ni |
ui |
F(ui) |
pi |
npi |
(ni-npi)2 |
(ni-npi)2/npi |
1,4 |
15 |
-1,39 |
0,082 |
0,082 |
16,4 |
1,96 |
0,12 |
1,8 |
45 |
-1,46 |
0,323 |
0,241 |
48,2 |
10,24 |
0,21 |
2,2 |
70 |
0,46 |
0,677 |
0,354 |
70,8 |
0,64 |
0,01 |
2,6 |
50 |
1,39 |
0,918 |
0,241 |
48,2 |
3,24 |
0,07 |
3,0 |
20 |
2,32 |
1,00 |
0,082 |
16,4 |
12,96 |
0,79 |
|
200 |
|
|
1,000 |
200 |
|
1,20 |
Odpowiednia
liczba stopni swobody wynosi 5-1-2=2. Z tablic rozkładu
dla
dwóch stopni swobody i dla przyjętego poziomu istotności =0,05
odczytujemy wartość krytyczną
.
Mamy
, nie ma podstaw do odrzucenia hipotezy , że rozkład miesięcznych
wydatków w populacji rodzin trzyosobowych jest normalny.
