- •Rodzaje badań statystycznych
- •Szeregi statystyczne
- •Szereg szczegółowy ważony
- •Szereg rozdzielczy
- •Rachunek prawdopodobieństwa
- •Rozkład prawdopodobieństwa skokowej zmiennej losowej X spełnia następujące warunki
- •Oczekiwana wartość I odchylenie standardowe zmiennej losowej
- •Wariancja I odchylenie standardowe zmiennej losowej
- •Twierdzenie Czebyszewa
- •Wybrane rozkłady zmiennej losowej skokowej
- •Rozkład jednopunktowy
- •Rozkład dwupunktowy
- •Rozkład dwumianowy
- •Średnia, wariancja I kształt rozkładu dwumianowego
- •Rozkład Poissona
- •Zmienna losowa ciągła I jej rozkłady
- •Rozkłady zmiennej losowej ciągłej
- •Rozkład chi – kwadrat
- •Rozkład t – Studenta
- •Rozkład f – Snedecora
- •Estymacja punktowa I przedziałowa
- •Pobieranie próby losowej
- •Trzy główne aspekty centralnego twierdzenia granicznego
- •Estymatory I ich własności
- •Estymacja przedziałowa parametrów
- •Weryfikacja hipotez statystycznych
- •Hipotezy alternatywne mogą być sformułowane względem hipotezy zerowej
- •Weryfikacja hipotez statystycznych Podstawowe pojęcia
- •Test dla dwóch średnich
- •Test dla wariancji
- •Test dla dwóch wariancji
- •Test dla wskaźnika struktury
- •Test dla dwóch wskaźników struktury
- •Parametryczne testy istotności – Przykłady
- •Testy nieparametryczne
- •Test zgodności - Kołmogorowa
- •Analiza korelacji I regresji .
- •Wyniki obserwacji pogrupowano I zamieszczono w poniższej tablicy
Rozkłady zmiennej losowej ciągłej
Rozkład normalny
Rozkład normalny wiąże się z nazwiskiem matematyka K.F. Gaussa ( 1777 – 1855 ) i bywa najczęściej określany jako rozkład Gaussa. Rozkład normalny to jeden z najważniejszych rozkładów zmiennej losowej ciągłej. Odgrywa on w zastosowaniach statystyki ogromną rolę. Mówimy , że zmienna losowa x ma rozkład normalny z parametrami i , co zapisujemy lub , jeśli jej funkcja gęstości jest określona następującym wzorem :
, dla ( 9)
gdzie :
Krzywa gęstości prawdopodobieństwa rozkładu normalnego ma następujące własności :
Krzywa normalna jest krzywą w kształcie dzwonu, symetryczną względem prostej przechodzącej przez punkt , co znaczy, że jest spełniona równość : . Oś rzędnych jest oczywiście osią symetrii krzywej.
Obszar ograniczony wykresem funkcji f(x) i osią odciętych ma pole równe jedności.
Funkcja gęstości prawdopodobieństwa rozkładu normalnego osiąga maksimum w punkcie . Obliczając pochodną funkcji (9) i przyrównując ją do 0 , sprawdzamy łatwo, że wartość maksymalna tej funkcji gęstości wynosi :
4.Krzywa gęstości prawdopodobieństwa rozkładu normalnego ma 2 punkty przegięcia, położone symetrycznie względem osi rzędnych , o odciętych , w których krzywa z wklęsłej przechodzi w wypukłą lub odwrotnie.
Parametr rozkładu normalnego jest to średnia rozkładu czyli miara położenia. Mówi o tym , gdzie leży centrum rozkładu na osi liczbowej. Ponieważ krzywa gęstości normalnej jest symetryczna i ma jeden szczyt , w środku ,średnia jest równocześnie medianą i dominantą rozkładu prawdopodobieństwa. Inaczej mówiąc, jest też punktem, w którym gęstość jest największa i który dzieli pole pod krzywą gęstości na połowy, z których każda ma miarę ½.Standardowe odchylenie jest miarą zmienności , czyli rozproszenia zmiennej. Gdy standardowe odchylenie jest duże, wykres funkcji gęstości jest „ szeroki „ , ale za to „ płaski „( Całe pole pod krzywą musi mieć miarę równą 1 ). Gdy standardowe odchylenie jest małe, wykres funkcji gęstości jest „ wąski „ ale „ wysoki „
Na uwagę zasługują także następujące własności rozkładu normalnego :
W analizach szczególnie ważna jest reguła trzech odchyleń standardowych zwana także reguła 3 sigm, której prawdopodobieństwo jest bardzo wysokie i praktycznie wynosi 1. Jest ona wykorzystywana w badaniach empirycznych w celu eliminacji obserwacji nietypowych, nie przystających do pozostałych ( wątpliwych , rzadkich , odstających , ekstremalnych ) , co do których istnieją przypuszczenia , że pochodzą z innej zbiorowości. Za wątpliwe uznaje się takie obserwacje , których wartość różni się od średniej o więcej niż 3 odchylenia standardowe.
Rozkład normalny standaryzowany
Rozkład normalny z wartością oczekiwaną i odchyleniem standardowym , czyli , określony za pomocą formuły :
( 10 )
Każdy rozkład normalny może być transformowany do rozkładu normalnego poprzez procedurę standaryzacji zmiennej X do Z. Czasami zamiast Z stosuje się literę U ( unormowana ). Zmienna losowa standaryzowana wyraża się wzorem :
( 11 )
Procedura standaryzacji ma swoje uzasadnienie w tym, że tylko rozkład normalny standaryzowany jest stablicowany. Najczęściej korzysta się z tablic dystrybuanty .
Przykład 1.
Załóżmy , że mamy 100 pojedynczych wyników pomiarów pewnej wielkości. Efekty obserwacji pogrupowano , a wyniki w postaci szeregu rozdzielczego przedziałowego podano w poniższej tablicy. Zachodzi przypuszczenie , że rozkład liczby wszystkich pomiarów ma rozkład normalny .
Tab.1. Szereg rozdzielczy wyników pomiaru pewnej wielkości ( w mm)
Wyniki pomiarów
|
Liczba wyników
|
|
|
79-81 |
1 |
80 |
80 |
81-83 |
4 |
82 |
328 |
83-85 |
9 |
84 |
756 |
85-87 |
15 |
86 |
1 290 |
87-89 |
24 |
88 |
2 112 |
89-91 |
21 |
90 |
1 890 |
91-93 |
13 |
92 |
1 196 |
93-95 |
9 |
94 |
846 |
95-97 |
3 |
96 |
288 |
97-99 |
1 |
98 |
98 |
|
100 |
|
8 884 |
Źródło : A. Zeliaś : Metody statystyczne . PWE, Warszawa 2000 s. 221-222.
Parametry rozkładu normalnego i szacujemy na podstawie wyników zamieszczonych w powyższej tablicy ( tab.1 ) i otrzymujemy : i . Pozostałe obliczenia potrzebne do ustalenia , czy jest to rozkład normalny, znajdują się w poniższej tablicy :
|
|
|
|
|
|
80 |
1 |
-2,73466 |
0,009606 |
0.59 |
0,41 |
82 |
4 |
-2,11596 |
0,042166 |
2,61 |
1,39 |
84 |
9 |
-1,49726 |
0,129518 |
8,01 |
0,99 |
86 |
15 |
-0,87855 |
0,270864 |
16,76 |
-1,76 |
88 |
24 |
-0,25985 |
0,385683 |
23,86 |
0,14 |
90 |
21 |
0,35885 |
0,373911 |
23,13 |
-2,73 |
92 |
13 |
0,97755 |
0,246809 |
15,27 |
-2,27 |
94 |
9 |
1,59625 |
0,112704 |
6,97 |
2,03 |
96 |
3 |
2,21495 |
0,034710 |
2,15 |
0,85 |
98 |
1 |
2,83365 |
0,007274 |
0,45 |
0,55 |
|
100 |
|
|
99,8 |
|
Z uwagi na to , że różnice między rozkładem empirycznym a teoretycznym , czyli od i= 1,2,...,10 są względnie duże , to nie można przyjąć , że rozkład liczby wyników pomiarów nie jest rozkładem normalnym.