Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
20080504182756.doc
Скачиваний:
12
Добавлен:
21.09.2019
Размер:
1.72 Mб
Скачать

Rozkłady zmiennej losowej ciągłej

Rozkład normalny

Rozkład normalny wiąże się z nazwiskiem matematyka K.F. Gaussa ( 1777 – 1855 ) i bywa najczęściej określany jako rozkład Gaussa. Rozkład normalny to jeden z najważniejszych rozkładów zmiennej losowej ciągłej. Odgrywa on w zastosowaniach statystyki ogromną rolę. Mówimy , że zmienna losowa x ma rozkład normalny z parametrami i , co zapisujemy lub , jeśli jej funkcja gęstości jest określona następującym wzorem :

, dla ( 9)

gdzie :

Krzywa gęstości prawdopodobieństwa rozkładu normalnego ma następujące własności :

  1. Krzywa normalna jest krzywą w kształcie dzwonu, symetryczną względem prostej przechodzącej przez punkt , co znaczy, że jest spełniona równość : . Oś rzędnych jest oczywiście osią symetrii krzywej.

  2. Obszar ograniczony wykresem funkcji f(x) i osią odciętych ma pole równe jedności.

  3. Funkcja gęstości prawdopodobieństwa rozkładu normalnego osiąga maksimum w punkcie . Obliczając pochodną funkcji (9) i przyrównując ją do 0 , sprawdzamy łatwo, że wartość maksymalna tej funkcji gęstości wynosi :

4.Krzywa gęstości prawdopodobieństwa rozkładu normalnego ma 2 punkty przegięcia, położone symetrycznie względem osi rzędnych , o odciętych , w których krzywa z wklęsłej przechodzi w wypukłą lub odwrotnie.

Parametr rozkładu normalnego jest to średnia rozkładu czyli miara położenia. Mówi o tym , gdzie leży centrum rozkładu na osi liczbowej. Ponieważ krzywa gęstości normalnej jest symetryczna i ma jeden szczyt , w środku ,średnia jest równocześnie medianą i dominantą rozkładu prawdopodobieństwa. Inaczej mówiąc, jest też punktem, w którym gęstość jest największa i który dzieli pole pod krzywą gęstości na połowy, z których każda ma miarę ½.Standardowe odchylenie jest miarą zmienności , czyli rozproszenia zmiennej. Gdy standardowe odchylenie jest duże, wykres funkcji gęstości jest „ szeroki „ , ale za to „ płaski „( Całe pole pod krzywą musi mieć miarę równą 1 ). Gdy standardowe odchylenie jest małe, wykres funkcji gęstości jest „ wąski „ ale „ wysoki „

Na uwagę zasługują także następujące własności rozkładu normalnego :

W analizach szczególnie ważna jest reguła trzech odchyleń standardowych zwana także reguła 3 sigm, której prawdopodobieństwo jest bardzo wysokie i praktycznie wynosi 1. Jest ona wykorzystywana w badaniach empirycznych w celu eliminacji obserwacji nietypowych, nie przystających do pozostałych ( wątpliwych , rzadkich , odstających , ekstremalnych ) , co do których istnieją przypuszczenia , że pochodzą z innej zbiorowości. Za wątpliwe uznaje się takie obserwacje , których wartość różni się od średniej o więcej niż 3 odchylenia standardowe.

Rozkład normalny standaryzowany

Rozkład normalny z wartością oczekiwaną i odchyleniem standardowym , czyli , określony za pomocą formuły :

( 10 )

Każdy rozkład normalny może być transformowany do rozkładu normalnego poprzez procedurę standaryzacji zmiennej X do Z. Czasami zamiast Z stosuje się literę U ( unormowana ). Zmienna losowa standaryzowana wyraża się wzorem :

( 11 )

Procedura standaryzacji ma swoje uzasadnienie w tym, że tylko rozkład normalny standaryzowany jest stablicowany. Najczęściej korzysta się z tablic dystrybuanty .

Przykład 1.

Załóżmy , że mamy 100 pojedynczych wyników pomiarów pewnej wielkości. Efekty obserwacji pogrupowano , a wyniki w postaci szeregu rozdzielczego przedziałowego podano w poniższej tablicy. Zachodzi przypuszczenie , że rozkład liczby wszystkich pomiarów ma rozkład normalny .

Tab.1. Szereg rozdzielczy wyników pomiaru pewnej wielkości ( w mm)

Wyniki pomiarów

Liczba wyników

79-81

1

80

80

81-83

4

82

328

83-85

9

84

756

85-87

15

86

1 290

87-89

24

88

2 112

89-91

21

90

1 890

91-93

13

92

1 196

93-95

9

94

846

95-97

3

96

288

97-99

1

98

98

100

8 884

Źródło : A. Zeliaś : Metody statystyczne . PWE, Warszawa 2000 s. 221-222.

Parametry rozkładu normalnego i szacujemy na podstawie wyników zamieszczonych w powyższej tablicy ( tab.1 ) i otrzymujemy : i . Pozostałe obliczenia potrzebne do ustalenia , czy jest to rozkład normalny, znajdują się w poniższej tablicy :

80

1

-2,73466

0,009606

0.59

0,41

82

4

-2,11596

0,042166

2,61

1,39

84

9

-1,49726

0,129518

8,01

0,99

86

15

-0,87855

0,270864

16,76

-1,76

88

24

-0,25985

0,385683

23,86

0,14

90

21

0,35885

0,373911

23,13

-2,73

92

13

0,97755

0,246809

15,27

-2,27

94

9

1,59625

0,112704

6,97

2,03

96

3

2,21495

0,034710

2,15

0,85

98

1

2,83365

0,007274

0,45

0,55

100

99,8

Z uwagi na to , że różnice między rozkładem empirycznym a teoretycznym , czyli od i= 1,2,...,10 są względnie duże , to nie można przyjąć , że rozkład liczby wyników pomiarów nie jest rozkładem normalnym.