
- •Rodzaje badań statystycznych
- •Szeregi statystyczne
- •Szereg szczegółowy ważony
- •Szereg rozdzielczy
- •Rachunek prawdopodobieństwa
- •Rozkład prawdopodobieństwa skokowej zmiennej losowej X spełnia następujące warunki
- •Oczekiwana wartość I odchylenie standardowe zmiennej losowej
- •Wariancja I odchylenie standardowe zmiennej losowej
- •Twierdzenie Czebyszewa
- •Wybrane rozkłady zmiennej losowej skokowej
- •Rozkład jednopunktowy
- •Rozkład dwupunktowy
- •Rozkład dwumianowy
- •Średnia, wariancja I kształt rozkładu dwumianowego
- •Rozkład Poissona
- •Zmienna losowa ciągła I jej rozkłady
- •Rozkłady zmiennej losowej ciągłej
- •Rozkład chi – kwadrat
- •Rozkład t – Studenta
- •Rozkład f – Snedecora
- •Estymacja punktowa I przedziałowa
- •Pobieranie próby losowej
- •Trzy główne aspekty centralnego twierdzenia granicznego
- •Estymatory I ich własności
- •Estymacja przedziałowa parametrów
- •Weryfikacja hipotez statystycznych
- •Hipotezy alternatywne mogą być sformułowane względem hipotezy zerowej
- •Weryfikacja hipotez statystycznych Podstawowe pojęcia
- •Test dla dwóch średnich
- •Test dla wariancji
- •Test dla dwóch wariancji
- •Test dla wskaźnika struktury
- •Test dla dwóch wskaźników struktury
- •Parametryczne testy istotności – Przykłady
- •Testy nieparametryczne
- •Test zgodności - Kołmogorowa
- •Analiza korelacji I regresji .
- •Wyniki obserwacji pogrupowano I zamieszczono w poniższej tablicy
Trzy główne aspekty centralnego twierdzenia granicznego
Jeżeli liczebność próby jest dostatecznie duża , to rozkład średniej z próby , , jest normalny
Oczekiwaną wartością średniej jest
Odchyleniem standardowym średniej jest
Historia centralnego twierdzenia granicznego jest związana z rozkładem normalnym jako rozkładem granicznym rozkładu dwumianowego, gdy n rośnie nieograniczenie.
Aby wykorzystać centralne twierdzenie graniczne, powinniśmy znać standardowe odchylenie w populacji, . Gdy nie jest znane, trzeba się posłużyć jego estymatorem z próby , S. W takim przypadku rozkład standaryzowanej statystyki jest następujący :
(
2 )
gdzie S zastępuje nieznane i nie jest standaryzownym rozkładem normalnym.
Jeśli rozkład w populacji jest normalny, to statystyka określona wzorem ( 2 ) ma rozkład t – Studenta o n-1 stopniach swobody .
Centralne twierdzenie graniczne dla przypadku pobierania próby do oszacowania frakcji elementów danej kategorii populacji , p jest sformułowane następująco :
Gdy
liczebność próby n wzrasta , to rozkład frakcji z próby ,
,
zbliża się do rozkładu normalnego o średniej p o odchyleniu
standardowym
Z centralnego twierdzenia granicznego wynika , iż rozkład średniej z próby i rozkład frakcji z próby zbliżają się do rozkładu normalnego , gdy wzrasta liczebność próby .
Estymatory I ich własności
Estymator jest nieobciążony , jeżeli jego wartość oczekiwana jest równa parametrowi populacji , do oszacowania którego służy. Np. Średnia z próby jest nieobciążonym estymatorem średniej z populacji .
Systematyczne odchylanie się wartości estymatora od szacowanego parametru nazywa się obciążeniem estymatora .
Estymator jest efektywny , jeżeli ma niewielką wariancję ( a tym samym niewielkie odchylenie standardowe )
Estymator jest zgodny , jeżeli prawdopodobieństwo , że jego wartość będzie bliska wartości szacowanego parametru , wzrasta wraz ze wzrostem liczebności próby .
Estymator jest dostateczny , jeżeli wykorzystuje wszystkie informacje o szacowanym parametrze , które są zawarte w danych ( w próbie )
Przykład 1.
W wylosowanych 9 punktach sprzedaży w pewnym mieście w określonym dniu zbadano cenę produktu A i otrzymano następujące rezultaty :
Punkt sprzedaży |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
Cena w zł za 1 szt. ( xi) |
1,15 |
1,18 |
1,16 |
1,20 |
1,12 |
1,19 |
1,17 |
1,15 |
1,14 |
Źródło : Dane umowne.
Korzystając z procedury estymacji punktowej , należy oszacować
przeciętną cenę produktu A za 1 szt. W określonym dniu w całej zbiorowości ( miasto )
odchylenie standardowe ceny produktu A w określonym dniu w badanym mieście
Ad
1. Wiedząc ,że estymacja punktowa sprowadza się do znalezienia
jednej wartości mogącej służyć do oszacowania nieznanej średniej
ceny produktu A w całym mieście zadanie sprowadza się do
znalezienia średniej arytmetycznej na podstawie próby (
.
Miara ta jest najbardziej użytecznym estymatorem średniej
zbiorowości generalnej , gdyż ma własność nieobciążoności i
zgodności oraz jest relatywnie bardziej efektywna od innych
średnich ( mediany czy dominanty )
,
co oznacza ,że w badanym mieście średnia cena jednej sztuki
produktu A wynosi 1,16 zl.
Ad.2. Zadanie sprowadza się , do obliczenia odchylenia standardowego ceny produktu na podstawie wyników próby
xi |
1,15 |
1,18 |
1,16 |
1,20 |
1,20 |
1,19 |
1,17 |
1,15 |
1,14 |
|
|
-0,01 |
0,02 |
0,00 |
0,04 |
-0,04 |
0,03 |
0,01 |
-0,01 |
-0,02 |
|
|
0.0001 |
0,0004 |
0,0000 |
0,0016 |
0,0016 |
0,0009 |
0,0001 |
0,0001 |
0,0004 |
0.0052 |
Źródło : Obliczenia własne
zł
Należy zauważyć , że wzór na estymator S różni się od klasycznego wzoru na odchylenie standardowe , które wyznacza się w całej zbiorowości ( lub na podstawie wyników pochodzących z dużej próby ) według formuły :
Odchylenie
standardowe ceny produktu A w badanym mieście wynosiło 0,025 zł .
Oznacza to , że cena w poszczególnych punktach sprzedaży różniła
się od średniego poziomu , przeciętnie rzecz biorąc , o
zł.
Przykład 2.
W pewnej firmie w sposób losowy wybrano 15 rozmów telefonicznych, zbadano długość ich trwania oraz ustalono , czy są to rozmowy lokalne czy też zamiejscowe . Poniższa tablica prezentuje zebrane na ten temat informacje :
Kolejny numer rozmowy |
Czas trwania ( w min ) |
Rodzaj rozmów telefonicznej |
1 |
2 |
miejscowa |
2 |
12 |
zamiejscowa |
3 |
10 |
miejscowa |
4 |
3 |
miejscowa |
5 |
5 |
zamiejscowa |
6 |
6 |
miejscowa |
7 |
3 |
miejscowa |
8 |
5 |
miejscowa |
9 |
8 |
miejscowa |
10 |
4 |
miejscowa |
11 |
5 |
miejscowa |
12 |
4 |
miejscowa |
13 |
5 |
miejscowa |
14 |
4 |
miejscowa |
15 |
9 |
zamiejscowa |
Należy :
Oszacować przeciętny czas trwania wszystkich rozmów telefonicznych w tej firmie
Oszacować odchylenie standardowe czasu trwania wszystkich rozmów telefonicznych w tej firmie
Oszacować odsetek ( procent ) rozmów zamiejscowych wśród ogółu rozmów telefonicznych przeprowadzonych w tej firmie
Wyznaczyć błąd standardowy odsetka rozmów zamiejscowych wśród ogółu rozmów telefonicznych przeprowadzonych w tej firmie
Ad.1.
, co oznacza że przeciętny czas trwania wszystkich rozmów
telefonicznych w tej firmie wynosi 5,67 min.
Ad.2.
,
co oznacza , że odchylenie standardowe czasu
trwania wszystkich rozmów telefonicznych w tej firmie wynosi 2,85 min ( o tyle różni się , średnio biorąc , czas trwania poszczególnych rozmów od przeciętnej rozmowy ).
Ad.3.
,
co oznacza ,że rozmowy zamiejscowe stanowią 20 % ogółu wszystkich
rozmów telefonicznych przeprowadzonych w tej firmie.
Ad.4.
Błąd standardowy odsetka rozmów zamiejscowych w tej firmie wynosi 10,3 %.