Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Wnioskowanie_statystyczne_wyk_ad.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
135.17 Кб
Скачать

Wnioskowanie statystyczne a statystyka opisowa

Statystyka opisowa oparta jest na indukcji zupełnej, ukazuje metody gromadzenia, opracowania, prezentacji danych wraz z sumarycznym ich opisem przy wykorzystaniu właściwych narzędzi statystycznych.

Statystyka matematyczna (wnioskowanie statystyczne) oparta jest na indukcji niezupełnej.

  • teoria estymacji – metoda estymacji umożliwia szacunek nieznanych parametrów w populacje na podstawie próby.

  • teoria weryfikacji hipotez statystycznych – pozwala na sprawdzenie hipotez o parametrach lub kształcie rozkładu populacji na podstawie wyników z próby.

Wnioskowanie statystyczne to procedura podejmowania decyzji o parametrach i rozkładach w zbiorowości generalnej na podstawie wyników z próby.

Podstawowymi kategoriami stosowanymi w procedurze wnioskowania statystycznego są zmienne losowe i ich rozkłady teoretyczne.

Zdarzenia losowe to takie wyniki uzyskane przez relację danego procesu, które mogą w określonym zespole warunków wystąpić lub nie wystąpić.

Jeżeli każdorazowa realizacja określonego doświadczenia daje to samo zdarzenie A, to zdarzenie to nazywamy zdarzeniem pewnym. Natomiast jeśli każdorazowa realizacja doświadczenia nie daje zdarzenia A, to realizację zdarzenia A uważamy za niemożliwe.

Jeżeli realizacja przypadkowego zdarzenia niekiedy prowadzi do zdarzenia A, a niekiedy nie, nazywamy to zdarzeniem przypadkowym.

Zmienna losowa – w wyniku doświadczenia przyjmuje określoną wartość o zrealizowaniu tego doświadczenia, a nie dającą się przewidzieć przed tym doświadczeniem.

Zmienna losowa może przybierać wartości z przedziału liczb rzeczywistych i to z określonym prawdopodobieństwem.

P(x = xi) = pi <- prawdopodobieństwo

pi – można traktować jako wartość przyjmowaną przez zmienną losową.

Pi = f(xi)

Suma prawdopodobieństwa pi = 1

Zmienne losowe oznaczamy dużymi literami alfabetu np. X, Y, Z. Małymi literami alfabetu oznaczają realizację czyli wartości przybierane przez zmienne losowe zwane realizacjami x, y, z.

Pojęciem związanym ze zmienną losową i jej rozkładu jest pojęcie dystrybuanty.

Dystrybuanta zmiennej losowej to funkcja zmiennej rzeczywistej określona wzorem:

Właściwości dystrybuanty:

  • przyjmuje wartości od 0 do 1

  • funkcja malejąca, tzn. dla x1<x2 zawsze F(x1) ≤ F(x2)

  • funkcja lewostronna ciągła

  • F(-∞) = 0; F(+∞) = 1

Rozkłady empiryczne i teoretyczne zmiennej losowej warunkują przeprowadzenie wnikliwego opisu zbiorowości statystycznej.

Rozkłady empiryczne pochodzą z obserwacji ustalane są na podstawie konkretnych wielkości.

Rozkłady teoretyczne aproksymowane są za pomocą rozkładów probabilistycznych. Rozkład zmiennej losowej może być przedstawiony za pomocą funkcji matematycznej(…)

Najważniejszymi parametrami zmiennej losowej X są:

  • wartość oczekiwana (nadzieja matematyczna) średniej arytmetycznej rozkładu zmiennej X w zbiorowości generalnej

  • wariancja oraz odchylenie standardowe

Zmienna losowa skokowa to taka zmienna, która ma przeliczony i skończony zbiór wartości.

Zmienna losowa ciągła przybiera dowolne wartości z określonego przedziału.

Rozkłady:

  • dla zmiennej losowej skokowej:

- zerojedynkowy

- dwumianowy (Bernoulliego)

- Pojssona

  • dla zmiennej losowej ciągłej:

- normalny Gaussa – Laplace’a

Rozkład zerojedynkowy - jest on rezultatem takiego doświadczenia, którego określone zdarzenie wystąpi lub nie. Zdarzeniem elementarnym realizującym zadanie A jest liczba 1, a nie realizującym zdarzenia A jest liczba 0.

Rozkład dwumianowy – korzystamy z niego, gdy określamy prawdopodobieństwo wystąpienia k razy określonego zdarzenia w n niezależnych doświadczeniach, przy danym prawdopodobieństwie p

Jeśli: p = q rozkład symetryczny

p ≠ q rozkład asymetryczny

- asymetria dodatnia, gdy p < q

- asymetria ujemna, gdy p > q

Jeśli p, q i n dążą jednocześnie do nieskończoności, to rozkład ten przekształca się w rozkład normalny.

Wartość oczekiwana: E(x) = np

σ² (x) = npq

σ (x)

Rozkład Pojssona – szczególny przypadek rozkładu dwumianowego. Wykorzystujemy go, gdy liczba serii doświadczenia jest nieskończona (n → ∞), prawdopodobieństwo p maleje do zera (p→0), a iloczyn np = 2 jest wartością stałą (λ > 0).

gdzie e = 2,718 (podstawa logarytmu naturalnego)

k – liczba realizacji elementów wyróżnionych w doświadczeniu

Rozkład normalny

Zmienna losowa ciągła X ma rozkład normalny, jeśli jej funkcja gęstości prawdopodobieństwa wyraża się wzorem:

gdzie: M = n(x) – wartość oczekiwana

f(x) – funkcja gęstości rozkładu normalnego

Właściwości krzywej funkcji normalnej:

  • krzywa w kształcie dzwonu

  • funkcja ta posiada jedno maksimum i jest ono medianą, średnią arytmetyczną, dominantą rozkłady oraz wartością oczekiwaną

  • pole funkcji f(x) obejmuje zbiór liczb rzeczywistych

  • wewnątrz przedziału od M-σ do M+σ krzywa jest wypukła, a na zewnątrz jest wklęsła

  • krzywa ma dwa punkty przegięcia, a współrzędnych M-σ oraz M+σ

  • lewe i prawe ramię zbliża się asymptotycznie do osi odciętych, ale jej nie przecinają.

Reguła trzech sigm – przyjmuje ona jako bliskie 1 prawdopodobieństwo, że realizacja zmiennej losowej ciągłej nie będzie różniła się od wartości oczekiwanej więcej aniżeli o trzy odchylenia standardowe.

Zmienna standaryzowana – to duża litera ”U”, a realizacja – to mała litera ”u”.

Estymacja (szacowanie) – polega na tym, że na podstawie niekompletnych danych ze zbioru pochodzących z próby, wnioskuje się o wartościach liczbowych zbioru, a otrzymane w ten sposób wnioski służą do podejmowania decyzji.

Metody estymacji:

  • estymacja punktowa

  • estymacja przedziałowa

Estymacja punktowa oblicza pojedynczą liczbę dla każdego nieznanego parametru, np.:

- estymatorem średniej arytmetycznej jest średnia arytmetyczna z próby,

- estymatorem wariancji populacji generalnej jest wariancja z próby.

Estymacja przedziałowa polega na szacunku parametru w postaci takiego przedziału zwanego przedziałem ufności, który z dużym prawdopodobieństwem obejmuje prawdziwą wartość parametru.

Właściwości dobrego estymatora:

  • nieobciążony – estymator jest nie obciążony, gdy wartość estymatora jest równa parametrowi z próby.

  • zgodność z prawem wielkich liczb – prawdopodobieństwo, że estymator jest zgodny z prawem wielkich liczb, z wielkością liczebności próby. Wówczas estymator będzie przyjmował wartości bliskie parametru. Ryzyko popełnienia błędu jest niewielkie.

  • efektywny - posiadać powinien możliwie małą wariancję.

Każdy estymator jest zmienną losową mającą określony rozkład prawdopodobieństwa.

Przedział ufności dla średniej arytmetycznej:

Model 1

Jeśli populacja generalna ma rozkład normalny N(m, σ), ze znanym odchyleniem standardowym σ, z populacji pobrano próbę N elementową i przy takich założeniach dla średniej m przy współczynniku ufności 1 – ά ma postać:

x – średnia arytmetyczna obliczana na podstawie próby

uά – wartość zmiennej losowej mającej rozkład normalny standaryzowany

σ – znane odchylenia standardowe populacji generalnej

n – liczebność próby

m – średnia populacji generalnej

1- ά– prawdopodobieństwo przyjęte z góry, nazwane współczynnikiem ufności.

Współczynnik ten przyjmuje się subiektywnie jako dowolnie duże, blisko jedności prawdopodobieństwo. Jest miarą zaufania dla przeprowadzonego szacunku.

Najczęściej stosowane współczynniki ufności:

0,90 → uά = 1,64 Przykładowo współczynnik ufności 0,95 oznacza, że pragniemy

0,95 → uά = 1,96 by w 95 przypadkach na 100 estymowany parametr mieścił się

0,99 → uά = 2,58 w oszacowanym przez nas przedziale.

Długość przedziału ufności przy danej liczebności n zależy od przyjętego współczynnika ufności 1-ά. Wraz ze wzrostem współczynnika 1-ά, długość przedziału rośnie. Im większy jest przedział, tym większą mamy pewność że średnia mieści się w podanych granicach, a to z kolei oznacza, że przeprowadzony szacunek jest mniej dokładny.

Przyjmując wąski przedział mniejsza jest realność, że znajdzie się w przedziale, ale szacunek jest bardziej dokładny.

Ocenę precyzji szacowanego parametru m można ustalić za pomocą zależności:

Jeśli:

B(x) ≤ 5% - duża precyzja szacunku

5% < B(x) ≤ 10% - dostateczna precyzja szacunku

B(x) > 10% - niedostateczna precyzja szacunku, nie należy wnioskować o parametrze

Model 2

Populacja generalna ma rozkład normalny, gdzie nie znamy ani średniej arytmetycznej, ani odchylenie standardowego populacji. Z populacji tej pobrano małą próbę (≤ 30). W oparciu o wyniki tej próby, przedział ufności dla średniej budujemy:

tά - wartość statystyki z rozkładu t-Studenta dla n-1 stopnia swobody, przy poziomie istotności ά.

Liczba stopni swobody to liczba niezależnych obserwacji niezbędnych do oszacowania nieznanego parametru populacji generalnej.

Ocena względnej precyzji oszacowania modelu:

Model 3

Populacja generalna ma rozkład normalny, lub dowolnie inny. Nie znamy ani średniej arytmetycznej ani odchylenia standardowego populacji. Z populacji tej pobieramy dużą próbę.

s(x) – odchylenie standardowe z próby

Ocena względnej precyzji oszacowania modelu:

m – średnia populacji generalnej

`x – średnia populacji generalnej z próby

σ – odchylenie standardowe w populacji generalnej

s(x) – odchylenie standardowe obliczane na podstawie próby.

Zadanie 1

W pewnym mieście postanowiono zbadać miesięczne zużycie wody (w m³) przez mieszkańców. W celu tym z populacji tej wylosowano 81 mieszkań i otrzymano średnie miesięczne zużycie wody 11,25m³. Dotychczasowe badania wykazują, że rozkład zużycia wody przez mieszkańców jest normalny z odchyleniem standardowym (σ) wynoszącym 3,10m³. Przyjmując współczynnik ufności 0,90 oszacować metodą przedziałową średnie zużycie wody przez mieszkańców tego miasta oraz ocenić precyzję dokonanego szacunku (wartość odpowiedniej statystyki 1,64).

P

3,10

√81

3,10

√81

= {11,25 – 1,64 < m < 11,25 + 1,64 }

10,69 < m < 11,81

Przedział liczbowy o końcach 10,69 i 11.81 obejmuje z prawdopodobieństwem 0,90 nieznane średnie zużycie wody w m³, przez mieszkańców badanego miasta.

1,64 * 3,1

11,25 * √81

B (`x) = * 100

B(`x) = 5%

Błąd względny szacunku wynosi 5%, co oznacza dobrą precyzję oszacowania i dopuszcza do wnioskowania na podstawie próby.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]