Postaram się w tym wpisie w najprostszy możliwy sposób opisać schemat rozwiązywania zadań z hipotezami.
Z hipotez najczęściej pojawiają się na egzaminach i kolokwiach:
Parametryczne:
- .
- Hipoteza dla wartości średniej
- Hipoteza dla wariancji (lub odchylenia standardowego)
- Hipoteza dla odsetka (frakcji / procentu / proporcji / wskaźnika struktury)
- Hipoteza dla dwóch średnich
- Hipoteza dla dwóch proporcji (rzadko)
- Hipoteza dla dwóch wariancji (rzadko)
- ANOVA
Nieparametryczne:
- Test niezależnosci Chi-kwadrat
- Test Chi-kwadrat (zgodności)
- Test normalności (np. Kołmogorowa Smirnofa lub Shapiro Wilka )
- Test serii (rzadko)
I dodatkowo: test istotności współczynnika korelacji, który omówiłem przy okazji korelacji.
Schemat rozwiązywania jest prosty i jeżeli zrozumie się ogólne zasady to rozwiązywanie tych zadań jest bardzo proste. Na kolokwiach i egzaminach najczęściej podawane sa karty wzorów z konkretnymi formułami do wymienionych wyżej hipotez.
Krok 1:
Wypisujemy wszystkie dane (potrzebne do policzenia statystyki testowej – może się okazać że dostaniemy jedynie szereg i np. Średnią i wariancję musimy policzyć samemu).
Zapisujemy poziom istotności $/alfa$
Wybieramy test i zapisujemy hipotezę zerową i alternatywną. W testach parametrycznych hipoteza alternatywna może być z kilku różnych postaciach, więc trzeba zwracać uwagę na polecenie.
Krok 2:
Zgodnie z wybranym testem w kroku 1) zapisujemy wzór statystyki testowej a następnie podstawiamy dane i obliczamy ją.
Krok 3:
Wyznaczamy wartość krytyczną i obszar krytyczny testu.
Na tym etapie najprawdopodobniej będziemy musieli odczytać odpowiednią wartość jednej z tablic:
- Tablic rozkładu normalnego
- Tablic rozkładu t-Studenta
- Tablic chi-kwadrat
Krok 4:
Jeżeli statystyka testowa (z kroku 2) należy do obszaru krytycznego (z kroku 3) to odrzucamy hipotezę zerową i przyjmujemy hipotezę alternatywną.
Jeżeli statystyka testowa nie należy do obszaru krytycznego to nie odrzucamy hipotezy zerowej.
Na końcu piszemy również wniosek merytoryczny dotyczący treści polecenia.
Przykład hipotezy dla średniej
Wypisujemy dane:
n = 26
$\overline{x}$ = 38
s = 4 lata
Poziom istoności:
$\alpha$ = 0.01
Wybieramy test i wypisujemy hipotezy.
Pada fraza “zweryfikować hipotezę, że przeciętny wiek pracowników” a więc chodzi o test dla średniej.
Hipoteza zerowa:
$\mu=35$
Hipoteza zerowa w testach parametrycznych to zawsze “równa się”.
Hipoteza alternatywna:
$\mu > 35$
W treści widzimy “zweryfikowac hipotezę, że przeciętny wiek pracowników jest większy niż 35”, a więc postać hipotezy alternatywnej średnia większa od 35.Krok 2:
Wybieramy odpowiedni wzór statystyki testowej. Ponieważ korzystamy z testu dla średniej, mamy 3 modele. Próba jest mała n<30, więc wybierzemy model 2.
$t=\frac{m- \mu}{s} \cdot \sqrt{n-1} $$= \frac{38-35}{4} \cdot \sqrt{26-1} = 3.75$
Statystyka testowa wynosi 3.75
Ponieważ hipoteza alternatywna jest prawostronna to obszar krytyczny też będzie prawostronny.
Korzystamy z testu T, a więc wartość krytyczną będziemy odczytywać z tablicy rozkładu
t-Studenta.
N=26 oraz alfa=0.01 więc odczytamy wartość dla $\bf \alpha=0.01$,
alternatywnie dla $\bf 1 – \alpha = 0.99$ i n – 1 = 25 stopni swobody.
obszar krytyczny należy do $<w_k; +\infty>$
$w_k$ – dla t-Studenta (1 – $\alpha$ = 0.99, $\alpha$t = 25)
Wartość krytyczna wynosi $w_k = 2.485$.
Obszar krytyczny ma postać:
K= <2.485; +$\infty$)
Krok 4:
t = 3.75 $\in$ <2.485; +$\infty$)
Statystyka testowa należy do obszaru krytycznego, więc odrzucamy $H_0$ na rzecz $H_1$.
Wniosek merytoryczny:
Przeciętny wynik jest większy niż 35 lat.