Postaram się w tym wpisie w najprostszy możliwy sposób opisać schemat rozwiązywania zadań z hipotezami.

Z hipotez najczęściej pojawiają się na egzaminach i kolokwiach:

Parametryczne:

 

Nieparametryczne:

I dodatkowo: test istotności współczynnika korelacji, który omówiłem przy okazji korelacji.

Schemat rozwiązywania jest prosty i jeżeli zrozumie się ogólne zasady to rozwiązywanie tych zadań jest bardzo proste. Na kolokwiach i egzaminach najczęściej podawane sa karty wzorów z konkretnymi formułami do wymienionych wyżej hipotez.

Krok 1:
Wypisujemy wszystkie dane (potrzebne do policzenia statystyki testowej – może się okazać że dostaniemy jedynie szereg i np. Średnią i wariancję musimy policzyć samemu).
Zapisujemy poziom istotności $/alfa$

Wybieramy test i zapisujemy hipotezę zerową i alternatywną. W testach parametrycznych hipoteza alternatywna może być z kilku różnych postaciach, więc trzeba zwracać uwagę na polecenie.

Krok 2:
Zgodnie z wybranym testem w kroku 1) zapisujemy wzór statystyki testowej a następnie podstawiamy dane i obliczamy ją.

Krok 3:
Wyznaczamy wartość krytyczną i obszar krytyczny testu.

Na tym etapie najprawdopodobniej będziemy musieli odczytać odpowiednią wartość jednej z tablic:

Zwłaszcza w anglojęzycznej literaturze, testy (weryfikacja hipotez) nazywane są np. testem Z lub testem T. Dla testu Z będziemy używać tablic rozkładu normalnego a dla testu T tablic t-Studenta.

Krok 4:
Jeżeli statystyka testowa (z kroku 2) należy do obszaru krytycznego (z kroku 3) to odrzucamy hipotezę zerową i przyjmujemy hipotezę alternatywną.

Jeżeli statystyka testowa nie należy do obszaru krytycznego to nie odrzucamy hipotezy zerowej.

Na końcu piszemy również wniosek merytoryczny dotyczący treści polecenia.

Przykład hipotezy dla średniej

Przykład: W zakładzie Z, dla losowo wybranych n = 26 pracowników, otrzymano: średni wiek $\overline{x}$ = 38 lat, a s = 4 lata. Na poziomie istotności $\alpha$ = 0.01 zweryfikować hipotezę, że przeciętny wiek pracowników w tym zakładzie jest wyższy niż 35 lat?
Krok 1:
Wypisujemy dane:
n = 26
$\overline{x}$ = 38
s = 4 lata
Poziom istoności:
$\alpha$ = 0.01

Wybieramy test i wypisujemy hipotezy.

Pada fraza “zweryfikować hipotezę, że przeciętny wiek pracowników” a więc chodzi o test dla średniej.

Hipoteza zerowa:
$\mu=35$
Hipoteza zerowa w testach parametrycznych to zawsze “równa się”.

Hipoteza alternatywna:
$\mu > 35$
W treści widzimy “zweryfikowac hipotezę, że przeciętny wiek pracowników jest większy niż 35”, a więc postać hipotezy alternatywnej średnia większa od 35.Krok 2:
Wybieramy odpowiedni wzór statystyki testowej. Ponieważ korzystamy z testu dla średniej, mamy 3 modele. Próba jest mała n<30, więc wybierzemy model 2.
$t=\frac{m- \mu}{s} \cdot \sqrt{n-1} $$= \frac{38-35}{4} \cdot \sqrt{26-1} = 3.75$
Statystyka testowa wynosi 3.75
Krok 3:
Ponieważ hipoteza alternatywna jest prawostronna to obszar krytyczny też będzie prawostronny.
Korzystamy z testu T, a więc wartość krytyczną będziemy odczytywać z tablicy rozkładu
t-Studenta.
N=26 oraz alfa=0.01 więc odczytamy wartość dla $\bf \alpha=0.01$,
alternatywnie dla $\bf 1 – \alpha = 0.99$ i n – 1 = 25 stopni swobody.
obszar krytyczny należy do $<w_k; +\infty>$
$w_k$ – dla t-Studenta (1 – $\alpha$ = 0.99, $\alpha$t = 25)
Wartość krytyczna wynosi $w_k = 2.485$.
Obszar krytyczny ma postać:
K= <2.485; +$\infty$)

Krok 4:

t = 3.75 $\in$ <2.485; +$\infty$)
Statystyka testowa należy do obszaru krytycznego, więc odrzucamy $H_0$ na rzecz $H_1$.

Wniosek merytoryczny:
Przeciętny wynik jest większy niż 35 lat.
2+