Test dla jednej średniej to najpopularniejsze zadanie na kolokwiach i egzaminach z działu wnioskowanie statystyczne.

Mamy do wyboru 3 modele:

Model 1 (rozkład normalny, znana wariancja)

  • $X$ – zmienna losowa o rozkładzie normalnym $N(m,\sigma)$,
  • wartość oczekiwana $m=EX$ nie jest znana,
  • wariancja $\sigma^{2}=D^{2}X$ jest znana.
Statystyka
$$U = \frac{\overline{X}-m_{0}}{\sigma} \cdot \sqrt{n}$$ ma rozkład $N(0,1)$ przy założeniu prawdziwości hipotezy zerowej $H_{0}:m=m_{0}$.

Hipoteza

Obszar krytyczny

zerowa

alternatywna

$$H_{0}: m = m_{0}$$

$$H_{1}: m \neq m_{0}$$

$$(-\infty;-U_{1-\frac{\alpha}{2}}>$$ $$\cup <U_{1-\frac{\alpha}{2}};\infty)$$

$$H_{1}: m < m_{0}$$ $$(-\infty;-U_{1-{\alpha}}>$$
$$H_{1}: m > m_{0}$$ $$<U_{1-\alpha};\infty)$$

Model 2 (rozkład normalny, parametry nieznane)

  • $X$ – zmienna losowa o rozkładzie normalnym $N(m,\sigma)$,
  • parametry $m$ i $\sigma$ nie są znane
Statystyka
$$t = \frac{\overline{X}-m_{0}}{S} \cdot \sqrt{n-1}$$ma rozkład Studenta z $n-1$ stopniami swobody przy założeniu, że prawdziwa jest hipoteza zerowa $H_{0}:m=m_{0}$.

 

Hipoteza

Obszar krytyczny

zerowa

alternatywna

$$H_{0}: m = m_{0}$$

$$H_{1}: m \neq m_{0}$$

$$(-\infty;-t_{1-\frac{\alpha}{2},n-1}> $$$$\cup <t_{1-\frac{\alpha}{2},n-1};\infty)$$

$$H_{1}: m < m_{0}$$

$$(-\infty;-t_{1-\alpha,n-1}>$$

$$H_{1}: m > m_{0}$$

$$<t_{1-\alpha,n-1};\infty)$$

Model 3 (rozkład nieznany, duża próba $n \geq 30$)

W rezultacie do weryfikacji hipotez stosujemy statystykę

$$U = \frac{\overline{X}-m_{0}}{S} \cdot \sqrt{n}$$

przy założeniu, że  prawdziwa jest  hipoteza zerowa $H_{0}:m=m_{0}$.

Hipoteza

Obszar krytyczny

zerowa

alternatywna

$$H_{0}: m = m_{0}$$

$$H_{1}: m \neq m_{0}$$

$$(-\infty;-U_{1-\frac{\alpha}{2}}>$$ $$\cup <U_{1-\frac{\alpha}{2}};\infty)$$

$$H_{1}: m < m_{0}$$ $$(-\infty;-U_{1-\alpha}>$$
$$H_{1}: m > m_{0}$$ $$<U_{1-\alpha};\infty)$$

Schemat rozwiązania jest następujący:

Krok 1:

  • Wypisujemy wszystkie dane (potrzebne do policzenia statystyki testowej – może się okazać że dostaniemy jedynie szereg i np. średnią i wariancję musimy policzyć samemu).
  • Zapisujemy poziom istotności $\alpha$.
  • Wybieramy model i zapisujemy hipotezę zerową i alternatywną. Hipoteza alternatywna może być w postaci <>, więc trzeba zwracać uwagę na polecenie.

 

Krok 2:

  • Zgodnie z wybranym modelem w kroku 1 zapisujemy wzór statystyki testowej a następnie podstawiamy dane i obliczamy ją.

 

Krok 3:

  • Wyznaczamy wartość krytyczną i obszar krytyczny testu.
  • Na tym etapie będziemy musieli odczytać odpowiednią wartość z tablic rozkładu normalnego lub tablic rozkładu t-Studenta
Zwłaszcza w anglojęzycznej literaturze, testy (weryfikacja hipotez) nazywane są np. testem Z lub testem T.
Dla testu Z będziemy używać tablic rozkładu normalnego a dla testu T tablic t-Studenta.

Krok 4:

  • Jeżeli statystyka testowa (z kroku 2) należy do obszaru krytycznego (z kroku 3) to odrzucamy hipotezę zerową i przyjmujemy hipotezę alternatywną.
  • Jeżeli statystyka testowa nie należy do obszaru krytycznego to nie odrzucamy hipotezy zerowej.
  • Na końcu piszemy również wniosek merytoryczny dotyczący treści polecenia.

Przykłady:

1. Hipotezę, że średnio 15 osób robi zakupy w kiosku w ciągu godziny. Na podstawie testu ufności 225 wyliczyliśmy $m=12$, $s^{2} = 16$. Na poziomie istotności $\alpha =0,02$ zweryfikuj … mniejszą ilość kupujących. Populacja ma rozkład normalny.
Ustalamy hipotezę zerową i alternatywną:
$$H_{0}: m = 15$$ $$H_{1}: m < 15$$
Dane mamy dla $n=225$.
Populacja ta ma rozkład normalny oraz znana jest wariancja, więc korzystamy z modelu 1, tzn.:

$$Z = \frac{m-\mu}{s} \cdot \sqrt{n} = \frac{12-15}{4} \cdot \sqrt{225} = -\frac{3}{4} \cdot 15 = -11,25$$

Obliczamy wartość krytyczną dla $\alpha = 0,02$, korzystając z tabelki dla modelu 1 oraz z tablicy rozkładu normalnego:
$$Z_{kryt} = Z_{1-\alpha} = Z_{0,98} = 2,05$$
Zatem:
$$W_{\alpha} = \left(-\infty,-2,05\right) \ni Z$$
Odpowiedź: Obliczona statystyka testowa należy do obszary krytycznego, więc na poziomie istotności 0,02 odrzucamy hipotezę zerową $(H_{0})$ na rzecz hipotezy alternatywną $(H_{1})$. Średnia jest istotnie mniejsza od 15.

2. W zakładzie Z, dla losowo wybranych $n=26$ pracowników, otrzymano:

  • średni wiek $\overline{x} = 38$ lata,
  • $s = 4$ lata.

Na poziomie istotności $\alpha = 0,01$ zweryfikować hipotezę, że przeciętny wiek pracowników w tym zakładzie jest wyższy niż 35 lat?

Niech:
$$H_{0}: m = 35$$ $$H_{1}: m > 35$$
$n=26$. Odchylenie standardowe populacji nie jest znane oraz $n<30$ (mała próba), więc korzystamy z modelu 2.
Zatem:

$$t = \frac{bar{X}-m}{s} \cdot \sqrt{n-1} = \frac{38-35}{4} \cdot \sqrt{26-1} = \frac{3}{4} \cdot 5 = 3,75$$

Obszar krytyczny $<w_{k}; \infty)$, gdzie:
$w_{k}$ – dla t-Studenta o poziomie istotności $1-\alpha = 0,99$ oraz $n-1=25$ stopni swobody mamy:
$$w_{k} = 2,485$$
Stąd:
$$t_{k} = 3,75 \in <2,485,\infty)$$
Odpowiedź: Statystyka opisowa należy do obszaru krytycznego, więc odrzucamy $H_{0}$ na rzecz $H_{1}$. Przeciętny wiek jest większy niż 35 lat.

3. Badamy hipotezę, że średnio 15 osób robi zakupy w kiosku w ciągu godziny. Na podstawie testu ufności 225 wyliczyliśmy $m=12$, $s^{2} = 16$. Na poziomie istotności $\alpha =0,02$ zweryfikuj mniejszą ilość kupujących niż w hipotezie. Populacja ma rozkład normalny.
Ustalamy hipotezę zerową i alternatywną:
$$H_{0}: m = 15$$ $$H_{1}: m < 15$$
Dane mamy dla $n=225$.
Populacja ta ma rozkład normalny oraz znana jest wariancja, więc korzystamy z modelu 3, tzn.:

$$t = \frac{m-\mu}{s} \cdot \sqrt{n} = \frac{12-15}{4} \cdot \sqrt{225} = -\frac{3}{4} \cdot 15 = -11,25$$

Obliczamy wartość krytyczną dla $\alpha = 0,02$, korzystając z tabelki dla modelu 3 oraz z tablicy t-Studenta:
$$t_{kryt} = t_{1-\alpha} = t_{0,98} = 2,05$$
Zatem:
$$W_{\alpha} = \left(-\infty,-2,05\right) \ni Z$$
Odpowiedź: Obliczona statystyka testowa należy do obszary krytycznego, więc na poziomie istotności 0,02 odrzucamy hipotezę zerową $(H_{0})$ na rzecz hipotezy alternatywnej $(H_{1})$. Średnia jest istotnie mniejsza od 15.

4. Dział kontroli w zakładach chemicznych chce oszacować średnią wagę proszku do prania sprzedawanego w pudełkach o nominalnej wadze 3 kg.
W tym celu wylosowano próbę 6 pudełek proszku. Każde pudełko zważono i otrzymano następujące wyniki (w kg): 2,93; 2,97; 3,05; 2,91; 3,02; 2,87.
Wiadomo, że rozkład wagi pudełka z proszkiem jest normalny. Na poziomie istotności 0,01 zweryfikować hipotezę, że średnia waga pudełka jest mniejsza niż 3 kg.

Policzmy na początku średnią i odchylenie standardowe:

$$\overline{x} = \frac{2,93+2,97+3,05+2,91+3,02+2,87}{6} = 2,958$$ $$s = \sqrt{\frac{\sum_{i=1}^{6} (x_{i} – m)^{2}}{6}} = \sqrt{\frac{ (2,93 – 2,958)^{2} + … +(2,87 –  2,958)^{2}}{6}} = 0,0623$$

Ustalamy hipotezę zerową i alternatywną:
$$H_{0}: m = 3$$ $$H_{1}: m < 3$$
Dane mamy dla $n=6$.

Skorzystajmy z modelu 3, czyli:

$$t = \frac{m-\mu}{s} \cdot \sqrt{n} = \frac{2,958-3}{0,0623} \cdot \sqrt{6} = \frac{-0,042}{0,0623} \cdot \sqrt{6} = -1,683$$

Otrzymując z tablicy t-Studenta otrzymujemy:

$$t_{kryt}=(1-\alpha;n-1) = (0,99;5) = 3,365$$

Obszarem krytycznym jest przedział:
$$(-\infty;3,365> \notin t$$
Odpowiedź: Statystyka opisowa nie należy do obszaru krytycznego, więc nie ma podstaw do odrzucenia $H_{0}$. Średnia waga nie jest mniejsza niż 3 kg.

6+