Podobnie jak w teście dla średniej w teście dla dwóch średnich mamy 3 modele.

Uwaga: Spośród wszystkich testów hipotez, test dla dwóch średnich (w mojej opinii) różni się najmocniej wzorami na różnych uczelniach i w różnych książkach. Zwróć więc uwagę na wzory, jakie stosuje się na Twojej uczelni.

Próby niezależne – np. kobiety i mężczyźni, mieszkańcy miasta A i miasta B.
Próby zależne – najczęściej „przed i po”, np. ciśnienie przed i po wzięciu leku – badanie dotyczy tej samej próbki, ale w dwóch momentach czasu.

Model 1

Próby niezależne, znane odchylenia standardowe populacji lub duże próby.
$$\LARGE{u_{obl}=\frac{\overline{x}_{1}-\overline{x}_{2}}{\sqrt{\left (\frac{s_{1}^{2}}{n_{1}}+\frac{s_{2}^{2}}{n_{2}}\right)}}}$$
Obszar krytyczny znajdujemy z tablic rozkładu normalnego.

Model 2

Próby niezależne, nieznane odchylenie standardowe populacji i małe próby.
$$\LARGE{t=\frac{\overline{x}_{1}-\overline{x}_{2}}{\sqrt{\frac{n_{1}\cdot s_{1}^{2}+n_{2}\cdot s_{2}^{2}}{n_{1}+n_{2}-2}\left(\frac{1}{n_{1}}+\frac{1}{n_{2}}\right)}}}$$
Obszar krytyczny znajdujemy z tablic rozkładu t-Studenta dla $n_{1}+n_{2}-2$ stopni swobody.

Model 3

Próby zależne (inaczej: test dla różnicy średnich).
Testujemy hipotezę $H_{0}:\mu_{z}=0$, gdzie $\mu_{z}$ to średnia różnic (czyli testujemy hipotezę, że różnica między badanymi próbkami jest równa 0).
$$\LARGE{t=\frac{\overline{z}}{s_{z}}\sqrt{n-1}}$$
Obszar krytyczny znajdujemy z tablic rozkładu t-Studenta dla $n-1$ stopni.

Przykład – model 1

Badano wielkość plonu z hektara dla upraw gruszek gatunku „A” i gatunku „B”. Zmierzono wielkość plonu z dziesięciu 1-hektarowych pół obsianych gatunkiem „A” i z 10 obsianych gatunkiem „B”. Otrzymano dla gatunku „A” średnią wartość plonu $\overline{x}_{1}=6,65$, a dla gatunku „B” $\overline{x}_{2}=6,36$. Wiadomo, że wariancja pomiaru wynosi dla gatunku „A” $\sigma_{1}^{2}=0,05$, a dla gatunku „B” $\sigma_{2}^{2}=0,06$. Zakładamy, że wielkość plonu z hektara ma rozkład normalny. Na poziomie istotności $\alpha=0,05$ zweryfikować hipotezę, że wartości przeciętne plonu z hektara są dla obu gatunków jednakowe wobec hipotezy alternatywnej mówiącej, że są różne.
Rozwiązanie: Mamy następujące dane:
$$n_{1}=10 \hspace{1 cm} n_{2}=10$$
$$\overline{x}_{1}=6,65 \hspace{1cm} \overline{x}_{2}=6,36$$
$$\sigma_{1}^{2}=0,05 \hspace{1cm} \sigma_{2}^{2}=0,06$$
$$\alpha=0,05$$
Test istotności dla 2 średnich:
$$H_{0}:\overline{x}_{1}=\overline{x}_{2}$$
$$H_{1}:\overline{x}_{1}\neq\overline{x}_{2}$$
Odchylenia są znane, zatem statystyka testowa ma postać:
$$u=\frac{\overline{x}_{1}-\overline{x}_{2}}{\sqrt{\frac{\sigma_{1}^{2}}{n_{1}}+\frac{\sigma_{2}^{2}}{n_{2}}}}=\frac{6,65-6,36}{\sqrt{\frac{0,05}{10}+\frac{0,06}{10}}}=2,765$$
$u$ ma rozkład normalny, test obustronny:
$$1-\frac{\alpha}{2}=0,975$$
$$u_{1-\frac{\alpha}{2}}=u_{0,975}=1,96$$
Obszar krytyczny testu:
$$(-\infty;-1,96\rangle \cup \langle 1,96;+\infty)$$
$u$ jest w obszarze krytycznym, odrzucamy hipotezę zerową na rzecz hipotezy alternatywnej, wielkość plonu między gatunkami „A” i „B” różni się istotnie statystycznie.

Przykład – model 2

Zbadano dwie partie próbek 100 gramowych wątroby ze względu na zawartość węglowodanów. Zawartości węglowodanów dla I partii próbek (w g) były następujące: 15; 17; 16; 17; 18,5; 18; 17,5. Dla II partii liczącej $n=10$ próbek średnia zawartość węglowodanów wynosi $\overline{x}=15,5$ g i odchylenie standardowe $s=1,1$ g. Na poziomie istotności $\alpha=0,05$ zweryfikować hipotezę, że badane partie próbek pochodzą z populacji generalnych o tej samej średniej zawartości węglowodanów.

Rozwiązanie: Mamy małe próby (liczebności 7 i 10) oraz nie są podaje w poleceniu odchylenia standardowe populacji, więc stosujemy model 2.

Zgodnie z treścią zadania stawiamy hipotezę, że średnie zawartości węglowodanów w próbkach 100 gramowych wątroby w obu partiach są jednakowe, tzn. stawiamy hipotezę zerową $H_{0}:m_{1}=m_{2}$. Mamy dwie populacje generalne związane z różnymi partiami próbek 100 gramowych wątroby. Próby w populacjach generalnych mają obliczone parametry.
I partia:
$$n_{1}=7 \hspace{1cm} \overline{x}_{1}=17 \hspace{1cm} s_{1}=1,102$$
II partia:
$$n_{2}=10 \hspace{1cm} \overline{x}_{2}=15,5 \hspace{1cm} s_{2}=1,1$$
Indeksy przy podstawowych parametrach dotyczą numeru populacji a z tym związanych numeru próby. Aby odpowiedzieć na postawione pytanie wybieramy hipotezę alternatywną pierwszą tzn. $H_{1}:m_{1}\neq m_{2}$.

Krok 1:
$H_{0}:m_{1}=m_{2}$, tzn. średnie zawartości węglowodanów są takie same.
$\alpha=0,05$
$H_{1}:m_{1}\neq m_{2}$, tzn. średnie zawartości węglowodanów są różne.
Krok 2:
$$t=\frac{\overline{x}_{1}-\overline{x}_{2}}{\sqrt{\frac{n_{1}\cdot s_{1}^{2}+n_{2}\cdot s_{2}^{2}}{n_{1}+n_{2}-2}\left(\frac{1}{n_{1}}+\frac{1}{n_{2}}\right)}}$$
statystyka t-Studenta o $n_{1}+n_{2}+2$ stopniach swobody, tzn. wybraliśmy model 2 z grupy modeli testów istotności dla dwóch średnich.

Następnie obliczamy wartość statystyki z uzyskanej próby.
$$t_{0}=\frac{17-15,5}{\sqrt{\frac{7\cdot (1,102)^2+10\cdot (1,1)^{2}}{7+10-2}\left(\frac{1}{7}+\frac{1}{10}\right)}}=2,5975$$
Krok 3:
Z informacji w modelu wynika, że dla hipotezy alternatywnej pierwszej, obszar krytyczny ma wzór
$$K=(-\infty;-t_{\alpha,n_{1}+n_{2}-2})\cup (t_{\alpha,n_{1}+n_{2}-2};+\infty)$$
Ponieważ statystyka testowa ma rozkład t-Studenta z tablic tego rozkładu odczytujemy
$$t_{\alpha,n_{1}+n_{2}-2}=t_{0,05;15}=2,131$$
a więc zbiór krytyczny ma postać
$$K=(-\infty;-2,131)\cup (2,131;+\infty)$$
Krok 4:
Wartość statystyki $t_{0}=2,5975$ należy do obszaru krytycznego $K=(-\infty;-2,131)\cup (2,131;+\infty)$.tzn. $t_{0}\in K$.

Decyzja: hipotezę zerową odrzucamy na korzyść hipotezy alternatywnej i twierdzimy z prawdopodobieństwem przynajmniej 0,95, że hipoteza alternatywna jest prawdziwa.

A więc twierdzimy z prawdopodobieństwem przynajmniej 0,95, że średnie teoretyczne zawartości węglowodanów w dwóch próbach są różne.

Przykład model 3

Spośród studentów pewnego wydziału uczelni wylosowano niezależnie 7 studentów IV roku i otrzymano dla nich następujące średnie oceny uzyskane w sesji egzaminacyjne na I i IV roku:

Student I rok IV rok
1 3,5 4,2
2 4 3,9
3 3,7 3,8
4 4,6 4,5
5 3,9 4,2
6 3 3,4
7 3,5 3,8

Zakładamy, że rozkład ocen jest normalny. Czy te rezultaty potwierdzają hipotezę, że średnie uzyskane po IV roku są lepsze niż po I roku? Przyjąć poziom istotności $\alpha=0,05$.

Rozwiązanie:
Mamy wartości tej samej zmiennej w dwóch okresach czasu – próby zależne a więc stosujemy model 3
Zbadamy hipotezę, że druga średnia jest większa od pierwszej czyli że różnica średnich U jest dodatnia.
$$H_{0}:U=0$$
$$H_{1}:U>0$$

Student I rok IV rok U
1 3,5 4,2 0,7
2 4 3,9 -0,1
3 3,7 3,8 0,1
4 4,6 4,5 -0,1
5 3,9 4,2 0,3
6 3 3,4 0,4
7 3,5 3,8 0,3

$$\overline{u}=\frac{\sum_{i=1}^{7}U_{i}}{n}=\frac{0,7+(-0,1)+0,1+(-0,1)+0,3+0,4+0,3}{7}=0,2286$$
$$s_{u}^{2}=\frac{\sum_{i=1}^{7}(U_{i}-\overline{u})^{2}}{n}=\frac{(0,7-0,2286)^{2}+\cdots +(0,3-0,2286)^{2}}{7}$$
$$s_{u}=0,266$$
$$t=\frac{\overline{z}}{s_{z}}\sqrt{n-1}=\frac{0,2286}{0,266}\cdot \sqrt{6}=2,11$$
$$t_{kryt}=t_{0,95;6}=1,943$$
Obszar krytyczny:
$$\langle 1,943;+\infty)$$
Obliczona statystyka testowa należy do obszaru krytycznego, więc odrzucamy $H_{0}$ i przyjmujemy $H_{1}$. Zatem średnie wyniki po IV roku są wyższe.

 
Bibliografia:

  • Greń Jerzy, Statystyka matematyczna: Modele i zadania, Wyd. 4, Warszawa, PWN, 1974
  • Stanisławek Jędrzej, Podstawy statystyki, Warszawa, Oficyna Wydawnicza Politechniki Warszawskiej, 2010, ISBN 978-83-7207-882-7
0