Podobnie jak w teście dla średniej w teście dla dwóch średnich mamy 3 modele.
Próby niezależne – np. kobiety i mężczyźni, mieszkańcy miasta A i miasta B.
Próby zależne – najczęściej „przed i po”, np. ciśnienie przed i po wzięciu leku – badanie dotyczy tej samej próbki, ale w dwóch momentach czasu.
Model 1
Próby niezależne, znane odchylenia standardowe populacji lub duże próby.
$$\LARGE{u_{obl}=\frac{\overline{x}_{1}-\overline{x}_{2}}{\sqrt{\left (\frac{s_{1}^{2}}{n_{1}}+\frac{s_{2}^{2}}{n_{2}}\right)}}}$$
Obszar krytyczny znajdujemy z tablic rozkładu normalnego.
Model 2
Próby niezależne, nieznane odchylenie standardowe populacji i małe próby.
$$\LARGE{t=\frac{\overline{x}_{1}-\overline{x}_{2}}{\sqrt{\frac{n_{1}\cdot s_{1}^{2}+n_{2}\cdot s_{2}^{2}}{n_{1}+n_{2}-2}\left(\frac{1}{n_{1}}+\frac{1}{n_{2}}\right)}}}$$
Obszar krytyczny znajdujemy z tablic rozkładu t-Studenta dla $n_{1}+n_{2}-2$ stopni swobody.
Model 3
Próby zależne (inaczej: test dla różnicy średnich).
Testujemy hipotezę $H_{0}:\mu_{z}=0$, gdzie $\mu_{z}$ to średnia różnic (czyli testujemy hipotezę, że różnica między badanymi próbkami jest równa 0).
$$\LARGE{t=\frac{\overline{z}}{s_{z}}\sqrt{n-1}}$$
Obszar krytyczny znajdujemy z tablic rozkładu t-Studenta dla $n-1$ stopni.
Przykład – model 1
$$n_{1}=10 \hspace{1 cm} n_{2}=10$$
$$\overline{x}_{1}=6,65 \hspace{1cm} \overline{x}_{2}=6,36$$
$$\sigma_{1}^{2}=0,05 \hspace{1cm} \sigma_{2}^{2}=0,06$$
$$\alpha=0,05$$
Test istotności dla 2 średnich:
$$H_{0}:\overline{x}_{1}=\overline{x}_{2}$$
$$H_{1}:\overline{x}_{1}\neq\overline{x}_{2}$$
Odchylenia są znane, zatem statystyka testowa ma postać:
$$u=\frac{\overline{x}_{1}-\overline{x}_{2}}{\sqrt{\frac{\sigma_{1}^{2}}{n_{1}}+\frac{\sigma_{2}^{2}}{n_{2}}}}=\frac{6,65-6,36}{\sqrt{\frac{0,05}{10}+\frac{0,06}{10}}}=2,765$$
$u$ ma rozkład normalny, test obustronny:
$$1-\frac{\alpha}{2}=0,975$$
$$u_{1-\frac{\alpha}{2}}=u_{0,975}=1,96$$
Obszar krytyczny testu:
$$(-\infty;-1,96\rangle \cup \langle 1,96;+\infty)$$
$u$ jest w obszarze krytycznym, odrzucamy hipotezę zerową na rzecz hipotezy alternatywnej, wielkość plonu między gatunkami „A” i „B” różni się istotnie statystycznie.
Przykład – model 2
Rozwiązanie: Mamy małe próby (liczebności 7 i 10) oraz nie są podaje w poleceniu odchylenia standardowe populacji, więc stosujemy model 2.
Zgodnie z treścią zadania stawiamy hipotezę, że średnie zawartości węglowodanów w próbkach 100 gramowych wątroby w obu partiach są jednakowe, tzn. stawiamy hipotezę zerową $H_{0}:m_{1}=m_{2}$. Mamy dwie populacje generalne związane z różnymi partiami próbek 100 gramowych wątroby. Próby w populacjach generalnych mają obliczone parametry.
I partia:
$$n_{1}=7 \hspace{1cm} \overline{x}_{1}=17 \hspace{1cm} s_{1}=1,102$$
II partia:
$$n_{2}=10 \hspace{1cm} \overline{x}_{2}=15,5 \hspace{1cm} s_{2}=1,1$$
Indeksy przy podstawowych parametrach dotyczą numeru populacji a z tym związanych numeru próby. Aby odpowiedzieć na postawione pytanie wybieramy hipotezę alternatywną pierwszą tzn. $H_{1}:m_{1}\neq m_{2}$.
Krok 1:
$H_{0}:m_{1}=m_{2}$, tzn. średnie zawartości węglowodanów są takie same.
$\alpha=0,05$
$H_{1}:m_{1}\neq m_{2}$, tzn. średnie zawartości węglowodanów są różne.
Krok 2:
$$t=\frac{\overline{x}_{1}-\overline{x}_{2}}{\sqrt{\frac{n_{1}\cdot s_{1}^{2}+n_{2}\cdot s_{2}^{2}}{n_{1}+n_{2}-2}\left(\frac{1}{n_{1}}+\frac{1}{n_{2}}\right)}}$$
statystyka t-Studenta o $n_{1}+n_{2}+2$ stopniach swobody, tzn. wybraliśmy model 2 z grupy modeli testów istotności dla dwóch średnich.
Następnie obliczamy wartość statystyki z uzyskanej próby.
$$t_{0}=\frac{17-15,5}{\sqrt{\frac{7\cdot (1,102)^2+10\cdot (1,1)^{2}}{7+10-2}\left(\frac{1}{7}+\frac{1}{10}\right)}}=2,5975$$
Krok 3:
Z informacji w modelu wynika, że dla hipotezy alternatywnej pierwszej, obszar krytyczny ma wzór
$$K=(-\infty;-t_{\alpha,n_{1}+n_{2}-2})\cup (t_{\alpha,n_{1}+n_{2}-2};+\infty)$$
Ponieważ statystyka testowa ma rozkład t-Studenta z tablic tego rozkładu odczytujemy
$$t_{\alpha,n_{1}+n_{2}-2}=t_{0,05;15}=2,131$$
a więc zbiór krytyczny ma postać
$$K=(-\infty;-2,131)\cup (2,131;+\infty)$$
Krok 4:
Wartość statystyki $t_{0}=2,5975$ należy do obszaru krytycznego $K=(-\infty;-2,131)\cup (2,131;+\infty)$.tzn. $t_{0}\in K$.
Decyzja: hipotezę zerową odrzucamy na korzyść hipotezy alternatywnej i twierdzimy z prawdopodobieństwem przynajmniej 0,95, że hipoteza alternatywna jest prawdziwa.
A więc twierdzimy z prawdopodobieństwem przynajmniej 0,95, że średnie teoretyczne zawartości węglowodanów w dwóch próbach są różne.
Przykład model 3
Spośród studentów pewnego wydziału uczelni wylosowano niezależnie 7 studentów IV roku i otrzymano dla nich następujące średnie oceny uzyskane w sesji egzaminacyjne na I i IV roku:
Student | I rok | IV rok |
1 | 3,5 | 4,2 |
2 | 4 | 3,9 |
3 | 3,7 | 3,8 |
4 | 4,6 | 4,5 |
5 | 3,9 | 4,2 |
6 | 3 | 3,4 |
7 | 3,5 | 3,8 |
Zakładamy, że rozkład ocen jest normalny. Czy te rezultaty potwierdzają hipotezę, że średnie uzyskane po IV roku są lepsze niż po I roku? Przyjąć poziom istotności $\alpha=0,05$.
Mamy wartości tej samej zmiennej w dwóch okresach czasu – próby zależne a więc stosujemy model 3
Zbadamy hipotezę, że druga średnia jest większa od pierwszej czyli że różnica średnich U jest dodatnia.
$$H_{0}:U=0$$
$$H_{1}:U>0$$
Student | I rok | IV rok | U |
1 | 3,5 | 4,2 | 0,7 |
2 | 4 | 3,9 | -0,1 |
3 | 3,7 | 3,8 | 0,1 |
4 | 4,6 | 4,5 | -0,1 |
5 | 3,9 | 4,2 | 0,3 |
6 | 3 | 3,4 | 0,4 |
7 | 3,5 | 3,8 | 0,3 |
$$\overline{u}=\frac{\sum_{i=1}^{7}U_{i}}{n}=\frac{0,7+(-0,1)+0,1+(-0,1)+0,3+0,4+0,3}{7}=0,2286$$
$$s_{u}^{2}=\frac{\sum_{i=1}^{7}(U_{i}-\overline{u})^{2}}{n}=\frac{(0,7-0,2286)^{2}+\cdots +(0,3-0,2286)^{2}}{7}$$
$$s_{u}=0,266$$
$$t=\frac{\overline{z}}{s_{z}}\sqrt{n-1}=\frac{0,2286}{0,266}\cdot \sqrt{6}=2,11$$
$$t_{kryt}=t_{0,95;6}=1,943$$
Obszar krytyczny:
$$\langle 1,943;+\infty)$$
Obliczona statystyka testowa należy do obszaru krytycznego, więc odrzucamy $H_{0}$ i przyjmujemy $H_{1}$. Zatem średnie wyniki po IV roku są wyższe.
Bibliografia:
- Greń Jerzy, Statystyka matematyczna: Modele i zadania, Wyd. 4, Warszawa, PWN, 1974
- Stanisławek Jędrzej, Podstawy statystyki, Warszawa, Oficyna Wydawnicza Politechniki Warszawskiej, 2010, ISBN 978-83-7207-882-7