Chcemy dowiedzieć się czy policzona wartość korelacji jest istotna statystycznie (na ile można “ufać” uzyskanemu wynikowi).
Możemy to zrobić za pomocą nieparametrycznego testu istotności współczynnika korelacji.
Test przebiega tak samo dla korelacji Pearsona jak i korelacji Spearmana dla małej próby.
Jak w przypadku każdego testu (parametrycznego lub nieparametrycznego) procedura jest następująca:
Krok 1: Wypisujemy dane i hipotezy.
W tym przypadku:
$$H_{0}:\rho = 0$$$$H_{1}:\rho \neq 0$$
gdzie $H_{1}:\rho \neq 0$ oznacza, że korelacja pomiędzy dwoma cechami w populacji jest rożna od zera.
Krok 2: Obliczamy statystykę testową testu istotności korelacji
Używamy wzoru:
$$t_{emp} = \frac{r \sqrt{n-2}}{\sqrt{1-r^{2}}}$$
gdzie:
$r$ – wartość współczynnika korelacji liniowej Pearsona obliczona na podstawie próby
$n$ – liczebność próby
Krok 3: Wyznaczamy obszar krytyczny
Wartość krytyczną $t_{kryt}$ obliczamy dla kwantyla $1-\frac{\alpha}{2}$ i $n-2$ stopni swobody korzystając z tablic t Studenta.
Obszar krytyczny ma postać:
$$\left(-\infty; -t_{kryt}> \cup <t_{kryt}; +\infty\right)$$
Krok 4: Podejmujemy decyzję o zachowaniu lub odrzuceniu hipotezy zerowej. Piszemy wniosek statystyczny i merytoryczny.
- Jeżeli statystyka testowa należy do obszaru krytycznego, to odrzucamy hipotezę zerową na rzecz hipotezy alternatywnej – korelacja jest istotna.
- Jeżeli statystyka testowa nie należy do obszaru krytycznego, to nie odrzucamy hipotezy zerowej – korelacja nie jest istotna.
Przykład
$x_{i}$ | $y_{i}$ |
0 | 1 |
2 | 2 |
1 | 3 |
4 | 6 |
1 | 2 |
Krok 1: Wypisujemy dane i hipotezy.
Obliczyliśmy na poprzedniej stronie, że $r=0,9084$ oraz próba jest 5-elementowa, więc $n=5$.
Badamy hipotezę:
$$H_{0}:\rho = 0$$$$H_{1}:\rho \neq 0$$
gdzie $H_{1}:\rho \neq 0$ oznacza, że korelacja pomiędzy dwoma cechami w populacji jest rożna od zera.
Krok 2: Obliczamy statystykę testową
Używamy wzoru:
$t_{emp} =\frac{r \sqrt{n-2}}{\sqrt{1-r^{2}}}= \frac{0,9084 \cdot \sqrt{5-2}}{\sqrt{1-0,9084^{2}}}$$ = \frac{0,9804 \cdot \sqrt{2}}{1-0,9084^{2}}$$ = \frac{1,2847}{1-0,8252} = \frac{1,2847}{0,1748} = 7,350$
gdzie:
$r$ – wartość współczynnika korelacji liniowej Pearsona obliczona na podstawie próby
$n$ – liczebność próby
Krok 3: Wyznaczamy obszar krytyczny
Poziom istotności: $\alpha=0.05$
Wartość krytyczną $t_{kryt}$ obliczamy dla kwantyla $1-\frac{0.05}{2}=1 – 0,025 =0.975$ i $n-2=5-2=3$ stopni swobody.
Korzystając z tablic t Studenta mamy: $T_{kryt} = 3.182$
Obszar krytyczny ma postać:
$$(-\infty; -3.182> \cup <3.182; +\infty)$$
Krok 4: Podejmujemy decyzję o zachowaniu lub odrzuceniu hipotezy zerowej. Piszemy wniosek statystyczny i merytoryczny.
Statystyka testowa równa $t=7,350$ należy do obszaru krytycznego. Odrzucamy więc hipotezę zerową na rzecz hipotezy alternatywnej – korelacja jest istotna.