Chcemy dowiedzieć się czy policzona wartość korelacji jest istotna statystycznie (na ile można “ufać” uzyskanemu wynikowi).

Możemy to zrobić za pomocą nieparametrycznego testu istotności współczynnika korelacji.

Test przebiega tak samo dla korelacji Pearsona jak i korelacji Spearmana dla małej próby.

Jak w przypadku każdego testu (parametrycznego lub nieparametrycznego) procedura jest następująca:

Krok 1: Wypisujemy dane i hipotezy.

W tym przypadku:

$$H_{0}:\rho = 0$$$$H_{1}:\rho \neq 0$$

gdzie $H_{1}:\rho \neq 0$ oznacza, że korelacja pomiędzy dwoma cechami w populacji jest rożna od zera.

Czasem polecenie mówi, aby sprawdzić hipotezę alternatywną o dodatniej wartości korelacji, wtedy hipoteza alternatywna jest jednostronna.

Krok 2: Obliczamy statystykę testową testu istotności korelacji

Używamy wzoru:

$$t_{emp} = \frac{r \sqrt{n-2}}{\sqrt{1-r^{2}}}$$

gdzie:
$r$ – wartość współczynnika korelacji liniowej Pearsona obliczona na podstawie próby
$n$ – liczebność próby

Krok 3: Wyznaczamy obszar krytyczny

Wartość krytyczną $t_{kryt}$ obliczamy dla kwantyla $1-\frac{\alpha}{2}$ i $n-2$ stopni swobody korzystając z tablic t Studenta.

Obszar krytyczny ma postać:
$$\left(-\infty; -t_{kryt}> \cup <t_{kryt}; +\infty\right)$$

Krok 4: Podejmujemy decyzję o zachowaniu lub odrzuceniu hipotezy zerowej. Piszemy wniosek statystyczny i merytoryczny.

  • Jeżeli statystyka testowa należy do obszaru krytycznego, to odrzucamy hipotezę zerową na rzecz hipotezy alternatywnej – korelacja jest istotna.
  • Jeżeli statystyka testowa nie należy do obszaru krytycznego, to nie odrzucamy hipotezy zerowejkorelacja nie jest istotna.

Przykład

Policzymy istotność współczynnika korelacji liniowej Pearsona, przyjmując poziom istotności $\alpha=0.05$.

$x_{i}$ $y_{i}$
0 1
2 2
1 3
4 6
1 2

Krok 1: Wypisujemy dane i hipotezy.

Obliczyliśmy na poprzedniej stronie, że $r=0,9084$ oraz próba jest 5-elementowa, więc $n=5$.

Badamy hipotezę:

$$H_{0}:\rho = 0$$$$H_{1}:\rho \neq 0$$

gdzie $H_{1}:\rho \neq 0$ oznacza, że korelacja pomiędzy dwoma cechami w populacji jest rożna od zera.

Krok 2: Obliczamy statystykę testową

Używamy wzoru:

$t_{emp} =\frac{r \sqrt{n-2}}{\sqrt{1-r^{2}}}= \frac{0,9084 \cdot \sqrt{5-2}}{\sqrt{1-0,9084^{2}}}$$ = \frac{0,9804 \cdot \sqrt{2}}{1-0,9084^{2}}$$ = \frac{1,2847}{1-0,8252} = \frac{1,2847}{0,1748} = 7,350$

gdzie:
$r$ – wartość współczynnika korelacji liniowej Pearsona obliczona na podstawie próby
$n$ – liczebność próby

Krok 3: Wyznaczamy obszar krytyczny

Poziom istotności: $\alpha=0.05$

Wartość krytyczną $t_{kryt}$ obliczamy dla kwantyla $1-\frac{0.05}{2}=1 – 0,025 =0.975$ i $n-2=5-2=3$ stopni swobody.
Korzystając z tablic t Studenta mamy: $T_{kryt} = 3.182$

Obszar krytyczny ma postać:
$$(-\infty; -3.182> \cup <3.182; +\infty)$$

Krok 4: Podejmujemy decyzję o zachowaniu lub odrzuceniu hipotezy zerowej. Piszemy wniosek statystyczny i merytoryczny.

Statystyka testowa równa $t=7,350$ należy do obszaru krytycznego. Odrzucamy więc hipotezę zerową na rzecz hipotezy alternatywnej – korelacja jest istotna.

10+