Psychometria
Korelacja — jak czytać współczynnik i czego nie wolno z niego wnioskować
dr Błażej Mroziński · adiunkt SWPS, psychometra
Opublikowano: · aktualizacja:
Korelacja to jedno z tych pojęć, które każdy mniej więcej rozumie i prawie każdy gdzieś nadużywa. Sama idea jest prosta: dwie rzeczy zmieniają się razem. Kłopoty zaczynają się przy tym, co z tej obserwacji wolno wyciągnąć — a wolno znacznie mniej, niż się zwykle wyciąga.
Co to jest
Korelacja opisuje, na ile dwie zmienne zmieniają się wspólnie. Ujmuje to jedną liczbą — współczynnikiem korelacji — która biegnie od -1 do 1.
- Bliska 1 — silny związek dodatni: gdy jedna zmienna rośnie, druga zwykle też.
- Bliska -1 — silny związek ujemny: gdy jedna rośnie, druga zwykle maleje.
- Bliska 0 — brak związku liniowego: wartości jednej zmiennej nic nie mówią o drugiej.
Znak mówi o kierunku, wartość bezwzględna o sile. Korelacja 0,8 i -0,8 są równie silne, różnią się tylko zwrotem.
Pearson czy Spearman
Najczęściej spotyka się dwa współczynniki, i nie są wymienne.
Pearsona mierzy siłę związku liniowego między zmiennymi ilościowymi. Pyta wprost: jak dobrze punkty układają się wzdłuż prostej. Jest czuły na wartości odstające i zakłada, że jeśli związek istnieje, to ma charakter liniowy.
Spearmana opiera się na rangach, nie na surowych wartościach. Wychwytuje każdy związek monotoniczny — taki, w którym jedna zmienna konsekwentnie rośnie wraz z drugą, niekoniecznie po linii prostej. Sięga się po niego przy danych porządkowych, przy wartościach odstających i tam, gdzie zależność jest, ale nie jest prosto liniowa.
Wybór nie jest kosmetyczny. Silny związek krzywoliniowy potrafi dać niską korelację Pearsona i zupełnie przyzwoitą Spearmana — a ktoś, kto patrzy tylko na pierwszą liczbę, wyciągnie wniosek „związku brak”, choć jest wyraźny.
Korelacja a przyczynowość
To najważniejsze zdanie na tej stronie: korelacja to nie przyczynowość. Fakt, że dwie zmienne idą w parze, nie znaczy, że jedna wywołuje drugą.
Możliwości jest co najmniej kilka. Może rzeczywiście A wpływa na B. Ale równie dobrze to B wpływa na A. Albo oba są skutkiem trzeciego, niezmierzonego czynnika — klasyczny przypadek pozornej korelacji, gdzie sprzedaż lodów „koreluje” z utonięciami, bo za jednym i drugim stoi upał. Albo to po prostu przypadek, zwłaszcza gdy przeszukano wiele zmiennych naraz.
Z samego współczynnika nie da się tych scenariuszy rozróżnić. Żeby orzec o przyczynie, potrzeba czegoś więcej: eksperymentu z manipulacją, kontroli zmiennych zakłócających, uporządkowania zdarzeń w czasie. Współczynnik korelacji tego nie da i nigdy nie obiecywał.
Rola w ocenie trafności
W psychometrii korelacja jest jednak codziennym, niezastąpionym narzędziem — pod warunkiem, że pamięta się o jej granicach. To na korelacjach opiera się znaczna część dowodów na trafność.
Sprawdzasz, czy wynik testu wiąże się z zewnętrznym kryterium, które ma przewidywać — to robi się korelacją. Sprawdzasz, czy dwa narzędzia mierzące to samo dają zbieżne wyniki — znów korelacja. Sprawdzasz, czy test nie miesza się z czymś, z czym nie powinien — tu korelacja powinna być niska. Cała ta sieć związków buduje argument, że test mierzy to, co ma mierzyć.
Jedno zastrzeżenie na koniec: silna korelacja bywa zupełnie nieprzydatna, gdy próba jest mała, a słaba potrafi być istotna na wielkiej próbie. Dlatego współczynnik czyta się razem z wielkością efektu i kontekstem, nie jako samotną liczbę.
Pracujesz z danymi i chcesz mieć pewność, że twoje korelacje znaczą to, co im przypisujesz — a nie coś, czego nie uprawniają? Odezwij się, przejdę z tobą przez interpretację.
Najczęstsze pytania
Jakie wartości przyjmuje współczynnik korelacji?
Od -1 do 1. Wartość bliska 1 oznacza silny związek dodatni, bliska -1 silny związek ujemny, a bliska 0 brak związku liniowego. Sam znak mówi o kierunku, a wartość bezwzględna o sile.
Czym różni się korelacja Pearsona od Spearmana?
Pearsona mierzy siłę związku liniowego między zmiennymi ilościowymi. Spearmana opiera się na rangach i wychwytuje każdy związek monotoniczny, także nieliniowy. Spearmana stosuje się przy danych porządkowych lub gdy zależność nie jest prosto liniowa.
Czy korelacja oznacza przyczynowość?
Nie. Korelacja mówi tylko, że dwie zmienne zmieniają się razem. Może za tym stać przyczyna, ale równie dobrze wspólny trzeci czynnik albo przypadek. Z samej korelacji nie wolno wnioskować, że jedno powoduje drugie.