Psychometria
Rzetelność i trafność — dwie rzeczy, które łatwo pomylić
dr Błażej Mroziński · adiunkt SWPS, psychometra
Opublikowano: · aktualizacja:
To są dwa najważniejsze słowa w psychometrii i dwa najczęściej mylone. W skrócie: rzetelność to powtarzalność pomiaru, trafność to jego sens. Można mieć pierwsze bez drugiego — i to jest dokładnie ta sytuacja, w której narzędzie wygląda profesjonalnie, a nie nadaje się do niczego.
Rzetelność — czy pomiar jest stabilny
Rzetelność mówi, ile w wyniku jest sygnału, a ile przypadkowego błędu. Im mniej szumu, tym bardziej ten sam człowiek dostanie ten sam wynik w tych samych warunkach.
Sprawdza się ją na kilka sposobów:
- Zgodność wewnętrzna — czy pozycje jednej skali idą razem. To domena alfy Cronbacha i omegi.
- Stabilność w czasie (test–retest) — czy wynik się utrzymuje, gdy nic istotnego się nie zmieniło.
- Zgodność sędziów — gdy wynik zależy od oceniającego, czy dwóch niezależnych ekspertów ocenia podobnie.
Każdy z tych rodzajów odpowiada na inne pytanie i każdy może wypaść inaczej. Wysoka zgodność wewnętrzna nie gwarantuje stabilności w czasie.
Trafność — czy mierzysz to, co chciałeś
Trafność to trudniejsze i ważniejsze pytanie: czy ten wynik naprawdę mówi o konstrukcie, który masz na myśli, a nie o czymś obok. Klasycznie wyróżnia się trzy spojrzenia.
Pierwszy: trafność treściowa. Czy pozycje pokrywają cały konstrukt, a nie tylko jego wygodny fragment. Skala lęku, która pyta wyłącznie o objawy z ciała, pomija lęk poznawczy — i jest treściowo wąska.
Drugi: trafność kryterialna. Czy wynik wiąże się z czymś zewnętrznym, co już znamy. Równolegle (z innym, uznanym narzędziem) albo prognostycznie (z przyszłym zachowaniem). Test rekrutacyjny, który nie przewiduje późniejszej efektywności, jest kryterialnie nietrafny — niezależnie od tego, jak ładnie wygląda.
Trzeci: trafność teoretyczna. Czy narzędzie zachowuje się tak, jak przewiduje teoria — koreluje z tym, z czym powinno, i nie koreluje z tym, z czym nie powinno. Tu zwykle wchodzi analiza czynnikowa i cała sieć powiązań z innymi zmiennymi.
Dlaczego kolejność ma znaczenie
Rzetelność jest warunkiem trafności, nie odwrotnie. Jeśli pomiar jest chwiejny, nie może wiernie oddawać żadnego konstruktu — szum zjada sygnał. Dlatego rzetelność liczy się najpierw: jest progiem wejścia.
Ale — i tu jest sedno — rzetelność bez trafności jest pusta. Można stabilnie, powtarzalnie mierzyć coś, co nie jest tym, co deklarujesz. Kwestionariusz „kompetencji przywódczych”, który w istocie mierzy pewność siebie, bywa idealnie rzetelny. I właśnie dlatego jest groźny: liczby się zgadzają, a decyzja zapada na złej podstawie.
To rozróżnienie jest praktyczne, nie akademickie. Większość narzędzi, które „działają” w organizacjach, ma przyzwoitą rzetelność i nikt nie sprawdził ich trafności. Jeśli na podstawie wyniku zapadają decyzje o ludziach, warto wiedzieć, którą z tych dwóch rzeczy faktycznie się ma. Pomogę to sprawdzić — albo zbudować narzędzie, które ma obie.
Najczęstsze pytania
Czym różni się rzetelność od trafności?
Rzetelność mówi, czy pomiar jest powtarzalny i wolny od przypadkowego błędu. Trafność mówi, czy mierzysz to, co zamierzałeś. Narzędzie może być rzetelne i jednocześnie nietrafne — mierzyć stabilnie coś innego, niż deklaruje.
Czy narzędzie może być trafne, ale nierzetelne?
W praktyce nie. Rzetelność jest warunkiem koniecznym trafności — jeśli pomiar jest chwiejny i pełen szumu, nie może wiernie odwzorowywać żadnego konstruktu. Dlatego rzetelność sprawdza się jako pierwszą.
Jakie są rodzaje trafności?
Najczęściej mówi się o trafności treściowej (czy pozycje pokrywają konstrukt), kryterialnej (czy wynik wiąże się z zewnętrznym kryterium — równolegle lub prognostycznie) i teoretycznej (czy narzędzie zachowuje się tak, jak przewiduje teoria konstruktu).