Psychometria
Trafność teoretyczna — czy test zachowuje się jak teoria
dr Błażej Mroziński · adiunkt SWPS, psychometra
Opublikowano: · aktualizacja:
To najszersze i najtrudniejsze pytanie w psychometrii: czy ten test naprawdę mierzy konstrukt, który masz na myśli — czy tylko coś, co tak wygląda. Trafność teoretyczna nie daje się sprowadzić do jednej korelacji. To proces zbierania dowodów.
Co to jest
Trafność teoretyczna — w literaturze anglojęzycznej construct validity — mówi, na ile narzędzie mierzy konstrukt teoretyczny, który ma mierzyć. To najbardziej fundamentalna z odmian trafności, bo dotyczy samego sensu pomiaru.
Sedno tkwi w słowie „konstrukt”. Lęk, inteligencja, motywacja to pojęcia teoretyczne, nie obiekty. Nie ma jednego zewnętrznego kryterium, do którego można je przyłożyć i sprawdzić zgodność. Dlatego trafności teoretycznej nie da się udowodnić jednym pomiarem — buduje się ją z wielu poszlak.
Jak się ją bada
Logika jest taka: jeśli narzędzie naprawdę mierzy dany konstrukt, to musi zachowywać się tak, jak przewiduje teoria tego konstruktu. Teoria mówi, z czym lęk powinien się wiązać, a z czym nie. Sprawdzasz, czy wynik testu te przewidywania spełnia.
Z tego wyrastają dwa filary. Trafność zbieżna i różnicowa sprawdza sieć powiązań: narzędzie powinno korelować z miarami podobnego konstruktu (zbieżność) i nie korelować z miarami konstruktów odmiennych (różnicowanie). Jeśli twój test lęku koreluje tak samo mocno z innym testem lęku, jak z testem inteligencji — coś jest nie tak.
Drugi filar to analiza czynnikowa. Sprawdza, czy wewnętrzna struktura narzędzia odpowiada teorii. Jeśli teoria mówi, że konstrukt ma trzy wymiary, to dane powinny układać się w trzy czynniki. Jeśli układają się w jeden albo w pięć — teoria i narzędzie się rozjeżdżają.
Sieć powiązań, nie jeden test
Najważniejsza myśl: trafność teoretyczna to sieć, nie pojedynczy dowód. Żadna jedna korelacja jej nie przesądza. Dopiero zbiór zgodnych przewidywań — z tymi zmiennymi koreluje, z tamtymi nie, struktura czynnikowa się zgadza, różnice między znanymi grupami idą w przewidzianą stronę — buduje przekonanie, że narzędzie mierzy to, co deklaruje.
I odwrotnie: pojedynczy wynik niezgodny z teorią nie obala od razu trafności. Może obalać narzędzie, ale może też obalać teorię albo zewnętrzną miarę. Interpretacja jest tu zawsze rozumowaniem, nie odczytem.
Dlaczego to się opłaca
Trafność teoretyczna brzmi akademicko, ale jej brak jest praktycznym ryzykiem. Narzędzie bez niej potrafi stabilnie mierzyć coś innego, niż twierdzi — i nikt tego nie zauważy, dopóki nie sprawdzi sieci powiązań. Liczby będą się zgadzać, a konstrukt będzie podmieniony.
To dlatego rzetelne narzędzie to za mało. Powtarzalny pomiar czegoś niewłaściwego jest gorszy niż brak pomiaru, bo wygląda wiarygodnie. Trafność teoretyczna pilnuje, żeby etykieta na teście odpowiadała jego zawartości.
Jeśli walidujesz narzędzie i chcesz zaplanować dowody trafności teoretycznej — dobór miar zbieżnych, różnicowych i modelu czynnikowego — odezwij się.
Najczęstsze pytania
Co to jest trafność teoretyczna?
To stopień, w jakim narzędzie mierzy konstrukt teoretyczny, który ma mierzyć. Sprawdza się ją, badając, czy wynik zachowuje się tak, jak przewiduje teoria tego konstruktu — koreluje z tym, z czym powinien, i nie koreluje z tym, z czym nie powinien.
Jak bada się trafność teoretyczną?
Głównie przez sieć powiązań z innymi zmiennymi: trafność zbieżną (związek z miarami podobnego konstruktu), różnicową (brak związku z konstruktami odmiennymi) oraz analizę czynnikową, która sprawdza, czy struktura narzędzia odpowiada teorii.
Czym różni się od trafności kryterialnej?
Trafność kryterialna pyta o związek wyniku z jednym zewnętrznym kryterium. Trafność teoretyczna jest szersza — pyta, czy całe zachowanie narzędzia w sieci innych zmiennych zgadza się z teorią konstruktu.