badania.org

Psychometria

Trafność zbieżna i różnicowa — z czym test koreluje

dr Błażej Mroziński · adiunkt SWPS, psychometra

Opublikowano: · aktualizacja:

Żeby udowodnić, że test mierzy lęk, nie wystarczy pokazać, że koreluje z innym testem lęku. Trzeba też pokazać, że nie koreluje równie mocno z inteligencją, samooceną i wszystkim innym. Trafność zbieżna i różnicowa to dwie strony tej samej monety — i razem stanowią rdzeń dowodu trafności.

Dwa kierunki jednego pytania

Obie należą do trafności teoretycznej. Sprawdzają, czy narzędzie wpisuje się w sieć powiązań przewidzianą przez teorię konstruktu. Robią to z dwóch przeciwnych stron.

Trafność zbieżna to zgodność z miarami podobnego konstruktu. Jeśli twój test mierzy lęk, jego wynik powinien wyraźnie korelować z innymi, uznanymi miarami lęku — niezależnie od tego, jakim sposobem je zebrano. Wysoka zbieżność mówi: „to narzędzie mierzy coś, co inni też nazywają lękiem”.

Trafność różnicowa — nazywana też dyskryminacyjną — to brak silnego związku z konstruktami odmiennymi. Test lęku może lekko korelować z depresją, bo te stany się przenikają. Ale nie powinien korelować z inteligencją werbalną tak samo mocno jak z innym testem lęku. Różnicowanie mówi: „to narzędzie odróżnia swój konstrukt od sąsiednich”.

Czemu potrzeba obu

Sama zbieżność nie wystarcza, i to jest cała pointa. Wyobraź sobie test, który koreluje wysoko z miarą lęku — wygląda świetnie. Ale ten sam test koreluje równie wysoko z miarą depresji, ze stresem, z neurotyzmem i z ogólnym złym samopoczuciem. Wtedy nie mierzy lęku. Mierzy coś szerokiego i mglistego — ogólny dyskomfort — a etykieta „lęk” jest na wyrost.

Dopiero zestawienie: wysoka korelacja tam, gdzie powinna być, i wyraźnie niższa tam, gdzie być nie powinna, dowodzi, że narzędzie trafia w swój, a nie cudzy konstrukt. Zbieżność bez różnicowania to połowa dowodu, i to mniej istotna połowa.

Macierz wielu cech–wielu metod

Klasyczne narzędzie do badania obu naraz to macierz wielu cech–wielu metod. Pomysł: mierzysz kilka konstruktów (cech) kilkoma różnymi metodami i układasz wszystkie korelacje w jedną tabelę.

Po co ten zachód. Bo zgodność dwóch pomiarów może brać się z dwóch źródeł: ze wspólnego konstruktu albo ze wspólnej metody. Dwa kwestionariusze samoopisowe potrafią korelować po prostu dlatego, że oba są samoopisowe — wspólny styl odpowiadania, a nie wspólna cecha. Macierz pozwala te dwa źródła rozdzielić: trafność jest mocna, gdy ten sam konstrukt mierzony różnymi metodami wciąż zgadza się ze sobą, a różne konstrukty mierzone tą samą metodą jednak się rozchodzą.

To podejście jest spokrewnione z logiką analizy czynnikowej: w obu chodzi o to, by oddzielić prawdziwą strukturę konstruktów od artefaktów pomiaru.

Co z tego wynika

Trafność zbieżna i różnicowa to nie ozdobnik raportu — to najmocniejszy praktyczny test, czy etykieta na narzędziu odpowiada jego zawartości. Brak różnicowania jest częstą, cichą wadą: narzędzie mierzy coś szerszego niż obiecuje i robi to przekonująco.

Jeśli walidujesz narzędzie i chcesz dobrać miary zbieżne oraz różnicowe, które naprawdę przetestują jego trafność — odezwij się.

Najczęstsze pytania

Co to jest trafność zbieżna?

To zgodność wyniku testu z miarami tego samego lub podobnego konstruktu. Jeśli twój test lęku mierzy lęk, powinien wyraźnie korelować z innymi, uznanymi miarami lęku. Brak takiej korelacji podważa, że narzędzie mierzy to, co deklaruje.

Co to jest trafność różnicowa?

Nazywana też dyskryminacyjną — to brak związku wyniku z miarami konstruktów odmiennych. Test lęku nie powinien korelować z lękiem tak samo mocno jak z inteligencją. Różnicowanie dowodzi, że test odróżnia swój konstrukt od innych.

Czym jest macierz wielu cech–wielu metod?

To plan badania, w którym kilka konstruktów mierzy się kilkoma metodami naraz. Pozwala oddzielić zgodność wynikającą ze wspólnego konstruktu od zgodności wynikającej ze wspólnej metody pomiaru — i tym samym mocniej sprawdzić trafność.