Psychometria
Wartość predykcyjna testu — co naprawdę znaczy dodatni wynik
dr Błażej Mroziński · adiunkt SWPS, psychometra
Opublikowano: · aktualizacja:
Test ma 95% czułości i 95% swoistości. Wynik dodatni — czy to znaczy, że z prawdopodobieństwem 95% masz problem? Intuicja krzyczy „tak”. Intuicja się myli, czasem dramatycznie. Odpowiedź zależy od czegoś, co w tych dwóch liczbach w ogóle nie występuje: od tego, jak częsty jest problem w badanej populacji.
Inne pytanie niż czułość
Czułość i swoistość patrzą od strony statusu do wyniku: skoro ktoś jest chory, jak często test to wyłapie. W praktyce mamy jednak odwrotny problem. Trzymamy w ręku wynik — i pytamy, co on znaczy dla tej osoby.
Na to odpowiada wartość predykcyjna. Dodatnia (PPV) mówi: spośród osób z wynikiem dodatnim, ile naprawdę ma problem. Ujemna (NPV) mówi: spośród osób z wynikiem ujemnym, ile naprawdę jest zdrowych. To jest pytanie, które zadaje sobie każdy, kto dostaje wynik — i to wartość predykcyjna, a nie czułość, na nie odpowiada.
Dlaczego rozpowszechnienie zmienia wszystko
Tu wkracza częstość problemu w populacji — rozpowszechnienie. Ten sam test, o niezmienionej czułości i swoistości, daje zupełnie różną wartość predykcyjną w zależności od tego, kogo bada.
Policzmy to na intuicji. Weźmy populację 10 000 osób i problem dotyczący 1% z nich, czyli 100 osób. Test o 95% czułości wyłapie 95 z nich — to prawdziwe dodatnie. Ale wśród 9 900 zdrowych test z 95% swoistością pomyli się u 5%, czyli u 495 osób — to fałszywe dodatnie. Wśród wszystkich dodatnich wyników (95 + 495 = 590) tylko 95 jest trafnych. PPV wynosi około 16%. Większość alarmów jest fałszywa, mimo że test brzmi świetnie.
Mechanizm jest prosty: gdy zdrowych jest bardzo dużo, nawet mały odsetek pomyłek wśród nich daje w liczbach bezwzględnych więcej fałszywych dodatnich niż wszystkich prawdziwych wykryć w nielicznej grupie chorych. Im rzadszy problem, tym mocniej to działa.
Co z tego wynika w praktyce
Pierwszy wniosek: dobry przesiew rzadkiego problemu i tak generuje dużo fałszywych alarmów. To nie wada testu, tylko arytmetyka. Dlatego dodatni przesiew prawie nigdy nie jest rozpoznaniem — jest wskazaniem do badania potwierdzającego, które przesieje fałszywe dodatnie.
Drugi wniosek: populacja ma znaczenie. Ten sam test użyty w grupie podwyższonego ryzyka, gdzie rozpowszechnienie jest wyższe, ma znacznie lepszą PPV niż użyty masowo wśród zdrowych. To jeden z argumentów za celowaniem badań przesiewowych zamiast badania wszystkich.
Trzeci — symetryczny: dla rzadkich problemów NPV jest zwykle bardzo wysoka. Wynik ujemny u osoby z populacji o niskim ryzyku niemal na pewno jest prawdziwy, bo zdrowych jest przytłaczająca większość. Test dobrze uspokaja, gorzej alarmuje — i warto wiedzieć, w którą stronę.
Wartość predykcyjna to pomost między statystyką testu a decyzją o konkretnej osobie. Bez niej łatwo przecenić dodatni wynik i podjąć działanie na podstawie alarmu, który w danej populacji najczęściej jest fałszywy. Jeśli interpretujesz wyniki przesiewu albo projektujesz, kogo nim obejmować, i chcesz to robić z uwzględnieniem rozpowszechnienia — odezwij się.
Najczęstsze pytania
Co to jest wartość predykcyjna testu?
To odpowiedź na pytanie, ile naprawdę znaczy konkretny wynik. Dodatnia (PPV) to odsetek osób z wynikiem dodatnim, które faktycznie mają problem. Ujemna (NPV) to odsetek osób z wynikiem ujemnym, które faktycznie są zdrowe.
Dlaczego wartość predykcyjna zależy od rozpowszechnienia?
Bo gdy problem jest rzadki, nawet niewielki odsetek fałszywych alarmów wśród licznych zdrowych przeważa nad prawdziwymi wykryciami. Ten sam test ma wysoką PPV w populacji obciążonej i niską w populacji zdrowej.
Czym różni się wartość predykcyjna od czułości?
Czułość liczy się wśród osób z problemem i nie zależy od jego częstości. Wartość predykcyjna patrzy odwrotnie — od wyniku do statusu — i silnie zależy od rozpowszechnienia. To wartość predykcyjna mówi, co zrobić z konkretnym wynikiem.