Psychometria
Standardowy błąd pomiaru — ile wynosi margines wokół wyniku
dr Błażej Mroziński · adiunkt SWPS, psychometra
Opublikowano: · aktualizacja:
Test pokazuje liczbę: 24. Wygląda na fakt — precyzyjny, jednoznaczny, gotowy do wpisania do raportu. A jest tylko najlepszym przybliżeniem. Gdyby ta sama osoba wypełniła narzędzie ponownie, w nieco innym nastroju, o innej porze, wynik prawie na pewno byłby trochę inny. Standardowy błąd pomiaru mówi, jak bardzo „trochę”.
Wynik obserwowany kontra prawdziwy
Klasyczna teoria testu rozkłada każdy wynik na dwie części: wynik prawdziwy — to, co byśmy zmierzyli bez zakłóceń — oraz błąd, czyli przypadkowy szum nałożony przez okoliczności pomiaru. Wyniku prawdziwego nigdy nie widzimy bezpośrednio. Widzimy wynik obserwowany, który jest prawdziwym plus-minus błąd.
Standardowy błąd pomiaru (SEM) to oszacowanie, jak duży jest ten plus-minus. Mówiąc inaczej: gdyby tę samą osobę zbadać wielokrotnie, jej wyniki rozsypałyby się wokół wartości prawdziwej, a SEM opisuje, jak szeroko.
Przedział zamiast punktu
Najważniejsza praktyczna konsekwencja: pojedynczy wynik czyta się jako przedział, nie jako punkt.
Wokół wyniku obserwowanego buduje się przedział ufności o szerokości będącej wielokrotnością SEM. Zamiast „wynik to 24” mówi się „wynik prawdziwy leży prawdopodobnie między 21 a 27”. To nie jest ostrożnościowy ozdobnik — to uczciwe oddanie tego, ile naprawdę wiemy.
Konsekwencja idzie dalej. Jeśli dwie osoby uzyskały 24 i 27, a przedziały wokół tych wyników zachodzą na siebie, trudno twierdzić, że jedna „wypadła wyżej”. Różnica może być w całości szumem. To samo dotyczy progów: wynik tuż nad granicą odcięcia i tuż pod nią dzieli czasem mniej, niż wynosi błąd pomiaru — a mimo to bywa traktowany jak jakościowa różnica między „kwalifikuje się” a „nie”.
Im rzetelniej, tym węziej
SEM jest ściśle związany z rzetelnością. Zależność jest odwrotna: im wyższa rzetelność, tym mniejszy błąd pomiaru. Pomiar doskonale rzetelny miałby SEM bliski zera — każdy wynik byłby punktem. Pomiar o niskiej rzetelności otacza każdy wynik tak szerokim przedziałem, że robi się on mało użyteczny do decyzji o pojedynczej osobie.
To pokazuje, czemu zgodność wewnętrzna i pokrewne wskaźniki nie są akademicką ozdobą. Rzetelność przekłada się wprost na to, jak precyzyjnie wolno czytać wynik konkretnego człowieka — a od tego zależą realne decyzje.
Gdzie to ma znaczenie
Wszędzie tam, gdzie wynik jednej osoby waży. W diagnozie, kwalifikacji, orzecznictwie. Raport, który podaje „wynik 24” bez słowa o marginesie błędu, sugeruje precyzję, której nie ma. Raport, który podaje „24, przedział 21–27”, mówi prawdę o tym, ile wiadomo.
SEM jest też fundamentem pytania, czy zmiana między dwoma pomiarami jest realna — bo żeby orzec realną różnicę, najpierw trzeba znać szerokość szumu. To temat rzetelnej zmiany wyniku.
Standardowy błąd pomiaru to jedna z tych rzeczy, które oddzielają interpretację profesjonalną od naiwnej. Liczba nie jest faktem — jest przybliżeniem o znanej dokładności. Jeśli na podstawie wyników zapadają u Ciebie decyzje o ludziach i chcesz, żeby raporty mówiły prawdę o ich precyzji — odezwij się.
Najczęstsze pytania
Co to jest standardowy błąd pomiaru?
To miara tego, o ile wynik obserwowany może odbiegać od wyniku prawdziwego z powodu przypadkowego błędu. Pozwala otoczyć pojedynczy wynik przedziałem, w którym z dużym prawdopodobieństwem leży wynik prawdziwy.
Jak SEM wiąże się z rzetelnością?
Odwrotnie: im wyższa rzetelność narzędzia, tym mniejszy standardowy błąd pomiaru. Doskonale rzetelny pomiar miałby SEM bliski zeru. Niska rzetelność oznacza szeroki przedział wokół każdego wyniku.
Jak interpretować pojedynczy wynik z uwzględnieniem SEM?
Nie jako punkt, lecz jako przedział. Zamiast „wynik to 24” mówi się „wynik mieści się prawdopodobnie między 21 a 27”. Dwa wyniki, których przedziały się nakładają, trudno uznać za realnie różne.