badania.org

Psychometria

Standardowy błąd pomiaru — ile wynosi margines wokół wyniku

dr Błażej Mroziński · adiunkt SWPS, psychometra

Opublikowano: · aktualizacja:

Test pokazuje liczbę: 24. Wygląda na fakt — precyzyjny, jednoznaczny, gotowy do wpisania do raportu. A jest tylko najlepszym przybliżeniem. Gdyby ta sama osoba wypełniła narzędzie ponownie, w nieco innym nastroju, o innej porze, wynik prawie na pewno byłby trochę inny. Standardowy błąd pomiaru mówi, jak bardzo „trochę”.

Wynik obserwowany kontra prawdziwy

Klasyczna teoria testu rozkłada każdy wynik na dwie części: wynik prawdziwy — to, co byśmy zmierzyli bez zakłóceń — oraz błąd, czyli przypadkowy szum nałożony przez okoliczności pomiaru. Wyniku prawdziwego nigdy nie widzimy bezpośrednio. Widzimy wynik obserwowany, który jest prawdziwym plus-minus błąd.

Standardowy błąd pomiaru (SEM) to oszacowanie, jak duży jest ten plus-minus. Mówiąc inaczej: gdyby tę samą osobę zbadać wielokrotnie, jej wyniki rozsypałyby się wokół wartości prawdziwej, a SEM opisuje, jak szeroko.

Przedział zamiast punktu

Najważniejsza praktyczna konsekwencja: pojedynczy wynik czyta się jako przedział, nie jako punkt.

Wokół wyniku obserwowanego buduje się przedział ufności o szerokości będącej wielokrotnością SEM. Zamiast „wynik to 24” mówi się „wynik prawdziwy leży prawdopodobnie między 21 a 27”. To nie jest ostrożnościowy ozdobnik — to uczciwe oddanie tego, ile naprawdę wiemy.

Konsekwencja idzie dalej. Jeśli dwie osoby uzyskały 24 i 27, a przedziały wokół tych wyników zachodzą na siebie, trudno twierdzić, że jedna „wypadła wyżej”. Różnica może być w całości szumem. To samo dotyczy progów: wynik tuż nad granicą odcięcia i tuż pod nią dzieli czasem mniej, niż wynosi błąd pomiaru — a mimo to bywa traktowany jak jakościowa różnica między „kwalifikuje się” a „nie”.

Im rzetelniej, tym węziej

SEM jest ściśle związany z rzetelnością. Zależność jest odwrotna: im wyższa rzetelność, tym mniejszy błąd pomiaru. Pomiar doskonale rzetelny miałby SEM bliski zera — każdy wynik byłby punktem. Pomiar o niskiej rzetelności otacza każdy wynik tak szerokim przedziałem, że robi się on mało użyteczny do decyzji o pojedynczej osobie.

To pokazuje, czemu zgodność wewnętrzna i pokrewne wskaźniki nie są akademicką ozdobą. Rzetelność przekłada się wprost na to, jak precyzyjnie wolno czytać wynik konkretnego człowieka — a od tego zależą realne decyzje.

Gdzie to ma znaczenie

Wszędzie tam, gdzie wynik jednej osoby waży. W diagnozie, kwalifikacji, orzecznictwie. Raport, który podaje „wynik 24” bez słowa o marginesie błędu, sugeruje precyzję, której nie ma. Raport, który podaje „24, przedział 21–27”, mówi prawdę o tym, ile wiadomo.

SEM jest też fundamentem pytania, czy zmiana między dwoma pomiarami jest realna — bo żeby orzec realną różnicę, najpierw trzeba znać szerokość szumu. To temat rzetelnej zmiany wyniku.

Standardowy błąd pomiaru to jedna z tych rzeczy, które oddzielają interpretację profesjonalną od naiwnej. Liczba nie jest faktem — jest przybliżeniem o znanej dokładności. Jeśli na podstawie wyników zapadają u Ciebie decyzje o ludziach i chcesz, żeby raporty mówiły prawdę o ich precyzji — odezwij się.

Najczęstsze pytania

Co to jest standardowy błąd pomiaru?

To miara tego, o ile wynik obserwowany może odbiegać od wyniku prawdziwego z powodu przypadkowego błędu. Pozwala otoczyć pojedynczy wynik przedziałem, w którym z dużym prawdopodobieństwem leży wynik prawdziwy.

Jak SEM wiąże się z rzetelnością?

Odwrotnie: im wyższa rzetelność narzędzia, tym mniejszy standardowy błąd pomiaru. Doskonale rzetelny pomiar miałby SEM bliski zeru. Niska rzetelność oznacza szeroki przedział wokół każdego wyniku.

Jak interpretować pojedynczy wynik z uwzględnieniem SEM?

Nie jako punkt, lecz jako przedział. Zamiast „wynik to 24” mówi się „wynik mieści się prawdopodobnie między 21 a 27”. Dwa wyniki, których przedziały się nakładają, trudno uznać za realnie różne.