badania.org

Psychometria

Normy testowe — dlaczego surowy wynik sam nic nie znaczy

dr Błażej Mroziński · adiunkt SWPS, psychometra

Opublikowano: · aktualizacja:

Wyobraź sobie, że ktoś mówi ci: „uzyskałem 34 punkty”. I co z tego? Czy to dużo, mało, niepokojąco? Bez punktu odniesienia ta liczba nie znaczy nic. Tym punktem odniesienia są normy testowe.

Surowy wynik jest niemy

Wynik surowy to po prostu liczba punktów, które badany zdobył — suma odpowiedzi, trafień, potwierdzeń. Sam w sobie nie mówi, czy jest wysoki, czy niski, bo nie ma do czego go przyłożyć.

Trzydzieści cztery punkty na skali, której maksimum to 40, brzmią wysoko. Ale jeśli niemal wszyscy badani uzyskują 35–38, to 34 jest poniżej przeciętnej. Liczba ożywa dopiero w kontekście rozkładu wyników innych ludzi.

Grupa odniesienia

Tym kontekstem jest grupa odniesienia — reprezentatywna próba osób, na której wcześniej zebrano i opisano rozkład wyników. Wynik badanego porównuje się z tą grupą: „wypada lepiej niż 80 procent osób w jego wieku”, „mieści się w przeciętnym przedziale”.

Kluczowe słowo to adekwatna. Wynik nastolatka czyta się względem norm dla nastolatków, nie dla dorosłych. Norma musi pasować do osoby pod względem tych cech, które realnie wpływają na wynik — najczęściej wieku, czasem płci, czasem poziomu wykształcenia. Porównanie z niewłaściwą grupą daje liczbę poprawną technicznie, a fałszywą interpretacyjnie.

Jak wynik trafia na skalę

Surowy wynik przelicza się na skalę znormalizowaną, która od razu mówi o pozycji względem grupy. Najpopularniejsze w polskich narzędziach są steny, gdzie środek to 5–6, a skraje to wyniki rzadkie. Inną drogą są centyle, które wprost podają, jaki odsetek osób uzyskał wynik nie wyższy.

Niezależnie od skali zasada jest ta sama: liczba na wyjściu mówi, gdzie badany stoi na tle grupy, a nie ile „bezwzględnie” ma cechy.

Normy się starzeją

To najczęściej pomijany problem. Normy nie są wieczne — są fotografią populacji z momentu, w którym je zebrano. A populacja się zmienia.

Klasyczny przykład to przesuwanie się przeciętnego wyniku w czasie: to, co dekadę temu było wynikiem przeciętnym, dziś bywa poniżej średniej, bo cała populacja „przesunęła się” w górę. Jeśli interpretujesz dzisiejszy wynik względem starych norm, systematycznie się mylisz — i to w jedną stronę.

Stąd dwa praktyczne pytania przy każdym narzędziu: kiedy zebrano normy i na kim. Norma sprzed dwudziestu lat, zebrana na innej populacji niż badany, potrafi zamienić rzetelny pomiar w mylącą etykietę.

Normy powstają w procesie normalizacji testu — i właśnie jakość tego procesu decyduje, czy interpretacja wyniku jest warta zaufania. Jeśli budujesz narzędzie i potrzebujesz norm na adekwatnej, dobrze dobranej próbie — albo chcesz ocenić, czy normy gotowego testu są jeszcze aktualne — odezwij się.

Najczęstsze pytania

Po co testowi normy?

Surowy wynik — liczba punktów — sam w sobie nic nie znaczy. Dopiero porównanie z grupą odniesienia mówi, czy jest niski, przeciętny czy wysoki. Normy są tym tłem, na którym wynik nabiera sensu.

Czym jest grupa odniesienia?

To reprezentatywna próba osób, na której oszacowano rozkład wyników. Wynik badanego interpretuje się względem tej grupy — na przykład: lepszy od 80 procent osób w jego wieku.

Czy normy się starzeją?

Tak. Rozkład cech w populacji zmienia się z czasem, więc normy sprzed wielu lat mogą zafałszować interpretację. Dlatego sprawdza się, kiedy normy zebrano i czy grupa odniesienia pasuje do badanej osoby.