badania.org

Psychometria

Efekt Flynna — dlaczego normy testów inteligencji się starzeją

dr Błażej Mroziński · adiunkt SWPS, psychometra

Opublikowano: · aktualizacja:

Efekt Flynna to jeden z tych wyników, które na pierwszy rzut oka brzmią jak ciekawostka, a w praktyce uderzają w sam fundament pomiaru inteligencji. Mówi prostą, kłopotliwą rzecz: te same zadania z czasem rozwiązywane są coraz lepiej. A skoro tak, to liczby, którymi opisujemy inteligencję, mają datę ważności.

Co to jest

Efekt Flynna to obserwowany w populacji wzrost surowych wyników testów inteligencji w czasie. Nazwany od Jamesa Flynna, który zebrał i opisał to zjawisko na danych z wielu krajów. Wniosek był spójny: przez większą część XX wieku kolejne roczniki uzyskiwały na tych samych testach coraz wyższe wyniki surowe — i to systematycznie, rok po roku.

Słowo „surowe” jest tu kluczowe. Mowa o liczbie poprawnie rozwiązanych zadań, zanim przeliczy się ją na iloraz inteligencji. To właśnie ta liczba rosła.

Dlaczego to problem dla norm

Tu zaczyna się sedno, bo efekt Flynna zderza się z naturą ilorazu inteligencji. IQ nie jest bezwzględną miarą czegokolwiek — to wynik względem grupy odniesienia. Liczba 100 znaczy „przeciętnie jak w grupie, na której wyznaczono normy”. Cała interpretacja wisi na tej grupie.

Teraz złóż jedno z drugim. Jeśli populacja przesuwa się w górę, a normy pozostają stare, to badany jest porównywany do grupy słabszej, niż jest naprawdę. W efekcie wypada zawyżony — nie dlatego, że jest wybitny, lecz dlatego, że miara go do kogo innego przykłada. Im starsze normy, tym większe to zafałszowanie.

To nie błąd testu. To skutek tego, że świat, do którego test porównuje, zmienił się od czasu, gdy normy powstały.

Konsekwencja: normy mają datę ważności

Z efektu Flynna płynie jeden twardy wniosek praktyczny: normy się starzeją i wymagają okresowej aktualizacji. Test, którego normy wyznaczono dekady temu, systematycznie zawyża wyniki — i robi to po cichu, bo liczba w raporcie wygląda tak samo wiarygodnie jak zawsze.

Lekarstwo jest jedno: ponowna normalizacja na świeżej, reprezentatywnej próbie. Wyznacza się nowy rozkład wyników w aktualnej populacji i na nowo kalibruje przeliczanie surowych punktów na IQ. Dopiero wtedy 100 znów znaczy „przeciętnie dziś”, a nie „przeciętnie kiedyś”. To jest realny, kosztowny powód, dla którego rzetelne narzędzia inteligencji wymagają cyklicznego odświeżania norm.

Co efekt Flynna mówi, a czego nie

Warto być tu ostrożnym. Wzrost surowych wyników nie oznacza wprost, że ludzie stają się mądrzejsi w jakimś głębokim, ogólnym sensie. Przyrost jest nierówny — najsilniejszy na pewnych typach zadań, słabszy lub żaden na innych. Najczęściej wiąże się go ze zmianami w edukacji, w środowisku, w obyciu z abstrakcyjnymi zadaniami i z samym formatem testów, a nie z biologicznym skokiem zdolności.

Co więcej, w części krajów efekt w ostatnich dekadach wyhamował, a gdzieniegdzie pojawiły się sygnały odwrotnego trendu. To otwarte pole badań — i kolejny powód, by traktować normy jako coś żywego, a nie ustalonego raz na zawsze.

Praktyczny morał jest niezależny od tych sporów: jeśli pracujesz z wynikiem inteligencji, zawsze sprawdzaj, z którego roku pochodzą normy. Korzystasz z narzędzia o starych normach albo planujesz renormalizację i chcesz zrobić to porządnie? Napisz — pomogę ocenić, jak bardzo wiek norm zaburza twoje wyniki.

Najczęstsze pytania

Na czym polega efekt Flynna?

To obserwowany w populacji wzrost surowych wyników testów inteligencji z pokolenia na pokolenie. Kolejne roczniki rozwiązują te same zadania nieco lepiej, co przez większą część XX wieku dawało systematyczny przyrost mierzonych wyników.

Dlaczego efekt Flynna każe aktualizować normy?

Bo iloraz inteligencji to wynik względem grupy odniesienia. Jeśli populacja przesuwa się w górę, a normy zostają stare, każdy wypada zawyżony względem nieaktualnego punktu odniesienia. Tylko ponowne wyznaczenie norm to koryguje.

Czy efekt Flynna oznacza, że ludzie są mądrzejsi?

Niekoniecznie w sensie ogólnej zdolności. Rośnie głównie wynik na pewnych typach zadań, co wiąże się raczej ze zmianą edukacji, środowiska i obycia z testami niż z biologicznym wzrostem inteligencji. To ostrożna interpretacja.