badania.org

Psychometria

Skala Likerta — jak ją zbudować i nie zepsuć pomiaru

dr Błażej Mroziński · adiunkt SWPS, psychometra

Opublikowano: · aktualizacja:

Skala Likerta to chyba najczęściej używane — i najczęściej źle używane — narzędzie w badaniach ankietowych. Pomysł jest prosty: respondent zaznacza, w jakim stopniu zgadza się ze stwierdzeniem. „Zdecydowanie nie”, „raczej nie”, „trudno powiedzieć”, „raczej tak”, „zdecydowanie tak”. Tyle teorii. Problemy zaczynają się przy konstrukcji i przy analizie.

Nazwa pochodzi od Rensisa Likerta, który w 1932 roku zaproponował, żeby zamiast jednego pytania zadać kilkanaście i zsumować odpowiedzi. To drugie jest ważniejsze od samej pięciostopniowej skali — a często się o tym zapomina.

Pozycja a skala — to nie to samo

Warto rozdzielić dwa pojęcia. Pozycja likertowska to pojedyncze stwierdzenie z odpowiedzią na skali zgody. Skala Likerta to zestaw takich pozycji, których wyniki sumujesz, bo wszystkie mierzą ten sam ukryty konstrukt — na przykład satysfakcję z pracy albo lęk.

Z tego rozróżnienia wynika cała reszta. Jedna pozycja niesie mało informacji i jest wrażliwa na przypadek. Kilkanaście dobrze dobranych pozycji uśrednia błąd i daje stabilny wynik. Dlatego pojedyncze „oceń od 1 do 5” to jeszcze nie psychometria — to termometr.

Ile punktów

Pierwszy: pięć albo siedem. Pięć wystarcza w większości badań terenowych i na urządzeniach mobilnych. Siedem daje trochę więcej rozdzielczości, gdy respondent jest zaangażowany i temat go dotyczy.

Drugi: parzysta czy nieparzysta. Nieparzysta zostawia środek dla osób bez zdania. Parzysta wymusza opowiedzenie się po którejś stronie — i kusi, bo „porządkuje” dane. Problem w tym, że część osób naprawdę nie ma zdania, a wymuszony wybór zamienia tę informację w szum.

Trzeci: etykiety. Opisuj słowem każdy punkt, nie tylko końce. „Raczej się zgadzam” znaczy dla wszystkich mniej więcej to samo; gołe „4” już niekoniecznie.

Jak liczyć wyniki

Tu pojawia się najstarszy spór w tej okolicy: czy dane z Likerta są porządkowe, czy ilościowe. Odpowiedź zależy od jednostki analizy.

Pojedyncza pozycja jest porządkowa. Odstęp między „raczej nie” a „trudno powiedzieć” nie musi być taki sam jak między „raczej tak” a „zdecydowanie tak”. Liczenie średniej z jednej pozycji i porównywanie jej testem t bywa więc nadużyciem — bezpieczniej sięgnąć po statystyki nieparametryczne albo modele dla zmiennych porządkowych.

Suma kilkunastu pozycji to inna historia. Zachowuje się na tyle „liniowo”, że w praktyce traktuje się ją jak zmienną ilościową — i większość metod parametrycznych działa na niej bez większej szkody. Warunek jest jeden: pozycje muszą rzeczywiście mierzyć ten sam konstrukt. Sprawdza się to rzetelnością i trafnością, a najprościej — współczynnikiem alfa Cronbacha.

Najczęstsze błędy

  • Mieszanie kierunków bez rekodowania. Jeśli część pozycji jest sformułowana „na odwrót”, trzeba je odwrócić przed sumowaniem. Inaczej zgoda i sprzeciw się znoszą.
  • Pytania podwójne. „Praca jest ciekawa i dobrze płatna” — na które z dwóch respondent ma odpowiedzieć? Jedna pozycja, jedna myśl.
  • Skala jako dekoracja. Pięć punktów pod każdym pytaniem nie czyni z ankiety narzędzia psychometrycznego. O jakości decyduje dobór pozycji i to, czy razem coś mierzą.

Skala Likerta jest dobra dokładnie na tyle, na ile przemyślano, co i po co się nią mierzy. Reszta to formularz. Jeśli budujesz narzędzie, które ma realnie różnicować ludzi i wytrzymać analizę — napisz, pomogę zaprojektować je od pozycji po normy.

Najczęstsze pytania

Ile punktów powinna mieć skala Likerta?

Najczęściej 5 lub 7. Pięć punktów wystarcza, gdy respondent odpowiada szybko i na telefonie; siedem daje nieco więcej zróżnicowania, gdy temat jest mu bliski. Powyżej siedmiu zysk informacyjny jest już mały, a obciążenie rośnie.

Czy zostawiać środkowy, neutralny punkt?

Zwykle tak. Wymuszony wybór bez środka podnosi odsetek braków i przypadkowych odpowiedzi u osób, które naprawdę nie mają zdania. Środek usuwaj tylko wtedy, gdy masz mocny powód i wiesz, jak zinterpretujesz jego brak.

Czy wynik skali Likerta można uśredniać?

Pojedyncza pozycja jest porządkowa — średnia z niej bywa myląca. Ale suma lub średnia z kilkunastu pozycji składających się na jedną skalę zachowuje się na tyle dobrze, że w praktyce traktuje się ją jak zmienną ilościową. Kluczowe jest, by pozycje rzeczywiście mierzyły to samo.