Kodowanie danych – pytania otwarte. Część II – Jacek Kobyliński

Jacek Kobyliński
specjalista, KOWEZiU
e-mail: j.kobylinski@koweziu.edu.pl

W części pierwszej artykułu pt. Kodowanie danych – pytania zamknięte omówiono kodowanie różnego rodzaju pytań zamkniętych. Ich prawidłowe zakodowanie nie powinno być dla nikogo specjalnie trudne. Należy pamiętać o kilku podstawowych regułach, których należy się trzymać. Są nimi prostota i logiczny dobór kodów. Kodowanie pytań otwartych jest znacznie trudniejsze.

Każdy, kto kiedykolwiek zastosował otwarte pytanie w ankiecie, zdaje sobie sprawę z trudności jego późniejszej analizy. Respondenci wpisują różne odpowiedzi, czasem w ogóle nie związane z tematyką pytania. Ponadto w jednym pytaniu może się pojawić kilka problemów, których nam – badaczom nie wolno pominąć. Listę kodów do pytania otwartego należy utworzyć przed jego analizą – zasada tworzenia listy kodów do pytań zamkniętych została już omówiona. Jednak w tej kwestii istnieje duża różnica pomiędzy pytaniami zamkniętymi a otwartymi. W przypadku tych pierwszych książka kodowa może zostać opracowana na podstawie samego tylko kwestionariusza ankiety. Z góry znamy pytania oraz możliwe odpowiedzi. W zasadzie kodowanie polega wtedy na „dopasowaniu” odpowiedzi respondenta do odpowiednich kodów.

Lista kodów w pytaniu otwartym nie jest w żaden sposób ograniczona – „sztywna” i zależy tylko i wyłącznie od sugestii badacza. Jej wybór powinien być związany z celem badawczym. Właściwie schemat kodowania można zarówno rozbudować jak i maksymalnie uprościć. Wszystko zależy od specyfiki badania, „ważności” pytania oraz informacji, jakie chcemy uzyskać. Jeśli kodowane pytanie nie jest znaczące w badaniu, należy dążyć do uproszczenia listy możliwych odpowiedzi. To bardzo przyspieszy późniejszą analizę danych. Zanim ułożymy listę kodów należy pamiętać o jej starannym przemyśleniu, gdyż późniejsze zmiany lub modyfikacje są dopuszczalne, ale mogą być uciążliwe.

Podczas układania książki kodów do pytania otwartego obowiązuje kilka zasad, których należy przestrzegać:

1. Kody powinny się nawzajem wykluczać. Nie powinna zaistnieć taka sytuacja, w której jedna odpowiedź pasuje do kilku kategorii. W takim przypadku zachodzi podejrzenie, że kategorie są źle skonstruowane.

2. Odpowiedzi zawierające zróżnicowane treści należy rozbić na mniejsze fragmenty, które powinny być spójne tematycznie. Dopiero po ich wydzieleniu można przystąpić do procesu kodowania, który ilustruje przykład 1.

Przykład 1.

Pytanie 1. Jakie czynniki brał Pan/brała Pani pod uwagę formułując wymagania edukacyjne z własnego przedmiotu?

………………………………………………………………………………………..

………………………………………………………………………………………..

Na pytanie 1. respondent w ankiecie udzielił następującej odpowiedzi:

Brałem pod uwagę własne doświadczenie, a także konsultowałam się z innymi kolegami nauczycielami…

Odpowiedź składa się z dwóch części: „brałem pod uwagę własne doświadczenie” i „konsultowałam się z innymi kolegami nauczycielami”. Jeżeli te dwie części wypowiedzi są dla badacza ważne i ma do każdej z nich przyporządkowany kod, należy je przekształcić na wartości kodowe.

3. Kody powinny być na tyle ogólne, żeby zawierały wszystkie przypadki, które poruszają daną kwestię.

W celu utworzenia listy kodów do pytania otwartego należy przejrzeć kwestionariusze ankiet i sprawdzić, jakie padają odpowiedzi. Jeżeli mamy przebadaną dużą populację, to wybieramy około 10-15% ankiet i na ich podstawie układamy kody. Jeśli nasza próba badawcza nie była liczna (kilkadziesiąt osób) musimy przeanalizować wszystkie przypadki. Należy liczyć się z tym, że kody wstępnie ustalone nie będą ostateczne. W trakcie wpisywania kodów odpowiedzi z kolejnych ankiet może się okazać, że zastosowane przez nas kody są zbyt szczegółowe i nie pozwalają na statystyczną analizę. Kodowanie pytania otwartego to swego rodzaju „balansowanie” między uwzględnieniem możliwości analizy statystycznej, a zagrożeniem spłycenia poruszanych tematów. Zbyt szczegółowe kody mogą doprowadzić do problemów z ich późniejszą analizą statystyczną. Innym niebezpieczeństwem jest stworzenie zbyt ogólnych kategorii, które niwelują szczegółowość danych.

Poniżej przedstawiono przykład kodowania pytania otwartego. Oczywiście, zostało ono bardzo uproszczone w celu ogólnego zilustrowania całego procesu.

Przykład 2.

Pytanie 2. Co chciałbyś/chciałabyś zmienić w placówce, do której uczęszczasz?

Na pytanie 2. respondenci udzielili wielu odpowiedzi:

(…) Większe sale.
Ogólnie warunki są złe.
Nauczycieli – w ogóle ich nie rozumiem.
Obniżyć wymagania.
Dyrektor szkoły jest wiecznie nieosiągalny – chciałbym, żeby każdy miał do niego dostęp.
Wprowadzić ciekawsze zajęcia: może jakieś kółko teatralne?
Za brudne łazienki.
Dłuższe przerwy.
Na stołówce jest bardzo niesmaczne jedzenie.
Więcej książek w bibliotece, nigdy nie mogę dostać wymaganych lektur. (…)

Odpowiedzi na pytanie 2. są zróżnicowane. Dlatego kolejnym krokiem badacza jest zastanowienie się nad kodami do tego pytania. Istnieje wiele schematów kodowania. Oczywiście ich zakres jest zdeterminowany przez konkretny przypadek badawczy, a więc rozwiązanie przedstawione poniżej jest tylko przykładem. Analizując odpowiedzi ankietowanych można (zgodnie z własną procedurą badania) dokonać wstępnego podziału tematyki.

Załóżmy, że interesuje nas pojawienie się (lub brak) kwestii związanych z dydaktyką i tematyką pozadydaktyczną. Zgodnie z tym założeniem uzyskane odpowiedzi można zakwalifikować w następujący sposób.

Większe saleniedydaktyczna.
Ogólnie warunki są złeniedydaktyczna.
Nauczycieli – w ogóle ich nie rozumiemdydaktyczna.
Obniżyć wymaganiadydaktyczna.
Dyrektor szkoły jest wiecznie nieosiągalny – chciałbym, żeby każdy miał do niego dostępdydaktyczna.
Wprowadzić ciekawsze zajęcia: może jakieś kółko teatralne?dydaktyczna.
Za brudne łazienkiniedydaktyczna.
Dłuższe przerwyniedydaktyczna.
Na stołówce jest bardzo niesmaczne jedzenieniedydaktyczna.
Więcej książek w bibliotece, nigdy nie mogę dostać wymaganych lekturdydaktyczna.

Wstępny podział treści przyniósł następujące rezultaty:

 • kwestie dydaktyczne:
 •       – 5 wskazań,
 • kwestie niedydaktyczne:
 •   – 5 wskazań.

  Skonstruowanie dwóch kodów i zakwalifikowanie do nich wszystkich odpowiedzi wskazanych przez respondentów może, choć nie musi, zakończyć proces kodowania. Można pójść krok dalej i dokonać podziału tematyki niedydaktycznej przykładowo na administrację i infrastrukturę.

  Większe saleinfrastruktura.
  Ogólnie warunki są złeinfrastruktura.
  Za brudne łazienkiadministracyjna.
  Dłuższe przerwyadministracyjna.
  Na stołówce jest bardzo niesmaczne jedzenieadministracyjna.

  Odpowiedzi na pytanie 2., po wprowadzeniu kodów „dydaktyka”, „administracja” i „infrastruktura”, przedstawiają się następująco – tematyka:

 • dydaktyczna:
 •       – 5 wskazań,
 • administracyjna:
 •       – 3 wskazania,
 • infrastruktury:
 •       – 2 wskazania.

  Powyżej podany przykład 2. kodowania pytania otwartego jest tylko jedną z wielu alternatyw. Gdyby w pytaniu padło więcej odpowiedzi, można by było zastosować zupełnie inny sposób kodowania, np.:

 • organizacja pracy:
 •       – 7 wskazań,
 • administracja:
 •       – 4 wskazania,
 • większa samodzielność:
 •       – 2 wskazania,
 • dłuższe przerwy:
 •       – 1 wskazanie,
 • itp. (…)
 •        

  Zastosowanie pytań otwartych w kwestionariuszu ankiety bardzo wzbogaca narzędzie badawcze. Uzyskujemy odpowiedzi, których często nie moglibyśmy otrzymać przy zastosowaniu typowego pytania zamkniętego. Respondenci mogą wskazać na problematykę, której wcześniej nie rozważaliśmy konstruując ankietę. Nie należy jednak zapominać, że analiza pytań otwartych nastręcza wiele trudności. Jedną z nich jest ich kodowanie.


  Bibliografia
  Babbie Earl: Badania społeczne w praktyce. Warszawa: PWN, 2004.

  Dodaj komentarz