Statistiek
De volgende uitspraak wordt nogal eens gehoord: "Je hebt kleine leugens en grote leugens en ...... dan heb je nog statistiek." Het probleem zit echter niet in het verzamelen van de cijfers (die liegen immers niet) of het verwerken daarvan in statistische analyses; het probleem zit hem in de conclusies die er uit getrokken worden.
Daarom zul je, nadat je die conclusies hebt getrokken ook aan de praktijk moeten toetsen of die conlusies juist zijn. Een voorbeeld ter illustratie: in een organisatie met een theoretisch verzuimmanagement van 1,5 % is het verzuim in de maand januari 1 % en in de maand februari 2%. Op grond van de cijfers kun je vaststellen dat het verzuimpercentage is verdubbeld, wat nogal dramatisch klinkt. Als je er echter het theoretisch minimum van 1,5 % erbij vermeld, zie je dat de beide maanden een normaal beeld laten zien. Het is dus belangrijk die conclusies in de juiste context te zien.
Een ander voorbeeld: je meet je verzuim op basis van werkdagen en na vergelijking van enkele jaren concludeer je dat het verzuim hoger is in de maanden die op een maandag of dinsdag beginnen en juist lager is in de maanden die op een vrijdag of zaterdag beginnen. Je stelt nu dat mensen in maanden die op een maandag of dinsdag beginnen, gezonder zijn dan in die maanden die op een vrijdag of zaterdag beginnen. Natuurlijk klopt dat niet, het verschil wordt veroorzaakt door je methode van meten. Zo kunnen er gemakkelijk foute conclusies verbonden aan op zichzelf correcte uitkomsten.
Het CBS heeft een betrouwbaarheidstabel opgesteld voor verzuimcijfers. Die tabel geeft aan hoe betrouwbaar het gemeten verzuimcijfer is. Allereerst wordt daarin gekeken naar de gebruikte berekeningsmethode. Voorts wordt gekeken naar de periode waarover je terugkijkt, hoe langer die periode, hoe betrouwbaarder je cijfer. Het toeval wordt immers steeds verder naar de achtergrond gedrongen.
Dan is de grootte van de groep waarover je meet van belang. De afdeling Marketing in een organisatie bestaat uit 4 mensen. Een van die 4 mensen is de hele maand april ziek waardoor het percentage over die maand 25 % bedraagt. Dat geeft uiteraard een vertekend beeld. De minimale groepsgrootte waar je enigszins verantwoord over kunt meten is 50, maar bij voorkeur meet je over groepen die tenminste uit 100 personen bestaat.
In de vergelijkingen die je doet maakt het een groot verschil of je het gevonden verzuimcijfer vergelijkt ten opzichte van een andere groep mensen (bijvoorbeeld als je vergelijkt met landelijk gemiddelde) of ten opzichte van dezelfde groep over een eerdere periode. Dat laatste zal een veel nauwkeuriger beeld geven omdat ook de samenstelling van zo'n groep een behoorlijke invloed op het cijfer kan hebben.
Het CBS geeft aan dat wanneer gemeten wordt over een groep van tenminste 100 personen in een vergelijking met dezelfde groep over dezelfde periode en gebruik makend van de gevalideerde methode van berekenen (op basis van kalenderdagen en rekening houdend met parttime- en ziektepercentage) je nog altijd moet rekenen op een foutenkans van ongeveer 0,5 procentpunt. Dat betekent concreet dat je wanneer je in die situatie een verzuimpercentage van 5,5 % meet dit eigenlijk net zo goed 5,0 % of 6,0 % had kunnen zijn. Als het percentage dus de ene maand 5,1 % is en de volgende maand 5,9 % moet de conclusie dus zijn dat het waarschijnlijk nauwelijks is gestegen.
Verderop zullen we laten zien dat feitelijk andere grootheden veel belangrijker zijn dan het verzuimpercentage.