‘Corona-aanpak en datagedreven HR-beleid hebben veel gemeen’

De route naar succesvol datagedreven werken in HR
Zelfs als kabinet en RIVM goede data zouden hebben, dan nog zouden de corona-modellen last houden van onzekerheden. Bij datagedreven HR is dat niet anders. 

Je kan de krant niet openslaan of je leest iets over het beheersen van het coronavirus en al bijna net zo vaak is er weer een nieuw model ontwikkeld, dat uitbraken kan voorspellen of de gevolgen van covid-19 voor de economie. Ook de besluitvorming van het kabinet over de maatregelen is gebaseerd op modellen. Maar telkens blijken de aannames voor deze modellen niet te matchen met de werkelijkheid en moet de aanpak weer worden bijgesteld.

Te hoge inschattingen

Het kabinet gaat vaak uit van te hoge inschattingen. Bijvoorbeeld de groei van de beschikbare testcapaciteit, het aantal mensen dat zich wil laten testen; de beschikbare controlecapaciteit bij de GGD’s, de bereidheid van mensen om de afstandsregels in acht te nemen. Wat leert ons dat over de waarde van modellen en het toepassen van datagedreven besluitvorming? Wat zegt dat over HR-analytics?

Als er iets ontbreekt in de coronacrisis, zeker in het begin, dan wel (goede) historische data

Veel, zo niet alles! Allereerst leert ons dit dat elk model gebaseerd is op aannames en onzekerheden en we daarom nooit een perfecte voorspelling kunnen maken. En dat het lastig is om te voorspellen als er geen data beschikbaar is. Want alhoewel we allemaal de in de verzekerings- en beleggingswereld bekende disclaimer ‘In het verleden behaalde resultaten bieden geen garantie voor de toekomst’ kennen, heb je voor voorspellingen veelal wel data uit het verleden nodig. Hoe beter deze input, des te betrouwbaarder de voorspelling. En als er iets ontbreekt in de deze coronacrisis, zeker in het begin, is het wel (goede) historische data.

Perfecte historie

Maar ook als we (goede) data hebben moeten we bij het voorspellen rekening houden met onzekerheid. Alleen bij een perfecte historie kunnen we eenduidig voorspellen. Zodra er enige onregelmatigheid zit in de data uit het verleden vertelt de statistiek ons, terecht, dat we rekening moeten houden met een mate van (on)nauwkeurigheid en (on)betrouwbaarheid.

Sommigen maken de fout om voorspellen te verwarren met determineren. Alsof de voorspelling een feit is waar we zelf of ‘onvoorziene dingen’ geen invloed meer op hebben. Achteraf gezien is het tenslotte allemaal helder en duidelijk. Dan had het gisteren toch ook voorspeld moeten kunnen worden? Maar onvoorziene zaken die niet in het model zitten en juist activiteiten, die we starten naar aanleiding van die voorspelling, kunnen diezelfde voorspellingen niet of anders laten uitkomen. Je ontkomt er dan ook niet aan om modellen af en toe of regelmatig bij te stellen.

Van ‘worst case’ naar ‘best case’

Aan de andere kant geldt dat goed onderbouwde modellen ons wel een kijkje geven in wat er mogelijk op ons afkomt. En die onzekerheid kun je zien als scenario’s: van ‘worst case’ naar ‘best case’. Zo krijg je inzicht in de mogelijke toekomstscenario’s en kun je besluiten welke stappen in het betreffende scenario zinvol zijn.

Dus zo lang je rekening houdt met de zaken die inherent zijn aan voorspellen, kunnen goede modellen je veel voordeel en een zekere houvast bieden wanneer je aan de slag gaat met het beantwoorden van vragen, zoals: ‘hoeveel mensen met digitale skills hebben we na corona nodig?’, ‘hoe hoog wordt het ziekteverzuim als iedereen blijft thuiswerken?’ en ‘wat is het effect op onze cultuur en sfeer van corona?’. Met deze voorspellingen kun je vervolgens een beleid inrichten ten aanzien van thuiswerken of bijvoorbeeld je opleidingsbudget bepalen.

Hoe maak je dan een goed voorspellingsmodel?

Een goed model begint allereerst met een goed idee over hoe de werkelijkheid in elkaar zit: een theorie. Stel, je wilt voorspellen hoeveel mensen er in je organisatie over een jaar verzuimen door thuiswerken. Dan ga je eerst je vraag structureren ‘op papier’. Naar verwachting heeft verzuim (ziek zijn) iets te maken met ziek ‘worden’ (aantal) en ziek ‘blijven’ (duur). Idealiter heb je deze exacte gegevens in huis en kun je met de resultaten van nu (en het recente verleden) een voorspellend model bouwen. Maar veelal is dit iets te optimistisch gedacht.

Gelukkig zijn er ook andere manieren om je verder te helpen. Benchmarken is zo’n methode. Daarmee bedoel ik het zoeken naar ‘voorbeelden’ die vergelijkbaar zijn met je eigen situatie. Zo zie je in deze coronatijd dat landen veel naar elkaar kijken om te zien of de ontwikkeling in het andere land ‘herkenbaar’ is en bruikbaar is voor de eigen voorspellingen. Dit kun je natuurlijk ook doen voor je eigen organisatie met organisaties om je heen, met name uit je eigen branche.

Lastig voorspelbaar

Daarnaast helpt het vaak om, in plaats van meteen een totaal model te maken voor je gehele organisatie, je model op te splitsen. Je organisatie kent mogelijk heel verschillende soorten werk, zoals in de zorg bijvoorbeeld de medewerkers aan het bed versus de medewerkers op kantoor. De combinatie van die groepen is lastig voorspelbaar maar per groep is voorspellen waarschijnlijk een stuk makkelijker.

Vergeet niet dat ons beleid zelf, onze interventies, ook invloed hebben op de voorspelling

Zo zijn de meeste modellen over de verspreiding van corona gebaseerd op het idee dat er vier groepen mensen zijn: mensen die mogelijk besmet kunnen raken, mensen die besmet zijn maar nog geen symptomen vertonen, mensen die besmet en erg besmettelijk zijn én mensen die immuun zijn voor het virus. Door eerst voor iedere, homogene, groep een voorspelling te maken wordt een totaalmodel eenvoudiger en beter, gewoon door deze voorspellingen vervolgens bij elkaar op te tellen.

Beeldscherm-uren

Vervolgens ga je op zoek naar zaken die een relatie zouden kunnen hebben met ofwel het ziek worden oftewel de duur van het verzuim. Stel dat er een verband is met het aantal beeldscherm-uren, dan kun je wellicht beter eerst die uren voorspellen en daar het aantal nieuwe zieken per dag of per week uit afleiden. Op deze manier stel je de ‘ingrediënten’ van je model vast.

Zo zijn er rondom corona diverse variabelen vastgesteld die mogelijk invloed hebben op de verspreiding, zoals de afstand tussen mensen, de ventilatie in een ruimte, het aantal feestjes, enzovoort. Een belangrijke tip daarbij is om vooral je oogkleppen en oordoppen af te zetten wanneer je op zoek gaat daar mogelijke data die je kunnen helpen. Zo weten we inmiddels dat ons riool een goede voorspeller is van een corona-uitbraak. En dat is toch niet iets, waar je het eerste aan zou denken!

Raden naar de impact

En tot slot, en zeker niet te vergeten, dienen we erbij stil te staan dat ons beleid zelf, onze interventies invloed hebben op de voorspelling en dus onderdeel moeten worden van het model. En naar de precieze impact dáárvan is het vaak raden, want we weten nog niet hoe succesvol onze acties zullen zijn.

Voorspellen is dus niet eenvoudig, dat wil niemand beweren. Maar voorspellingen en scenario’s kunnen absoluut wel helpen om consensus te realiseren onder het management, waarmee ze een duidelijke strategie naar de toekomst kunnen creëren.

Irma Doze is data- en analytics-expert en samen met Toine Al auteur van het boek “Data-Driven HR: Creating Value with HR Metrics & HR Analytics”

HRTech1000.com is a brand new platform showcasing the best tech in HR. It enables professionals like you to source better software, gives exposure to HRTech companies and provides investors with leads and insights.