Joost Kerkhofs, expert reinforcement learning: “Gedrag veranderen? Stuur op positieve consequenties”

Wil je verandertrajecten tot een goed einde brengen en werkelijk de cultuur veranderen? Richt je dan op de positieve consequenties van gewenst gedrag van medewerkers en blijf dit bekrachtigen. Het C-level, inclusief de CHRO, moet die aanpak wel begrijpen en faciliteren. Aldus Joost Kerkhofs over de OBM-methode, gebaseerd op gedragswetenschappen, bedrijfskunde en neurowetenschap.

Beeld: Ton Zonneveld

Joost Kerkhofs maakte laatst nader kennis met ChatGPT, als leverancier moet hij immers op de hoogte zijn van de laatste ontwikkelingen bij organisaties. De generatieve vorm van kunstmatige intelligentie maakt een indrukwekkende opmars en lijkt niet te stuiten. Hij ontdekte dat de theoretische basis ervan dezelfde is als bij het reinforcement learning, dat hij praktiseert.

“Wat zegt bijvoorbeeld ‘meer eigenaarschap’ nou of ‘beter samenwerken’? Dat is geen gedrag, je kunt het niet meten.”

“Allebei gaat het om het leren van consequenties. Zo worden AI-modellen ook getraind; de moderatoren toetsen bij de gebruikers of het antwoord goed is, met een puntensysteem. Het is allemaal gebaseerd op ervaringsleer en zorgt ervoor dat je gewoontes kunt veranderen.”

Als traditionele consultant vroeg hij zich ruim vijftien jaar geleden af hoe nu echt gewenst gedrag te bestendigen. Want invliegen, de klus klaren met klassieke interventies en weer wegwezen was de routine, maar gaf weinig voldoening. De doelgroep verviel immers snel weer in het oude gedrag.

Hij kwam in contact met Marius Rietdijk, die aan de Vrije Universiteit (VU) in Amsterdam aan het promoveren was op de benadering OBM (Organizational Behavior Management). Daarmee maakte het Noord-Amerikaanse model zijn intrede in Nederland. Samen zetten ze aan de VU een expertisecentrum op het gebied van OBM op, met een post-graduate opleiding, dat zij twaalf jaar lang runden.

Zeven stappen

Nu traint en coacht Kerkhofs met zijn bureau Neotopia vooral ‘beïnvloeders’ binnen bedrijven en organisaties, met een onafhankelijk exameninstituut als partner. Hij verzorgt voornamelijk trajecten bij middelgrote en grote bedrijven, waaronder FrieslandCampina, Dura Vermeer, KPMG, Independer en Rijkswaterstaat.

OBM is een datagedreven benadering van gedragsverandering in organisaties en combineert gedragswetenschappen, bedrijfskunde en neurowetenschap. Het is volgens Kerkhofs dé oplossing om niet in oud gedrag terug te vallen. “Gedrag verander je door te sturen op positieve consequenties. De positieve bekrachtiging zorgt uiteindelijk voor een cultuur binnen een organisatie die ook maakt dat waardevolle mensen er willen werken.”

De aanpak kent zeven stappen: specificeren, meten van prestaties, gedragsanalyse, performance feedback, subdoelen stellen, positieve bekrachtiging en evalueren, bijsturen en concluderen. Kerkhofs: “Het stappenplan is de leidraad en we merken dat dit binnen bedrijven goed aanslaat. Veel mensen denken graag in termen van stappen.”

Optimaliseren van bedrijfsprestaties

Blijf tijdens de uitvoering van het stappenplan vooral niet hangen in ‘wazige termen’, waarschuwt hij. “Wat zegt bijvoorbeeld ‘meer eigenaarschap’ nou, en ‘beter samenwerken’? Dat is geen gedrag, je kunt het niet meten en is in iedere rol weer anders. Wij specificeren en concretiseren dat.”

De twee belangrijkste redenen waarom organisaties met OBM aan de slag gaan, zijn volgens Kerkhofs ambitie en urgentie. “Ze willen veiliger, productiever of klantvriendelijker werken. En een cultuur van continu verbeteren implementeren.” De vragen waarmee organisaties bij hem aankloppen hebben dus een duidelijk gemeenschappelijk doel: het optimaliseren van de bedrijfsprestaties.

“Het probleem is vaak dat de bedrijfstop wel in positieve consequenties denkt voor het bedrijf, maar niet voor de medewerkers.”

“Een prestatievraagstuk is altijd het startpunt. Organisaties willen bijvoorbeeld dat hun medewerkers hun vertrouwde routine loslaten en lean of agile gaan werken. En wat zou het fijn zijn wanneer mensen op tijd met hun urenregistratie komen. Of bedrijven willen dat hun medewerkers verbeterideeën aandragen.

“Of ze dat allemaal echt gaan doen, hangt af van de consequenties die het hen oplevert. Het probleem is vaak dat de bedrijfstop wel in positieve consequenties denkt voor het bedrijf, maar niet voor de medewerkers. En alleen positieve consequenties voor medewerkers bestendigen het gedrag. Dan komt dopamine vrij, dat werkt.”

Case: de tilhulp

Een concreet voorbeeld uit het portfolio van Kerkhofs: een luchtvaartmaatschappij schakelde zijn hulp in om medewerkers zich beter aan alle procedures en voorschriften te laten houden die gelden bij het werk in het vliegtuig en op de luchthaven. “Of de mensen zich daaraan houden, wordt door de context van alledag beïnvloed. Een vliegtuig moet bijvoorbeeld op tijd de lucht in, en dat kan ten koste gaan van de veiligheidsprocedures.”

Een bovendrijvend probleem was dat de mechanische tilhulp door de bagage-afhandelaars maar mondjesmaat werd gebruikt. “Het was niet stoer en niet snel genoeg, vonden de meeste medewerkers. Dat was allemaal op misvattingen gebaseerd.” Kerkhofs leerde zijn klant te focussen op diegenen die de tilhulp wél gebruikten. Na gesprekken waren andere medewerkers ook bereid om mee te doen.

“Toen bleek dat die medewerkers zich ’s avonds beter voelden en geen last van hun rug meer hadden. Dat zijn dan de positieve consequenties.” Het groeide uit tot een omvangrijk programma. Na drie maanden is de 30 procent van de medewerkers die het gebruikte bij de nulmeting uitgegroeid tot bijna 100 procent. “Een mooi resultaat, maar nog niet goed genoeg voor de Arbeidsinspectie.”

Positieve consequenties

Het gedragsonderzoek spitste zich toe op de vraag ‘waarom gebruikt maar 30 procent de tilhulp?’. “Dat is vanuit organisatorisch perspectief onverklaarbaar, maar het levert de niet-gebruikers op de korte termijn meer voordeel op”, luidt het antwoord. “Het gaat in hun ervaring sneller en ze hebben geen hulpmiddel nodig. Dat zijn positieve consequenties.

“De verandering kunnen ze rationeel nog wel bevatten, maar voor een brein betekent het onzekere toekomstige consequenties. Dat maakt kortsluiting en terugval in het oude gedrag.” Hoe zulk vastgeroest gedrag om te buigen? “Door echt in gesprek te gaan met de mensen, dat is cruciaal. Zo ontdekken we de belemmerende en de motiverende factoren.

De medewerkers waren blij verrast dat hen naar de reden gevraagd werd waarom ze het hulpmiddel niet gebruikten.” Het tonen van de vooruitgang aan de medewerkers door middel van meetresultaten op flatscreens in de werkruimte was een belangrijke interventiestap. Maar als belangrijkste interventie noemt Kerkhofs het trainen van leidinggevenden in het toepassen van de zeven stappen.

“Het is pas een compliment wanneer de ontvanger het als compliment ervaart en dat vereist een fingerspitzengefühl dat je moet ontwikkelen”

‘Presteerders op heterdaad waarderen’, is een onmisbaar onderdeel daarvan. “Let op wat er goed gaat en reageer daar zo snel mogelijk op. En dat moet oprecht zijn. Want het is pas een compliment wanneer de ontvanger het als compliment ervaart. Het moet passen bij de ontvanger en dat vereist een fingerspitzengefühl dat je moet ontwikkelen. De een moet je even apart nemen, de ander staat graag in het middelpunt van de belangstelling en vindt het juist fijn in de groep aangesproken te worden.”

“De echte magie zit hem erin hoe je als leider met je medewerkers bezig bent. Dat is een traject dat je kunt leren, en daar helpen wij bij als trainer-coaches.”
Stapsgewijs de groep meekrijgen, voortborduren op wat er goed gaat en het behalen van subdoelen vieren, is het devies. “Ook de pogingen er te komen moet je positief waarderen.”

Ambassadeurs vervullen een sleutelrol

Ambassadeurs vervullen een sleutelrol in de benadering. “De aandacht van leidinggevenden moet vooral niet uitgaan naar de non-performers, wel naar de positieve gevallen. Van die mensen creëer je ambassadeurs die anderen gaan overtuigen.” Hij verwijst naar een populair filmpje van een eenzame danser in blote bast. Die werd even uitgelachen maar na drie minuten is het festivalterrein een dansende meute.

“Mensen zijn ook sociale dieren. Ze zijn heel erg alert op wat de rest van de groep doet.” Hij noemt het een grote misvatting dat de meerderheid van een groep nodig is voor verandering, en verwijst daarbij ook naar het voorbeeld van de tilhulp op de luchthaven. De ambassadeurs (zoals de eerste volgers van de eenzame danser) zetten de revolutie in gang.

“Het brein heeft af en toe bevestiging nodig dat het nog deugt om iets op de juiste manier te doen”

Na de medewerkers ziet hij de leidinggevenden als belangrijkste beïnvloeders, maar ook de senior-managers en de top van het bedrijf neemt hij mee in het verandertraject. Het gaat om de gelaagdheid. “Het liefst beginnen we zo hoog mogelijk.

Het is belangrijk dat ze in de top begrijpen dat ze ook een rol spelen in het positief bekrachtigen van alle lagen van het personeel. Ze moeten faciliteren en begrijpen. De teamleider gaat de werkvloer op, de manager moet hem in staat stellen dit te doen en de manager moet weer door het senior-management worden gestimuleerd en bevraagd.”

Dopaminekickje

Zo traint hij nu personeel op executive level – ook de HR-directeur – bij een groot bedrijf in de voedingsindustrie. “We geven een workshop, zodat ze niet per ongeluk de interventies gaan dwarsbomen, omdat ze niet begrijpen wat er gebeurt. We leren leiders hoe ze het beste uit hun mensen kunnen halen en we lopen niet continu zelf rond bij de klant om de klus te klaren.”

Een van de interventies om nieuw, aangeleerd gedrag te bestendigen is een beloningsschema, een schedule of reinforcement. “Dat is een veelgebruikt en wetenschappelijk bewezen schema uit de toegepaste gedragsanalyse en voorkomt dat de stimulans wegvalt. Het brein heeft af en toe bevestiging nodig dat het nog steeds deugt om iets op de juiste manier te doen.”

Bij al dat belonen (complimenten, schouderklopjes, extraatjes) ligt verzadiging op de loer. “Daarom is er een techniek met een onderbroken schema. Je weet dat de beloning gaat komen, maar niet wanneer. Dan blijf je op zoek naar die bevestiging, naar dat dopaminekickje. Zoals: ‘Toch fijn dat je weer je oordoppen indoet’. Het is prettig voor het brein om een bevestiging te krijgen.”

Lees hier de complete editie van CHRO Magazine 1 – 2024