Dit artikel is een update op ons eerdere artikel: “Generatieve AI rukt op in de overheid”. In deze update verwerken we recente onderzoeken, discussies en beleidsontwikkelingen rondom de inzet van chatbots en generatieve AI binnen gemeenten.
De versnelling is realiteit geworden
In ons eerdere artikel constateerden we al dat generatieve AI snel terrein wint binnen de overheid. Inmiddels is dat geen verwachting meer, maar realiteit.
Uit de Overheidsbrede Monitor Generatieve AI (TNO) blijkt dat het aantal toepassingen is gegroeid van 8 naar 81 in één jaar tijd. Gemeenten zijn hierin koploper, met name door de inzet van chatbots en digitale assistenten.
Daarmee verschuift de vraag:
Niet meer óf de overheid generatieve AI gebruikt, maar hoe verantwoord deze wordt ingezet.
Nieuwe realiteit: scherpe kritiek op gemeentelijke chatbots
De recente discussie, aangejaagd door onderzoek van Wiep Hamstra en Jules Ernst, laat zien dat de praktijk nog niet aansluit bij deze groei.
Belangrijkste bevindingen:
- Slechts 10% van de vragen wordt correct beantwoord
- 64% van de antwoorden is fout
- Doorverwijzingen worden vaak als incorrect beoordeeld
Deze resultaten leidden tot stevige reacties in de markt. Zo stelt Renata Verloop (bron: Ziptone):
“Als je als overheid een tool inzet die geen betrouwbare antwoorden geeft, maak je het probleem groter in plaats van kleiner.”
En nog scherper:
Gemeenten zouden gebrekkige chatbots moeten uitzetten.
Ook in andere vakmedia wordt de impact benadrukt:
- Chatbots kunnen het vertrouwen van inwoners ondermijnen
- Menselijke controle op AI-output is noodzakelijk
Tegengeluid: meten we wel het juiste?
Tegelijk ontstaat er een belangrijke nuance in de discussie (o.a. vanuit praktijkexperts en gemeenten):
De vraag is niet alleen:
- “Is het antwoord correct?”
Maar ook:
- “Is de inwoner geholpen?”
Dit raakt een fundamenteel onderscheid:
Perspectief | Vraag |
|---|---|
Communicatie | Is het antwoord begrijpelijk en netjes? |
Dienstverlening | Heeft de inwoner zijn doel bereikt? |
Een chatbot die doorverwijst kan dus:
- communicatief “fout” scoren
- maar dienstverlenend wél waarde leveren
Maar: voor de inwoner is dit één ervaring
Hoewel dit onderscheid inhoudelijk klopt, is het in de praktijk onvoldoende.
Voor een inwoner geldt simpelweg:
“Ben ik geholpen en kan ik hierop vertrouwen?”
Onderzoek naar publieke chatbots bevestigt dit spanningsveld:
- Gebrek aan transparantie en interpretatieproblemen
- Moeite met vertrouwen en context
Daarmee ontstaat een cruciaal inzicht:
Communicatiekwaliteit en dienstverleningskwaliteit zijn in de publieke sector onlosmakelijk verbonden.
De echte oorzaak: gebrek aan governance
Wat opvalt in zowel onderzoek als praktijk:
De problemen zitten zelden in de technologie zelf.
Ze ontstaan door de manier waarop organisaties deze inzetten.
Ziptone verwoordt dit scherp:
De kwaliteit van chatbots zegt vooral iets over hoe gemeenten omgaan met de technologie, niet over de technologie zelf.
Tegelijkertijd stimuleren overheid en VNG juist actieve inzet van generatieve AI:
- Snellere dienstverlening
- Betere toegankelijkheid
- Efficiëntere processen
Maar onder duidelijke voorwaarden:
- risicoanalyse
- toezicht en governance
- gebruik van betrouwbare modellen
De realiteit:
Technologie wordt sneller opgeschaald dan governance wordt ingericht.
Chatbots zijn geen experiment meer
We hebben te maken met een belangrijk kantelpunt: Een chatbot op een gemeentelijke website is geen pilot maar een volwaardig dienstverleningskanaal.
Dat betekent dat dezelfde eisen gelden als bij telefonie, baliecontact, e-mail en andere interacties.
En dus moet voldoen aan:
- betrouwbare informatie
- duidelijke communicatie
- juiste doorverwijzing
- menselijke escalatie
Zonder deze basis ontstaat een risico:
Je experimenteert niet met technologie, maar met vertrouwen van inwoner
Wat vraagt dit van gemeenten?
De volgende stap is niet méér technologie, maar betere inrichting.
1. Heldere afbakening
Niet elke vraag hoort bij een chatbot:
- wel: eenvoudige vragen, processen, status
- niet: complexe, interpretatieve of risicovolle vragen
2. Integraal kwaliteitskader
Niet alleen meten:
- correctheid
Maar ook:
- begrip van de vraag
- effectiviteit van het antwoord
- vertrouwen en duidelijkheid
- herleidbaarheid van informatie
3. Continue monitoring
Kwaliteit is geen momentopname, maar een proces.
TNO benoemt dit expliciet als uitdaging:
Het evalueren en meten van AI-prestaties blijft complex en onderontwikkeld.
Van chatbot naar gespreksregie
Hier ligt volgens huXam de echte doorbraak.
Succesvolle organisaties sturen niet op:
- technologie
- tooling
- features
Maar op:
gesprekskwaliteit en regie
Daarom ontwikkelen we oplossingen zoals: huXam Gespreksregie.
Waarbij organisaties:
- gesprekken structureel meten
- communicatie en dienstverlening combineren
- kwaliteit aantoonbaar verbeteren
- en regie houden over alle kanalen, inclusief chatbots
De toekomst: streng én kansrijk
De richting is duidelijk:
- Generatieve AI blijft groeien binnen de overheid
- Gemeenten blijven experimenteren
- Maar de eisen worden strenger
De overheid zelf zegt het eigenlijk al:
Innovatie mag, mits verantwoord en beheerst.
Conclusie: vertrouwen is de echte KPI
De discussie over gemeentelijke chatbots raakt de kern van publieke dienstverlening:
Kunnen inwoners vertrouwen op de informatie die zij krijgen?
Dat vraagt niet om:
- stoppen met chatbots
- of blind doorgaan
Maar om:
aantoonbare kwaliteit, geborgd in governance en regie





