Update: Generatieve AI in de overheid: van experiment naar aantoonbare kwaliteit

Dit artikel is een update op ons eerdere artikel: “Generatieve AI rukt op in de overheid”. In deze update verwerken we recente onderzoeken, discussies en beleidsontwikkelingen rondom de inzet van chatbots en generatieve AI binnen gemeenten.

De versnelling is realiteit geworden

In ons eerdere artikel constateerden we al dat generatieve AI snel terrein wint binnen de overheid. Inmiddels is dat geen verwachting meer, maar realiteit.

Uit de Overheidsbrede Monitor Generatieve AI (TNO) blijkt dat het aantal toepassingen is gegroeid van 8 naar 81 in één jaar tijd. Gemeenten zijn hierin koploper, met name door de inzet van chatbots en digitale assistenten.

Daarmee verschuift de vraag:

Niet meer óf de overheid generatieve AI gebruikt, maar hoe verantwoord deze wordt ingezet.

Nieuwe realiteit: scherpe kritiek op gemeentelijke chatbots

De recente discussie, aangejaagd door onderzoek van Wiep Hamstra en Jules Ernst, laat zien dat de praktijk nog niet aansluit bij deze groei.

Belangrijkste bevindingen:

Slechts 10% van de vragen wordt correct beantwoord
64% van de antwoorden is fout
Doorverwijzingen worden vaak als incorrect beoordeeld

Deze resultaten leidden tot stevige reacties in de markt. Zo stelt Renata Verloop (bron: Ziptone):

“Als je als overheid een tool inzet die geen betrouwbare antwoorden geeft, maak je het probleem groter in plaats van kleiner.”

En nog scherper:

Gemeenten zouden gebrekkige chatbots moeten uitzetten.

Ook in andere vakmedia wordt de impact benadrukt:

Chatbots kunnen het vertrouwen van inwoners ondermijnen
Menselijke controle op AI-output is noodzakelijk

Tegengeluid: meten we wel het juiste?

Tegelijk ontstaat er een belangrijke nuance in de discussie (o.a. vanuit praktijkexperts en gemeenten):

De vraag is niet alleen:

“Is het antwoord correct?”

Maar ook:

“Is de inwoner geholpen?”

Dit raakt een fundamenteel onderscheid:

Perspectief	Vraag
Communicatie	Is het antwoord begrijpelijk en netjes?
Dienstverlening	Heeft de inwoner zijn doel bereikt?

Een chatbot die doorverwijst kan dus:

communicatief “fout” scoren
maar dienstverlenend wél waarde leveren

Maar: voor de inwoner is dit één ervaring

Hoewel dit onderscheid inhoudelijk klopt, is het in de praktijk onvoldoende.

Voor een inwoner geldt simpelweg:

“Ben ik geholpen en kan ik hierop vertrouwen?”

Onderzoek naar publieke chatbots bevestigt dit spanningsveld:

Gebrek aan transparantie en interpretatieproblemen
Moeite met vertrouwen en context

Daarmee ontstaat een cruciaal inzicht:

Communicatiekwaliteit en dienstverleningskwaliteit zijn in de publieke sector onlosmakelijk verbonden.

De echte oorzaak: gebrek aan governance

Wat opvalt in zowel onderzoek als praktijk:

De problemen zitten zelden in de technologie zelf.

Ze ontstaan door de manier waarop organisaties deze inzetten.

Ziptone verwoordt dit scherp:

De kwaliteit van chatbots zegt vooral iets over hoe gemeenten omgaan met de technologie, niet over de technologie zelf.

Tegelijkertijd stimuleren overheid en VNG juist actieve inzet van generatieve AI:

Snellere dienstverlening
Betere toegankelijkheid
Efficiëntere processen

Maar onder duidelijke voorwaarden:

risicoanalyse
toezicht en governance
gebruik van betrouwbare modellen

De realiteit:

Technologie wordt sneller opgeschaald dan governance wordt ingericht.

Chatbots zijn geen experiment meer

We hebben te maken met een belangrijk kantelpunt: Een chatbot op een gemeentelijke website is geen pilot maar een volwaardig dienstverleningskanaal.

Dat betekent dat dezelfde eisen gelden als bij telefonie, baliecontact, e-mail en andere interacties.

En dus moet voldoen aan:

betrouwbare informatie
duidelijke communicatie
juiste doorverwijzing
menselijke escalatie

Zonder deze basis ontstaat een risico:

Je experimenteert niet met technologie, maar met vertrouwen van inwoner

Wat vraagt dit van gemeenten?

De volgende stap is niet méér technologie, maar betere inrichting.

1. Heldere afbakening

Niet elke vraag hoort bij een chatbot:

wel: eenvoudige vragen, processen, status
niet: complexe, interpretatieve of risicovolle vragen

2. Integraal kwaliteitskader

Niet alleen meten:

correctheid

Maar ook:

begrip van de vraag
effectiviteit van het antwoord
vertrouwen en duidelijkheid
herleidbaarheid van informatie

3. Continue monitoring

Kwaliteit is geen momentopname, maar een proces.

TNO benoemt dit expliciet als uitdaging:

Het evalueren en meten van AI-prestaties blijft complex en onderontwikkeld.

Van chatbot naar gespreksregie

Hier ligt volgens huXam de echte doorbraak.

Succesvolle organisaties sturen niet op:

technologie
tooling
features

Maar op:

gesprekskwaliteit en regie

Daarom ontwikkelen we oplossingen zoals: huXam Gespreksregie.

Waarbij organisaties:

gesprekken structureel meten
communicatie en dienstverlening combineren
kwaliteit aantoonbaar verbeteren
en regie houden over alle kanalen, inclusief chatbots

De toekomst: streng én kansrijk

De richting is duidelijk:

Generatieve AI blijft groeien binnen de overheid
Gemeenten blijven experimenteren
Maar de eisen worden strenger

De overheid zelf zegt het eigenlijk al:

Innovatie mag, mits verantwoord en beheerst.

Conclusie: vertrouwen is de echte KPI

De discussie over gemeentelijke chatbots raakt de kern van publieke dienstverlening:

Kunnen inwoners vertrouwen op de informatie die zij krijgen?

Dat vraagt niet om:

stoppen met chatbots
of blind doorgaan

Maar om:

aantoonbare kwaliteit, geborgd in governance en regie

Tot slot

De discussie die nu speelt (Ziptone, VNG, gemeenten, onderzoekers) is precies wat nodig is:

niet om technologie af te remmen, maar om de lat hoger te leggen.

De volgende stap is duidelijk:

Van experimenteren naar professionaliseren.

Wil je meer weten?

Neem contact op met Steyn.

0657006000

s.elshout@huxam.nl

Steyn Elshout

Vorige berichten