De agent-illusie: waarom uw ERP-systeem (nog) niet klaar is voor de automatische piloot

(Deel 3 van de serie: De evolutie van ERP-intelligentie: van data naar agents)

In deel 1hebben we de taxonomie gedefinieerd.
In deel 2hebben we geleerd hoe we met onze data kunnen communiceren.
Nu zijn we aangekomen bij de laatste grens: Agentische AI.

Dit is het hoogtepunt van de hypecyclus.

De belofte is verleidelijk: de "zelfrijdende onderneming".
Stel je een systeem voor dat je niet alleen vertelt dat een levering te laat is (Infor AI) of het contract samenvat (GenAI), maar het probleem daadwerkelijk oplost door bij een concurrent in te kopen, de planning aan te passen en de klant een e-mail te sturen, allemaal terwijl je slaapt.

Volgens ieders routekaart (inclusief die van Infor) komen deze "microverticale, op rollen gebaseerde agents" eraan

Maar voordat we de sleutels van ons ERP-systeem overhandigen, moeten we eerst een serieuze realiteitscheck ondergaan.

Wat is een agent?

Om het risico te begrijpen, moeten we een Agent onderscheiden van wat we vandaag de dag hebben.

  • GenAI: je geeft het een taak ("schrijf een e-mail").
    Het produceert een output. Je voert die uit (klik op Verzenden).
    Het is taakgestuurd.
  • Agentische AI: Je geeft het een doel ("Zorg voor de beschikbaarheid van materialen voor Project X").
    Het berekent de stappen, gebruikt tools (API's, e-mail, ERP-sessies) en voert ze uit. Het is resultaatgericht.

Infor definieert dit als "georkestreerde controle".

Een agent zit niet vast in een chatvenster: hij heeft "handen".
Hij kan een inkooporder aanmaken in LNof een record bijwerken in M3.

Het droomscenario: De supply chain agent

Laten we eens naar dit voorbeeld kijken: "Inkoop omleiden op basis van AI-aanbevelingen".

Het scenario:

  1. Aanleiding: Een storm legt een haven in Shanghai plat.
  2. Detectie: De agent merkt op dat inkooporder #123 (kritieke grondstof) vastzit.
  3. Redenering: Het systeem controleert de voorraadniveaus, berekent de impact op de productie en scant alternatieve, goedgekeurde leveranciers.
  4. Actie: De oorspronkelijke inkooporder wordt geannuleerd, een nieuwe inkooporder wordt geplaatst bij een leverancier in Turkije (tegen hogere kosten, maar met snellere levering) en het productieplan wordt bijgewerkt.

Resultaat: De lijn stopt nooit.
Geen menselijke tussenkomst.

De illusie: waarom dit vandaag de dag gevaarlijk is

Het klinkt perfect, toch?
Dus waarom doen we het niet?
Omdat in een ERP-systeem de kosten van fouten asymmetrisch zijn.

Als ChatGPT hallucineert , is dat grappig.
Als een GenBI-tool een rapport hallucineert, is dat verwarrend.
Maar als een agent een inkooporder hallucineert:

  • Je hebt zojuist voor $50.000 aan het verkeerde staal gekocht.
  • Je hebt een bestelling gedupliceerd.
  • Je hebt een leverancierscontract geschonden.

De integriteitskloof: Het "brein" van een agent is nog steeds een LLM, en recente gegevens bevestigen aanzienlijke betrouwbaarheidsproblemen:

  1. Kwalitatief risico: Zoals de BBC, kunnen AI-assistenten met vertrouwen plausibele maar onjuiste informatie genereren of gemanipuleerd worden. Bron: Rapport over nieuwsintegriteit bij AI-assistenten (BBC)
  2. Kwantitatief risico: Technische benchmarks zoals AA-Omniscience zijn nu specifiek nodig om "hallucinatiepercentages" te meten en "foute schattingen af ​​te straffen". Het feit dat we specifieke meetwaarden nodig hebben om feitelijke fouten eruit te filteren, bewijst dat betrouwbaarheid nog geen opgelost probleem is.
    In een ERP-systeem is een "foute schatting" van een leverdatum niet zomaar een lage score; het kan leiden tot een rechtszaak. Bron: Artificial Analysis Omniscience Benchmark

Als we een AI niet kunnen vertrouwen om de nieuwsintegriteit te waarborgen zonder menselijk toezicht, hoe kunnen we er dan op vertrouwen dat deze de transactie-integriteit in een bedrijfskritisch ERP-systeem waarborgt ?

Bewijs uit de praktijk: Wanneer agenten op hol slaan
Het risico dat autonome agenten "het systeem misbruiken" is goed gedocumenteerd.
Een recente simulatiestudie van Microsoft toonde aan dat AI-agenten in een marktplaatsomgeving, wanneer ze strikt resultaatgericht zijn, onverwachte strategieën kunnen bedenken om de winst te maximaliseren, soms door mazen in de wet te benutten of zich te gedragen op manieren die mensen nooit hadden bedoeld.

Als een agent een simulatie kan verstoren om een ​​KPI te halen, stel je dan eens voor wat dat met een grootboek zou kunnen doen.

Bron: Microsoft Magnetic-One simulatiestudie

Om nog maar te zwijgen van situaties waarin zelfs de Antigravity IDE van Google de volledige harde schijf van een gebruiker heeft gewist:  Google Antigravity heeft zojuist de inhoud van mijn hele schijf gewist.

De oplossing: Bestuur met menselijke tussenkomst

We zijn nog niet klaar voor "Autopilot" (volledige autonomie).
We zijn wel klaar voor "Co-piloot met vangrails".

De komende jaren zal de realistische workflow voor Agentic AI er naar mijn mening als volgt uitzien:

  1. De agent detecteert de vertraging en maakt de nieuwe inkooporder aan.
  2. Het systeem stuurt een melding naar de Supply Chain Manager: "Ik heb een vertraging geconstateerd. Ik stel voor om over te stappen op leverancier B. Gevolgen: +$2.000 kosten, -5 dagen vertraging. Goedkeuren?"
  3. De medewerker beoordeelt het en klikt op "Goedkeuren".

Dit is de georkestreerde besturing waar Infor het over heeft.

De agent verricht het zware werk (het vinden van de oplossing en het invoeren van de gegevens), maar de mens blijft eindverantwoordelijk.

Samenvatting: De evolutie van verantwoordelijkheid

 

De technologie is veelbelovend.
Maar zolang we er niet op kunnen vertrouwen dat de AI niet per ongeluk een fabriek koopt, is de menselijke factor geen fout, maar juist de belangrijkste eigenschap.

In het volgende artikelgaan we dieper in op de essentiële basis die dit alles mogelijk maakt: data.
Waarom "garbage in, garbage out" de kryptoniet is voor agents.

 

Geschreven door Andrea Guaccio 

27 december 2025