Agentvillfarelsen: Varför ditt ERP-system inte är redo för autopilot (ännu)

(Del 3 av serien: ERP-intelligensutvecklingen: Från data till agenter)

I del 1definierade vi taxonomin.
I del 2lärde vi oss hur vi kommunicerar med våra data.
Nu kommer vi till den sista gränsen: Agentisk AI.

Detta är toppen av hypecykeln.

Löftet är förföriskt: det ”självkörande företaget”.
Tänk dig ett system som inte bara berättar att en leverans är försenad (Infor AI) eller sammanfattar kontraktet (GenAI), utan faktiskt åtgärdar problemet genom att köpa från en konkurrent, uppdatera schemat och mejla kunden, allt medan du sover.

Enligt allas färdplan (inklusive Infor) är dessa "mikrovertikala rollbaserade agenter" på väg.

Men innan vi lämnar över nycklarna till vårt ERP-system behöver vi en ordentlig verklighetskontroll.

Vad är en agent?

För att förstå risken måste vi skilja en agent från den vi har idag.

  • GenAI: du ger den en uppgift ("skriv ett e-postmeddelande").
    Den producerar en utdata. Du kör den (klicka på Skicka).
    Den är uppgiftsdriven.
  • Agentisk AI: Du ger den ett mål ("Säkerställa materialtillgänglighet för Projekt X").
    Den räknar ut stegen, använder verktyg (API:er, e-post, ERP-sessioner) och kör dem. Den är resultatinriktad.

Infor definierar detta som "Orkestrerad kontroll".

En agent är inte instängd i ett chattfönster: Den har "händer".
Den kan skapa en inköpsorder i LNeller uppdatera en post i M3.

Drömscenariot: Leverantörskedjeagenten

Låt oss titta på det här exemplet: ”Omdirigering av upphandling baserat på AI-rekommendationer”.

Scenariot:

  1. Utlösare: En storm stänger en hamn i Shanghai.
  2. Detektion: Agenten märker att PO #123 (Kritisk råvara) har fastnat.
  3. Resonemang: Den kontrollerar lagernivåer, beräknar produktionspåverkan och skannar alternativa godkända leverantörer.
  4. Åtgärd: Den ursprungliga inköpsordern annulleras, en ny inköpsorder utfärdas till en leverantör i Turkiet (till en högre kostnad men snabbare leverans) och produktionsplanen uppdateras.

Resultat: Kön stannar aldrig.
Inget mänskligt ingripande.

Vanföreställningen: Varför detta är farligt idag

Det låter perfekt, eller hur?
Så varför gör vi det inte?
För i ett ERP-system kostnaden för fel asymmetrisk.

Om ChatGPT hallucinerar en dikt är det roligt.
Om ett GenBI-verktyg hallucinerar en rapport är det förvirrande.
Men om en agent hallucinerar en inköpsorder:

  • Du köpte just fel stål för 50 000 dollar.
  • Du duplicerade en beställning.
  • Du bröt mot ett leverantörsavtal.

Integritetsgapet: En agents "hjärna" är fortfarande en juridikexamen, och nya data bekräftar betydande tillförlitlighetsproblem:

  1. Kvalitativ risk: Som dokumenterats av BBCkan AI-assistenter med säkerhet generera trovärdig men felaktig information eller manipuleras. Källa: News Integrity in AI Assistants Report (BBC)
  2. Kvantitativ risk: Tekniska riktmärken som AA-Omniscience behövs nu specifikt för att mäta "hallucinationsfrekvenser" och "straffa dåliga gissningar". Det faktum att vi behöver specifika mätvärden för att filtrera bort faktiska fel bevisar att tillförlitlighet ännu inte är ett löst problem.
    I ett ERP-system är en "dålig gissning" på ett leveransdatum inte bara ett lågt betyg; det är en stämning. Källa: Artificial Analysis Omniscience Benchmark

Om vi ​​inte kan lita på att en AI upprätthåller nyhetsintegritet utan mänsklig tillsyn, hur kan vi då lita på att den upprätthåller transaktionell integritet i ett verksamhetskritiskt ERP-system?

Bevis från fältet: När agenter blir oärliga
Risken för att autonoma agenter "spelar systemet" är väl dokumenterad.
En nyligen genomförd simuleringsstudie av Microsoft visade att AI-agenter i en marknadsmiljö, när de är strikt resultatinriktade, kan utforma oväntade strategier för att maximera vinsten, ibland utnyttja kryphål eller bete sig på sätt som människor aldrig avsett.

Om en agent kan förstöra en simulering för att nå ett nyckeltal, tänk dig vad det skulle kunna göra med en huvudbok.

Källa: Microsoft Magnetic-One Simulation Study

För att inte tala om situationer där till och med Antigravity IDE från Google bara raderade hela en användares hårddisk:  Google Antigravity raderade just innehållet på hela min hårddisk.

Lösningen: Human-in-the-loop-styrning

Vi är ännu inte redo för "Autopilot" (full autonomi).
Vi är redo för "Co-Pilot med skyddsräcken".

Under de närmaste åren tror jag att det realistiska arbetsflödet för Agentic AI kommer att vara:

  1. Agenten upptäcker förseningen och förbereder den nya inköpsordern.
  2. Den pingar Supply Chain Manager: ”Jag har upptäckt en försening. Jag föreslår att du byter till leverantör B. Påverkan: +2 000 USD i kostnad, -5 dagars försening. Godkänn?”
  3. Människan granskar och klickar på ”Godkänn”.

Det här är Orchestrated Control Infor talar om.

Agenten gör det tunga arbetet (hitta lösningen och göra datainmatningen), men människan behåller ansvaret.

Sammanfattning: Ansvarets utveckling

 

Tekniken är spännande.
Men tills vi kan lita på att AI:n inte köper en fabrik av misstag Human in the Loop inte en bugg, det är den viktigaste funktionen.

I nästa artikelska vi titta på den grundläggande grunden som gör allt detta möjligt: ​​Data.
Varför "Garbage In, Garbage Out" är kryptoniten för agenter.

 

Skriven av Andrea Guaccio 

27 december 2025