Alle Notizen

Vier Agent-Patterns wiederholen sich unabhängig vom Vendor Stack

Vier Agent-Patterns wiederholen sich unabhängig vom Vendor Stack

Jede Vendor-Fallstudie behauptet inzwischen einen Agent-Sieg. Nachdem man ein paar Dutzend hintereinander gelesen hat, fallen immer dieselbe Handvoll Formen aus der Wäschetrommel, und fast keine davon dreht sich um den Vendor. Die Platform darunter ist austauschbare Klempnerei.

Kernpunkte

  • Vier Agent-Formen wiederholen sich in jeder glaubwürdigen Fallstudie: deterministisches Rückgrat, eingebetteter Copilot, gegroundete Q&A, autonom mit Approval.
  • Das Pattern ist portabel. Die Platform ist Governance-Steuer, die du einmal zahlst und vergisst.
  • Gartner erwartet, dass bis 2027 über 40% der Agentic-KI-Projekte gecancelt werden. Pattern-Disziplin ist der Unterschied zwischen den 60% und den 40%.
  • Die SMB-Version jeder Fortune-500-Demo läuft unter 200 Dollar pro Monat auf Copilot-Studio-Credits, n8n oder der Anthropic-API.
  • Pick das Pattern zuerst. Pick den Vendor danach. Drehe die Reihenfolge um, und du shippst eine Demo, kein System.

In diesem Artikel

Pattern eins: das deterministische Rückgrat mit LLM-Schritten darin

Die häufigste Form im Feld sieht aus wie ein Flussdiagramm mit ein paar eingeschweißten LLM-Knoten. Ein Trigger feuert, das System sammelt Daten, ein LLM schließt über einen engen Prompt, das Ergebnis speist eine nachgelagerte Verzweigung, ein letzter Schritt schreibt in ein System of Record zurück. Das LLM ist ein Mitwirkender innerhalb eines deterministischen Harness, nicht der Entscheider, der den Harness antreibt.

Anthropic nennt das "Prompt Chaining" plus "Routing" in Building effective agents, dem Dezember-2024-Essay, das immer noch die kanonische Taxonomie ist. Googles Agent Development Kit liefert Sequential- und Loop-Workflow-Templates mit demselben Skelett. LangGraphs Tutorial-Bibliothek spiegelt die Taxonomie eins zu eins und ergänzt den durable State Graph als Meta-Pattern. Microsofts Copilot Studio Workflows ist dasselbe Pattern in Power-Platform-Kleidung. Vier unabhängige Lager, vier Vokabulare, ein Diagramm.

Im Replay der Microsoft-Power-Platform-Session zu realen Fallstudien hat der Signetic-Prior-Authorization-Agent exakt diese Form. Eine eingehende E-Mail triggert den Workflow. Das System verifiziert die Patientenidentität, fragt Dataverse über einen MCP-Server ab, generiert ein zahlerspezifisches Formular, mailt den Anfragenden zur Freigabe und versendet dann an den Versicherer. Das LLM macht die Formularfeld-Interpretation und das Identitäts-Reasoning; alles andere ist schlichte Orchestrierung.

Für eine 60-Personen-Logistikfirma auf selbst gehostetem n8n (unter 50 Dollar pro Monat inklusive eines kleinen VPS) landet dieselbe Form als: Webhook aus deinem TMS feuert, wenn sich ein Sendungsstatus ändert, ein LLM-Knoten klassifiziert die Kunden-E-Mail dazu, eine Verzweigung entscheidet, ob automatisch geantwortet, ein Entwurf zum menschlichen Review erstellt oder an den Disponenten eskaliert wird. Montagsschritt: n8n öffnen, das Template "Customer email triage" aus dem n8n-AI-Agent-Examples Blog kopieren, deinen Anthropic-API-Key eintauschen, den Trigger auf dein Shared Inbox zeigen und einen Operations-Lead zehn Outputs gegen historische Antworten bewerten lassen, bevor du Auto-Send aktivierst.

💡 Wenn dein Agent-Design enthält "das LLM entscheidet bei jedem Schritt, welches Tool als nächstes aufgerufen wird", bist du nicht in diesem Pattern. Du bist in Pattern vier und solltest es wissen.

Der Verlust-Case dieses Patterns ist interessant. Wenn das deterministische Rückgrat selbst zum Differenzierungsmerkmal wird, IST die Platform das Pattern. Temporals Durable Execution, Copilot Studios tenant-scoped Audit und AWS Step Functions plus Bedrock AgentCore sind keine austauschbaren Substrate; sie sind Festlegungen. Ich habe die Konvergenz ausführlich in Copilot Studio Workflows ist das Rückgrat, das LLM-Agents brauchten argumentiert; das Take-away hier ist schärfer. Du kannst eines der fünf Rückgrate wählen, aber wähle bewusst.

Pattern zwei: der eingebettete Copilot im Tool of Record

Das zweite Pattern ist das, über das fast niemand spricht und das entscheidet, ob der Rest der Arbeit den Nutzerkontakt überlebt. Der Agent muss in der Anwendung leben, die der Nutzer ohnehin schon öffnet. Ein Chat-Icon im bestehenden Bildschirm, ein Side Panel im bestehenden Tool, ein kontextueller Button auf dem bestehenden Datensatz. Kein neuer Tab. Kein neuer Login. Kein neuer Workspace.

Signetics Billing-Ops-Agent platziert ein Chat-Icon direkt im Model-driven Power-Apps-Bildschirm, den die Operatoren ohnehin acht Stunden am Tag nutzen. Afnis SMART-Goal-Evaluator läuft als Copilot-Bot innerhalb von Microsoft 365, weil ihre Mitarbeitenden dort schon leben. Beide Teams berichten, dass die Embedding-Entscheidung die Adoption stärker bewegte als jedes Prompt-Tuning. Das Afni-Team sagt explizit, dass ihre komplexen Semantic-Search- und MCP-integrierten Agents "geringe Traction" hatten, während ein einfacher Bot im täglichen Tool laut Case-Study-Session auf dem Microsoft Power Platform Channel bis Q1 2026 etwa 3.000 Quarterly Users erreichte.

Das Pattern funktioniert, weil Kontextwechsel der teuerste Teil des Workflows ist, den du zu verbessern versuchst. Wenn du zehn Minuten Debugging sparst, aber zwei Minuten Tab-Suche, App-Wechsel und Re-Authentifizierung kostest, hast du keinen Produktivitätsgewinn ausgeliefert, sondern ein Wissenschaftsprojekt.

Die SMB-Version. Eine 120-Personen-Regionalkanzlei für Wirtschaftsprüfung auf QuickBooks Online und einem Microsoft-365-Business-Tenant rollt einen Copilot-Studio-Agent aus, der "warum stimmt die Abstimmung dieses Mandanten nicht überein" im Outlook-Side-Panel beantwortet, wo die Buchhalter den Großteil ihres Tages verbringen. Das Capacity Pack zu 200 Dollar pro Monat deckt 25.000 Nachrichten, mehr als genug für ein Team mit 12 täglichen Nutzern. Montagsschritt: Copilot-Studio-Maker-Portal öffnen, neuen Agent erstellen, an einen SharePoint-Ordner mit deinen Abstimmungs-SOPs und den letzten sechs Monaten freigegebener Auszüge anschließen und auf die Outlook-Copilot-Extension publishen. Baue noch nicht den QuickBooks-API-Connector; shipp zuerst die Q&A, miss die Nutzung zwei Wochen lang, ergänze dann den Connector, wenn die Nutzung es rechtfertigt.

Der Verlust-Case ist hier unbequem für die Pattern-über-Platform-These. Das "Tool of Record" ist selten vendor-neutral. Wenn deine Operatoren in Salesforce leben, muss dein Agent in Salesforce leben; wenn sie in SAP leben, muss dein Agent in SAP leben. Das Pattern überlebt, die Implementierungskosten nicht. Vendor-Lock-in an der Embedding-Fläche ist real.

Pattern drei: gegroundete Q&A auf Live-Daten

Die dritte wiederkehrende Form ist die, die die meisten Vendors als "RAG" fehletikettieren und die die meisten Teams unterbauen. Der Agent beantwortet Fragen, indem er Live-strukturierte Abfragen gegen ein aktuelles System of Record mit kuratiertem unstrukturiertem Wissen kombiniert (SOPs, Policy-Dokumente, Schema-Dokumentation). Keine Hälfte allein reicht.

Anthropics Taxonomie versteckt das innerhalb von "Routing" plus Tool-Use, was es unterverkauft. Der Faden zum strukturierten Retrieval ist in Strukturiertes Retrieval schlägt Vector-RAG für Enterprise-Agents gut abgedeckt; die Version, die in Produktion überlebt, kombiniert eine SQL- oder MCP-Abfrage gegen die Live-Datenschicht mit einem Retrieval-Schritt über das Regelwerk, das erklärt, was die Daten bedeuten. Signetics Billing-Agent wurde erst nützlich, als er aufhörte, Fehlercodes zu wiederholen ("Reject-Code 76, Plan-Limit überschritten"), und anfing, über beide Hälften zu schließen: die tatsächliche jährliche Leistungs-Historie der Patientin aus Dataverse plus die Interpretation von Code 76 durch den Zahler aus den ingestierten SOPs. Die zweite Version reduzierte die 30 bis 45 Minuten pro abgelehnten Anspruch auf Sekunden.

Eine häufige SMB-Instanz. Ein 45-Personen-Spezialdistributor auf NetSuite und Confluence rollt einen internen "Warum wurde diese Bestellung gehalten"-Agent aus. Die strukturierte Abfrage trifft NetSuite via eines kleinen FastAPI-Wrappers um den SuiteQL-Endpunkt; die unstrukturierte Seite ingestiert den Credit-Policy- und Trade-Compliance-Confluence-Space. Gesamter Stack: Anthropic-API für das Reasoning, ein 20-Zeilen-MCP-Server vor NetSuite, ein Confluence-Connector via Low-Cost-RAG-Service. Realistische Monatskosten: unter 150 Dollar bei einstelligen Tagesnutzern. Montagsschritt: Liste jede "Warum hat das System das gemacht"-Frage auf, die dein Order-Ops-Team in einer Woche im Slack stellt, wähle die Top drei aus, schreibe das SuiteQL für jede, und stopp. Verallgemeinere nicht; shipp zuerst Antworten auf diese drei.

Der Pattern-Test: Wenn dein "Agent" nur die SOPs hat und keine Live-Daten, hast du einen Chatbot gebaut. Wenn er nur die Live-Daten hat und keine SOPs, hast du einen SQL-Prompt mit Extraschritten gebaut. Beide Hälften sind Pflicht.

# Minimale gegroundete Q&A-Agent-Konfig (vendor-agnostische Form)
agent:
  name: order-hold-explainer
  model: claude-haiku-4-5
  system_prompt: |
    Du beantwortest "warum ist diese Bestellung gehalten" durch Kombination von:
    1. Dem Ergebnis der strukturierten Abfrage aus NetSuite (aktueller Zustand).
    2. Dem Kontext des Credit-Policy-Dokuments (was sein sollte).
    Zitiere immer die Regel und den Datenpunkt. Niemals spekulieren.
  tools:
    - name: netsuite_order_status
      type: mcp
      endpoint: https://internal-mcp.example/netsuite
      schema: order_id -> status, hold_reason, credit_limit_used
    - name: credit_policy_search
      type: vector
      collection: confluence_credit_policy
      top_k: 3
  guardrails:
    - require_citation: true
    - max_tool_calls_per_turn: 4

Pattern vier: autonomer Workflow mit Human-Approval-Gate

Die vierte Form ist die, die die ganze Aufmerksamkeit bekommt und fast keine der Production-Deployments. Ein Workflow läuft Ende-zu-Ende ohne Mensch durch, dann hält er an einem bestimmten Approval-Moment vor dem irreversiblen Schritt an. Identitätsverifikation, Datensammlung, Formularerstellung, Entwurfserstellung, alles autonom. Übermittlung an die externe Partei, menschliche Freigabe.

Das ist Anthropics "autonomous agent"-Form mit einer bewusst eingebauten Übergabe. LangGraph implementiert das als Graphen mit einem Interrupt-Knoten. Google ADK nennt es einen Loop-Workflow mit Exit-Bedingung. Copilot Studio implementiert es via Power-Automate-Trigger mit einer designierten Approval-Aktion. Dasselbe Diagramm, vier Labels. Die Orchestrator-Workers-Variante, bei der ein Planner-LLM an spezialisierte Sub-Agents delegiert und der Mensch die finale Synthese freigibt, ist die Multi-Agent-Variante desselben Patterns; ich habe den Model-Routing-Case dafür in Orchestrierte Spezialisten schlagen Frontier-LLMs argumentiert, und die Form verallgemeinert sich, egal ob du einen Spezialisten oder sieben orchestrierst.

Der Signetic-Prior-Authorization-Agent liest die eingehende Provider-E-Mail, extrahiert die Patientenidentität, fragt Dataverse ab, generiert das zahlerspezifische Formular und mailt dann den Anfragenden für die menschliche Freigabe, bevor er an den Versicherer übermittelt. Das "Human in the Loop" ist keine Aufsicht, sondern ein bewusstes Primitiv, platziert am einzigen Moment mit höchstem Einsatz. Alles davor ist voll automatisiert; der Mensch ist der rechtliche Accountability-Owner für die irreversible Aktion, nicht die Dateneingabe-Ressource.

Die SMB-Version verlangt Ehrlichkeit. Voll autonome Loops sind gefährlich, wenn das Operator-Team klein genug ist, dass eine schlechte Aktion eine Kundenbeziehung zerstört. Ein 30-Personen-B2B-SaaS-Unternehmen kann einen autonomen "Neu-Kunden-Onboarding-Formular-Generator"-Agent ausliefern, der den Vertrag aus dem Deal-Datensatz entwirft und den AE vor dem Versenden zur Freigabe mailt. Sie sollten in dieser Größe keinen autonomen "Auto-Respond-auf-Kundensupport-Tickets"-Agent ausliefern, weil die Kosten einer falschen Antwort zu hoch sind relativ zu den Einsparungen. Montagsschritt: Liste die fünf Workflows auf, die dein Team aktuell macht und die einen sauberen Approval-Moment haben (ein Klick, ein E-Mail-Versand, eine Unterschrift). Das sind deine Kandidaten für autonom-mit-Approval. Alles andere ist ein Pattern-drei-Q&A-Agent.

💡 Das Human-Approval-Gate ist die billigste Versicherung, die du je kaufen wirst. Entferne es nie, weil der Agent "die letzten 100 Mal richtig lag". Beim 101. Mal liegt er falsch, und dann erfährst du, warum es tragend war.

Wo das Pattern-Argument verliert

Pattern über Platform ist eine nützliche Heuristik, kein Gesetz. Drei Stellen, an denen das Argument bricht.

Erstens, Governance ist Platform. Entra Agent ID, Tenant Graph Grounding, Audit-Log-Integration und Per-Agent-Identity sind keine Pattern-Features, sondern Platform-Festlegungen. Die vier Formen verallgemeinern sich; die Governance-Plane darunter nicht. Ich habe das ausführlich in Microsoft 365 liefert Agent-Inventory, nicht Observability und Hört auf, Agents zu deployen, fangt an, sie zu onboarden argumentiert; wähle die Platform, mit der du fünf Jahre leben kannst.

Zweitens ist das deterministische Rückgrat selbst manchmal der Moat. Wenn du dich für Temporal entscheidest, hast du dich für ein spezifisches Durability- und Replay-Modell entschieden, das kein anderer Vendor matcht. Wenn du dich für Copilot Studio Workflows entscheidest, hast du dich für das Power-Platform-Datenmodell und die Microsoft-Identity-Plane entschieden. Die Portabilität des Patterns überträgt sich nicht auf die Portabilität der Implementierung. Das Rückgrat ist aus guten Engineering-Gründen klebrig.

Drittens ist die Embedded-Copilot-Entscheidung an das Tool of Record gebunden. Du kannst keinen Salesforce-eingebetteten Copilot an einen HubSpot-Kunden ausliefern. Das Pattern ist portabel; die Deployment-Fläche nicht. Für Agenturen und Beratungen ist das die Linie, an der "wir liefern überall denselben Agent" zur Lüge wird.

Der Gartner-Floor und was er ändert

Gartners Juni-2025-Prognose ist der kontrarische Anker, den jeder ehrliche Agent-Beitrag zitieren sollte. Die Schlagzeile, wörtlich: "Über 40% der Agentic-AI-Projekte werden bis Ende 2027 gecancelt". Die zugrundeliegende Umfrage befragte 3.412 Webinar-Teilnehmer im Januar 2025; 19% meldeten signifikante Agentic-KI-Investitionen, 42% konservative, 8% keine und 31% abwartend. Gartner schätzt zudem, dass "nur etwa 130 der Tausenden Agentic-KI-Vendors echt sind", was ihre einfachsprachige Definition von "Agent Washing" ist.

Das Pattern-Argument ist kein Weg um diesen Floor herum. Es ist der Überlebensmechanismus, um zu den 60% zu gehören. Die Projekte, die gecancelt werden, sind die, die zuerst einen Vendor gewählt und dann ein Problem gesucht haben, das der Vendor lösen kann. Die überlebenden Projekte haben zuerst ein Problem gewählt (eine echte wiederkehrende Aufgabe mit messbaren kognitiven Kosten), dann die Form (eine der vier) und dann den günstigsten Vendor, der die Form mit der Governance-Plane unterstützt, die das Business braucht.

Deshalb ist der SMB-Fall so wichtig. Ein 200-Personen-Unternehmen, das Copilot Studio für 200 Dollar pro Monat plus einen einwöchigen Build wählt, ist nicht in der Cancellation-Kohorte, weil es nichts zu canceln gibt; die Burn Rate ist zu niedrig, um auf einem CFO-Quartals-Review aufzutauchen. Die Cancellations kommen von sechsmonatigen, halbe-Million-Dollar-Agentic-Transformationsprogrammen, die nie eine Form gewählt haben.

Was du am Montag tust

Sechs konkrete Schritte für jedes Team zwischen zwei und 200 Personen, das dieses Quartal ein Agent-Projekt erwägt.

  1. Skippe das Vendor-Selection-Meeting. Halte es, nachdem du die Form gewählt hast.
  2. Wähle eine wiederkehrende Aufgabe, die kognitive Last kostet (nicht Volumen). Stoppe die Zeit mit der Stoppuhr. Schreibe in einem Satz auf, wie "gut genug" aussieht.
  3. Klassifiziere die Aufgabe in eine der vier Formen. Wenn du es nicht kannst, ist die Aufgabe nicht reif für einen Agent; sie ist reif für ein besseres Runbook.
  4. Wähle den günstigsten Vendor, der die Form unterstützt UND in deinem bestehenden Tool of Record lebt. Für die meisten Microsoft-Shops ist das Copilot Studio zu 200 Dollar pro Monat. Für Google-Workspace-Shops Gemini for Workspace. Für keines von beidem n8n self-hosted plus die Anthropic-API.
  5. Shipp die erste Version in zwei Wochen gegen synthetische Daten, nicht gegen deine echten Daten. Miss Latenz, Output-Qualität und die Lautlese-Reaktion eines Operators vor jedem Rollout.
  6. Setze ein Kill-Kriterium vor dem Launch. "Wenn die Nutzung bis Woche sechs unter X Queries pro aktivem Nutzer liegt, sunsetten wir es." Das ist der fehlende Schritt der Gartner-Cancellation-Kohorte.

Pattern-Argument und Platform-Argument stehen nicht im Konflikt. Patterns beschreiben, was der Agent tut; Platforms beschreiben, wo er lebt. Den Fehler, den fast jeder macht, ist, nach der Platform zu shoppen, bevor das Pattern benannt ist. Diese Reihenfolge erzeugt die 40%-Cancellation-Rate und den Agent-Washing-Haufen.

Wenn du eine dieser vier Formen auf SMB-Größe durcharbeitest, würde ich gerne Notizen vergleichen, wie deine Unit Economics aussehen und wo deine Governance-Linie gelandet ist. Die Patterns sind stabil; die lokalen Realitäten nicht, und genau dort landet das Meiste des interessanten Engineerings.