Embedded Agents vs. externe Agents – wann lohnt sich welcher Ansatz? - yaico

Die alte Welt: Embedded Agents

Vor kurzem haben wir im Customer Service auf Basis unserer FAQ wieder einen Chatbot entwickelt – technisch eine klassische RAG-Lösung: Die FAQs liegen als Markdown vor, werden in eine Vektor-Datenbank geladen und von dort durch einen Agent auf Basis von LangGraph gelesen, aufbereitet und beantwortet.

Der Agent ist in diesem Fall tief in die Lösung eingebettet – quasi beim Kompilieren oder beim Image-Build auf seine Aufgabe festgebrannt. Will man die FAQs erweitern, muss neu indexiert, das Image neu gebaut und neu deployed werden. Will man die Logik ändern, muss am LangGraph-Code geschraubt werden.

Bis vor kurzem war das der einzige Weg. Genau das verstehe ich unter einem Embedded Agent.

Die neue Option: Externe Agents wie Claude

Was aber, wenn man sich das ganze Setup spart?

Ich kann inzwischen Claude als dauerhaft laufenden Prozess starten und ihm einfach einen Ordner mit allen FAQ-Dateien geben. Keine Vektor-DB, kein RAG-Setup, kein Re-Indexing, kein Image-Build.

FAQ ändert sich? → Markdown-Datei editieren. Fertig.
Neue FAQ-Kategorie? → Neue Datei in den Ordner legen. Fertig.
Logik soll angepasst werden? → Skill-Datei (Markdown) ändern. Fertig.

Was vorher Tage an Engineering-Arbeit war, ist plötzlich eine Frage von Minuten – und die Pflege übernimmt im Zweifel das Fachteam selbst, nicht mehr die Entwicklung.

Das spannende Zwischenmodell: Externe Agents an internen Systemen

Noch interessanter wird es, wenn man beide Welten kombiniert. Zwei reale Beispiele:

Beispiel 1: Buchhaltung – Steuerdatei als Schnittstelle

In unserer Buchhaltungssoftware existiert ein interner Agent als LangGraph-Implementierung, der Zahlungsflüsse automatisch den passenden Belegen zuordnet. Das ist die klassische Embedded-Variante.

Gleichzeitig bietet die Software die Möglichkeit, über eine Steuerdatei Belege manuell zu Zahlungsflüssen zuzuordnen. Diese Datei kann von zwei Akteuren befüllt werden:

Ein Mensch im Buchhaltungsteam, der einen Sonderfall manuell erfasst.
Ein externer Agent wie Claude, der die Datei programmatisch befüllt.

Beide nutzen dieselbe Schnittstelle. Der externe Agent ergänzt den internen Agent dort, wo dessen Logik nicht greift – etwa bei ungewöhnlichen Buchungsfällen, die in den LangGraph-Flow nicht eingebaut wurden.

Buchhaltungs-Steuerdatei als gemeinsame Schnittstelle: Mensch und externer Agent schreiben in dieselbe Datei, parallel zum eingebetteten LangGraph-Agent

Beispiel 2: Chatwoot – Dual-Agent über die REST-API

Ähnlich beim Customer-Service-System Chatwoot (siehe meine vorherigen Beiträge zur E-Commerce-Kundenservice-Optimierung). Auch hier ist intern ein LangGraph-Agent am Werk, der Standardanfragen automatisch beantwortet.

Über den Chatwoot-API-Token kann Claude jedoch zusätzlich von außen über die REST-API Support-Tickets beantworten – ohne dass am internen Agent etwas geändert werden muss. Beide Agenten arbeiten parallel an demselben Ticket-Bestand:

Der interne Agent übernimmt das, wofür er trainiert wurde.
Der externe Agent springt für alles ein, was der interne nicht abdeckt – oder erledigt einmalige Sonderaufgaben („beantworte alle Tickets der letzten Woche, in denen Versandverzögerungen erwähnt werden, mit folgender Information”).

Chatwoot mit zwei Agenten: ein interner LangGraph-Agent für Standardanfragen und ein externer Claude-Agent, der über die REST-API auf denselben Ticket-Bestand zugreift

Wann welcher Ansatz?

Kriterium	Embedded Agent	Externer Agent
Setup-Aufwand	Hoch (RAG, Vektor-DB, LangGraph, Deployment)	Sehr niedrig (Ordner + Skill-Datei)
Änderungen am Wissen	Re-Indexing, Re-Deploy	Datei editieren
Latenz	Sehr niedrig	Höher (LLM-Call extern)
Kosten pro Anfrage	Niedrig nach Setup	Pro Anfrage Token-Kosten
Skalierung auf hohe Volumina	Stark	Eingeschränkt durch API-Limits
Flexibilität bei Sonderfällen	Gering – nur was eingebaut wurde	Hoch – jeder Prozess möglich
Wer pflegt es?	Entwicklung	Fachteam

Die Faustregel:

Hohes Volumen, eng definierter Anwendungsfall, niedrige Latenz gewünscht → Embedded Agent.
Niedriges bis mittleres Volumen, breite oder wechselnde Anwendungsfälle, schnelle Iteration → externer Agent.
Beste Ergebnisse oft in der Kombination: ein interner Agent für das Standardgeschäft, ein externer Agent als „Joker” für alles, was darüber hinausgeht.

Was bedeutet das strategisch?

Der wichtigste Punkt: Die Entscheidung „eigene Lösung bauen” wird seltener.

Vor zwei Jahren war ein RAG-System der Standardweg, um einer Domäne ein Sprachmodell verfügbar zu machen. Heute ist es in vielen Fällen Overkill. Ein dauerhafter Claude-Prozess mit Zugriff auf einen Ordner deckt 80 % der Anwendungsfälle ab – ohne Engineering-Aufwand und ohne laufende Wartung.

Das verschiebt die Frage von „Wie bauen wir den Agent?” zu „Welche Schnittstellen bieten wir dem Agent an?”. Steuerdateien, REST-APIs, geteilte Ordner – das sind die neuen Integrationspunkte. Und sie existieren in vielen Unternehmen längst, weil sie ursprünglich für menschliche Nutzer geschaffen wurden.

Genau hier liegt die elegante Symmetrie: Die Schnittstelle, die ein Mensch nutzt, ist dieselbe, die ein externer Agent nutzt. Embedded Agents bleiben dort relevant, wo Latenz, Kosten oder Volumen es verlangen – aber sie sind nicht mehr der Default.

Sie überlegen, ob für Ihren Anwendungsfall ein eingebauter oder ein externer Agent der bessere Weg ist? Wir bewerten das gerne mit Ihnen – jetzt Anfrage stellen.