Business Guide

KI-Agenten für Unternehmen: Was sie 2026 wirklich kosten

R
Rogue AI
··10 Min. Lesezeit

Sie haben die Demos gesehen. Sie haben den Hype gelesen. Jetzt wollen Sie wissen, was es tatsaechlich kostet, einen massgeschneiderten KI-Agenten fuer Ihr Unternehmen zu bauen — keinen Spielzeug-Prototypen, sondern ein Produktivsystem, das echte Arbeit erledigt, sich in Ihre bestehenden Tools integriert und zuverlaessig laeuft. Hier ist eine transparente Aufschluesselung basierend auf den Systemen, die wir gebaut haben — inklusive der Kosten, die die meisten Agenturen in ihren Angeboten gerne verschweigen.

Was ist ein "Custom AI Agent" eigentlich?

Bevor wir ueber Kosten sprechen, klaeren wir erstmal die Begriffe. Ein Custom AI Agent ist ein System, das grosse Sprachmodelle (LLMs) nutzt, um einen bestimmten Geschaeftsprozess zu automatisieren oder zu unterstuetzen. Anders als ein generischer Chatbot ist ein Custom Agent speziell fuer Ihren Workflow, Ihre Daten und Ihre Geschaeftsregeln gebaut. Er beantwortet nicht nur Fragen — er fuehrt Aktionen aus, verarbeitet Dokumente, trifft Entscheidungen innerhalb definierter Parameter und integriert sich in Ihre bestehende Software.

Die Bandbreite ist enorm. Ein einfacher FAQ-Agent, der Kundenfragen aus Ihrer Wissensdatenbank beantwortet, ist ein voellig anderes Projekt als ein Multi-Agent-Orchestrierungssystem, das Versicherungsansprueche ueber mehrere Abteilungen hinweg bearbeitet. Die Kosten spiegeln diese Bandbreite wider.

Die drei Stufen: Was Sie auf jedem Level bekommen

Wir strukturieren unsere Projekte in drei Stufen nach Komplexitaet. Das sind keine willkuerlichen Preiskategorien — sie spiegeln tatsaechlich unterschiedliche Level an Engineering-Aufwand, Integrationskomplexitaet und Testanforderungen wider.

Stufe 1: Einfacher Agent — EUR 3.000 bis 5.000

Was enthalten ist

  • Umfang: Einzweck-Agent fuer eine klar definierte Aufgabe — FAQ-Antworten, Dokumentenzusammenfassung, E-Mail-Triage oder Inhaltsklassifizierung.
  • Wissensdatenbank: RAG-Setup (Retrieval-Augmented Generation) mit Ihren bestehenden Dokumenten, FAQs oder Produktinformationen. Der Agent beantwortet Fragen basierend auf Ihren echten Daten, nicht auf allgemeinem Internetwissen.
  • Oberflaeche: Webbasierte Chat-Oberflaeche oder API-Endpunkt. Sauberes, funktionales Design. Kein Custom-UI-Design (wir nutzen unsere Standard-Komponentenbibliothek).
  • Integration: Ein Integrationspunkt — Ihre Website (eingebettetes Widget), ein Slack-Kanal oder eine einfache API, die Ihre bestehende Software aufruft.
  • Deployment: Docker-Container auf Ihrem Server oder einer Cloud-Instanz, die wir bereitstellen. Vollstaendige Deployment-Dokumentation.
  • Zeitrahmen: 1-2 Wochen vom Kickoff bis zur Produktivstellung.

Typische Anwendungsfaelle auf dieser Stufe: ein Kundensupport-Agent, der Fragen zu Ihren Produkten anhand Ihrer Dokumentation beantwortet, ein interner Wissensmanagement-Agent, der Mitarbeitern hilft, Unternehmensrichtlinien und Ablaeufe zu finden, oder ein Zusammenfassungstool, das lange Berichte auf die wichtigsten Punkte verdichtet.

Diese Stufe nutzt eine Cloud-API (OpenAI oder Anthropic) als LLM-Backend, sofern Sie nicht explizit Self-Hosting wuenschen. Cloud-APIs halten die Kosten bei diesem Volumen niedrig und liefern die beste Qualitaet fuer Konversationsaufgaben.

Stufe 2: Dokumentenverarbeitung + RAG — EUR 8.000 bis 12.000

Was enthalten ist

  • Umfang: Mehrstufige Dokumentenverarbeitungs-Pipeline. Dokumente hochladen, strukturierte Daten extrahieren, Inhalte anhand von Regeln oder Kriterien analysieren und formatierte Ausgaben erzeugen. Verarbeitet PDFs, Word-Dokumente, Tabellen und gescannte Bilder.
  • Intelligenz: Fortgeschrittenes RAG mit branchenspezifischer Wissensdatenbank, massgeschneiderten Prompts fuer Ihre Fachterminologie und strukturierter Ausgabeformatierung (Tabellen, Berichte, Massnahmenlisten).
  • Oberflaeche: Vollstaendige Webanwendung mit Upload, Verarbeitungsstatus, Ergebnisanzeige und Verlauf. Individuelles UI-Design, angepasst an Ihren Workflow.
  • Integration: Bis zu drei Integrationspunkte — E-Mail-Eingang, CRM/ERP-Webhook, Datenbankverbindung oder API-Endpunkte fuer Ihre bestehenden Tools.
  • Deployment: Docker-Deployment mit Datenbank (PostgreSQL), Caching-Layer (Redis) und Monitoring. Self-Hosting-Option auf dieser Stufe verfuegbar (Ollama + lokale Modelle).
  • Zeitrahmen: 3-4 Wochen vom Kickoff bis zur Produktivstellung.

Das ist unsere haeufigste Stufe. Typische Projekte umfassen: Rechnungsverarbeitungssysteme, die Einzelposten extrahieren und mit Bestellungen abgleichen, Compliance-Dokumentenanalyse-Tools, die Unterlagen gegen regulatorische Anforderungen pruefen, und Vertragspruefungs-Tools, die riskante Klauseln markieren und Kernbedingungen zusammenfassen.

Auf dieser Stufe verlagert sich der Engineering-Aufwand von einfacher Integration hin zum Aufbau einer robusten Dokumenten-Parsing-Pipeline, der Behandlung von Sonderfaellen bei Eingabeformaten und der Sicherstellung, dass die Ausgabequalitaet konsistent genug fuer den Geschaeftseinsatz ist. Allein das Prompt-Engineering braucht typischerweise eine volle Woche Iteration mit echten Dokumenten.

Stufe 3: Multi-Agent-Orchestrierung — EUR 15.000 bis 20.000

Was enthalten ist

  • Umfang: Mehrere KI-Agenten arbeiten gemeinsam an komplexen Workflows. Jeder Agent uebernimmt eine bestimmte Teilaufgabe, und eine Orchestrierungsschicht koordiniert sie. Stellen Sie sich das als eine KI-Abteilung vor, nicht als einen einzelnen KI-Assistenten.
  • Intelligenz: Mehrere spezialisierte Agenten mit unterschiedlichen Prompts, Wissensdatenbanken und Faehigkeiten. Entscheidungslogik, die Aufgaben an den richtigen Agenten weiterleitet. Konfidenz-Scoring und Eskalation an Menschen bei Grenzfaellen.
  • Oberflaeche: Vollstaendige Webanwendung mit Dashboard, Workflow-Visualisierung, Warteschlangenverwaltung und Admin-Steuerung. Rollenbasierter Zugriff fuer verschiedene Teammitglieder.
  • Integration: Unbegrenzte Integrationspunkte — E-Mail, CRM, ERP, Datenbanken, APIs, Dateispeicher, Benachrichtigungssysteme. Webhook-Support fuer Echtzeit-Eventverarbeitung.
  • Deployment: Vollstaendige Docker-Infrastruktur mit mehreren Services, Datenbank, Caching, Queue-System und Monitoring-Dashboard. Self-Hosting ist auf dieser Stufe Standard.
  • Zeitrahmen: 6-8 Wochen vom Kickoff bis zur Produktivstellung.

Diese Stufe ist fuer Unternehmen mit komplexen, mehrstufigen Workflows, die Abteilungsgrenzen ueberschreiten. Beispiele: ein Schadenbearbeitungssystem fuer Versicherungen, bei dem ein Agent eingehende Schaeden sichtet, ein anderer Policendetails extrahiert, ein dritter Schaeden anhand von Fotos bewertet und ein vierter Regulierungsempfehlungen erstellt. Oder eine Recruiting-Pipeline, bei der Agenten Bewerbungen screenen, Qualifikationen extrahieren, Kandidaten mit Stellen abgleichen und Interviewfragen entwerfen.

Preisueberblick

StufePreisrahmenZeitrahmenIntegrationenIdeal fuer
Einfacher AgentEUR 3.000 - 5.0001-2 Wochen1FAQ, Zusammenfassung, Triage
Dokumente + RAGEUR 8.000 - 12.0003-4 WochenBis zu 3Dokumentenverarbeitung, Compliance, Extraktion
Multi-AgentEUR 15.000 - 20.0006-8 WochenUnbegrenztKomplexe Workflows, abteilungsuebergreifend

Laufende Kosten: Was nach dem Launch anfaellt

Die Entwicklungskosten sind die einmalige Investition. Aber KI-Systeme haben laufende Kosten, die Sie einplanen muessen. Hier ist, was Sie erwarten koennen:

Hosting und Infrastruktur

Wenn Ihr System auf einem Cloud-Server laeuft (was bei den meisten der Fall ist), rechnen Sie mit EUR 30-300 pro Monat — je nachdem, ob Sie eine GPU fuer Self-Hosted-Modelle benoetigen. Ein reiner CPU-Server fuer einen cloudbasierten Agenten kostet ab EUR 30/Monat. Ein GPU-Server fuer lokale Modelle kostet EUR 80-300/Monat bei europaeischen Anbietern wie Hetzner oder OVH.

API-Kosten (Cloud LLM)

Wenn Ihr Agent eine Cloud-API wie OpenAI oder Anthropic nutzt, zahlen Sie pro Anfrage. Fuer einen typischen Business-Agenten mit 100-500 Anfragen pro Tag rechnen Sie mit EUR 50-500/Monat an API-Gebuehren. Der genaue Betrag haengt davon ab, welches Modell Sie nutzen und wie lang Ihre Prompts sind. Wir optimieren Prompts waehrend der Entwicklung auf Kosteneffizienz — und nutzen das kleinste Modell, das fuer jede Teilaufgabe akzeptable Qualitaet liefert.

Wartung und Updates

KI-Systeme sind keine "Einmal-bauen-und-vergessen"-Loesung. Modelle werden besser, APIs aendern sich, und Ihre Geschaeftsprozesse entwickeln sich weiter. Wir bieten Wartungspakete ab EUR 500/Monat an, die Folgendes abdecken: Modell-Updates (Wechsel auf neuere, bessere Modelle bei Erscheinen), Prompt-Verfeinerungen basierend auf Produktionsleistungsdaten, Bugfixes und kleinere Feature-Erweiterungen. Bei den meisten Kunden investieren wir 4-8 Stunden pro Monat in die Wartung.

Gesamte monatliche Betriebskosten

Fuer ein typisches Stufe-2-System: EUR 80-150 Hosting + EUR 100-300 API-Gebuehren + EUR 500 Wartung = EUR 680-950/Monat. Vergleichen Sie das mit den Gehaltskosten der manuellen Arbeit, die der Agent ersetzt. Wenn der Agent einem Mitarbeiter 20 Stunden pro Monat spart, und dieser Mitarbeiter EUR 40/Stunde (Vollkosten) kostet, refinanziert sich der Agent allein durch eingesparte Arbeitskosten — bevor Sie Geschwindigkeit, Konsistenz und Verfuegbarkeitsverbesserungen einrechnen.

Versteckte Kosten, die andere Agenturen nicht erwaehnen

Wir legen hier Kosten offen, die oft erst nach Vertragsabschluss auftauchen. Andere Agenturen verschweigen diese gerne. Wir nicht — denn Ueberraschungen zerstoeren Vertrauen.

  • Datenaufbereitung: Ihre Dokumente, FAQs und Wissensdatenbanken sind vermutlich nicht in einem Format, das eine KI direkt nutzen kann. Bereinigung, Strukturierung und Organisation Ihrer Daten fuer die RAG-Aufnahme braucht Zeit. Bei kleinen Datensaetzen (unter 500 Dokumente) ist das im Projektpreis enthalten. Bei groesseren Datensaetzen kalkulieren wir separat — typischerweise EUR 1.000-3.000 je nach Datenzustand.
  • Integrationskomplexitaet:Die Anbindung an Ihr bestehendes CRM, ERP oder interne Tools klingt im Angebot einfach. In der Praxis haengt es davon ab, ob diese Systeme nutzbare APIs haben, wie gut sie dokumentiert sind und ob Ihr IT-Team zeitnah Zugangsdaten und Testumgebungen bereitstellen kann. Eine "einfache API-Integration" kann zwei Tage oder zwei Wochen dauern — je nach Zielsystem.
  • Scope Creep:Die haeufigste Budgetueberschreitung. "Wenn Sie schon den Dokumentenprozessor bauen, koennte der auch E-Mail-Benachrichtigungen senden? Und sich in Salesforce integrieren? Und PDF-Reports erstellen?" Jede einzelne Ergaenzung ist klein, aber zusammengenommen koennen sie den Projektumfang verdoppeln. Wir steuern das mit einer festen Scope-Vereinbarung und einem klaren Change-Request-Prozess.
  • Schulung und Akzeptanz: Das System zu bauen ist die eine Haelfte. Ihr Team dazu zu bringen, es tatsaechlich zu nutzen, die andere. Wir bieten bei jedem Projekt eine Grundschulung (zwei Sessions) an, aber wenn Ihr Team erweitertes Onboarding, massgeschneiderte Dokumentation oder Workflow-Redesign-Support braucht, ist das zusaetzlicher Aufwand.
  • Genauigkeits-Iteration: Die erste Version eines KI-Systems ist nie die finale Version. Prompt-Engineering ist iterativ — Sie deployen, messen die Performance mit echten Daten, verfeinern Prompts und deployen erneut. Wir planen zwei Iterationsrunden in jedes Projekt ein, aber manche branchentypischen Aufgaben brauchen mehr. Wenn Ihre Fachterminologie ungewoehnlich komplex oder Ihre Dokumentenformate sehr unterschiedlich sind, rechnen Sie mit zusaetzlichen Verfeinerungszyklen.

Brauchen Sie ueberhaupt einen Custom Agent?

Das ist die Frage, die die meisten KI-Agenturen Ihnen nicht stellen — weil die Antwort "nein" sein koennte. Aber wir finden, Ehrlichkeit von Anfang an spart allen Zeit und Geld. Hier ist ein schnelles Bewertungsraster:

Ein Custom Agent lohnt sich wahrscheinlich, wenn:

  • Ihr Prozess branchenspezifisches Wissen erfordert, das generische Tools nicht abbilden
  • Die KI sich in Ihre bestehende Business-Software integrieren muss (CRM, ERP, Eigenentwicklungen)
  • Datenschutzanforderungen die Nutzung oeffentlicher KI-Tools ausschliessen
  • Sie hohe Volumina aehnlicher Dokumente oder Anfragen verarbeiten, die einem Muster folgen
  • Der Geschaeftsprozess, den Sie automatisieren moechten, mindestens 20+ Stunden manueller Arbeit pro Monat einspart

Ein Custom Agent lohnt sich vermutlich nicht, wenn:

  • Ein generischer Chatbot (Intercom, Zendesk AI, Freshdesk) Ihren Kundensupport abdeckt
  • Ihr Team einfach besseren Zugang zu ChatGPT oder Claude braucht (ein Abo kostet EUR 20/Monat)
  • Die zu automatisierende Aufgabe weniger als 10 Mal pro Woche anfaellt
  • Ein bestehendes SaaS-Tool (Zapier AI, Make.com oder branchenspezifische Software) das Problem bereits loest
  • Sie kein klares, messbares Ergebnis haben, das der Agent erreichen soll

Wir haben mehreren Interessenten von einer Individualentwicklung abgeraten, weil ein Standardtool die bessere Loesung war. Das klingt nach schlechtem Geschaeft, aber es schafft Vertrauen — und diese Kunden kommen zurueck, wenn sie tatsaechlich einen echten Custom-Bedarf haben.

So bewerten Sie KI-Agenturen

Wenn Sie Angebote von mehreren Agenturen vergleichen, verraten diese Fragen, wer wirklich weiss, was er tut:

  • Verlangen Sie eine Live-Demo eines vergleichbaren Systems. Mockups und Screenshots beweisen nichts. Eine funktionierende Demo zeigt, dass sie liefern koennen.
  • Fragen Sie nach Datenschutz und Hosting. Wenn die Agentur nicht genau erklaeren kann, wohin Ihre Daten gehen und wie sie geschuetzt werden — Finger weg.
  • Fragen Sie nach laufenden Kosten. Wenn das Angebot nur Entwicklungskosten abdeckt und bei monatlichen Betriebskosten vage bleibt, wird die Endrechnung hoeher als erwartet.
  • Fragen Sie nach Genauigkeitsmessung.Wie wird gemessen, ob der Agent korrekt arbeitet? Was ist die Testmethodik? "Funktioniert gut" ist keine Kennzahl.
  • Fragen Sie, was passiert, wenn Sie herauswachsen. Koennen Sie den Code uebernehmen und selbst warten? Gibt es Vendor Lock-in? Wem gehoert das geistige Eigentum? (Bei uns: Alles, was wir fuer Sie bauen, gehoert Ihnen. Vollstaendige Code-Uebergabe, kein Lock-in.)

Wie der Entwicklungsprozess ablaeuft

Unabhaengig von der Stufe folgt jedes Projekt der gleichen Struktur:

  • Woche 0 — Discovery Call (kostenlos): Wir besprechen Ihren Anwendungsfall, bewerten die Machbarkeit und bestimmen die passende Stufe. Wenn ein Custom Agent nicht die richtige Loesung ist, sagen wir Ihnen das. Dieses Gespraech dauert typischerweise 30-60 Minuten.
  • Kickoff — Anforderungen und Daten:Wir definieren den genauen Umfang, sammeln Beispieldaten (Dokumente, Anfragen, erwartete Ausgaben) und vereinbaren Erfolgskriterien. Was bedeutet "korrekt funktionierend" konkret? Das brauchen wir schriftlich, bevor wir eine einzige Zeile Code schreiben.
  • Entwicklung — Bauen und iterieren: Wir arbeiten in woechentlichen Sprints mit einer Demo am Ende jeder Woche. Sie sehen Fortschritte, geben Feedback und koennen fruehzeitig gegensteuern. Keine grosse Enthuellung nach sechs Wochen, bei der das System nicht den Erwartungen entspricht.
  • Testing — Validierung mit echten Daten: Wir lassen das System gegen Ihre realen Daten laufen und messen die Genauigkeit an den vereinbarten Erfolgskriterien. Liegt die Genauigkeit unter dem Schwellenwert, iterieren wir an Prompts und Verarbeitungslogik, bis der Standard erreicht ist.
  • Deployment — Produktivstellung und Schulung: Wir deployen auf Ihrer Infrastruktur, lassen das System parallel zu Ihrem bestehenden Prozess in einer Validierungsphase laufen und schulen Ihr Team. Vollstaendige Dokumentation und Code-Uebergabe.

ROI: Ab wann rechnet es sich?

Die Rechnung ist einfach. Berechnen Sie die monatlichen Kosten der manuellen Arbeit, die der Agent ersetzt (Stunden x Vollkostenstundensatz), ziehen Sie die monatlichen Betriebskosten des Agenten ab (Hosting + API + Wartung) — das ist Ihre monatliche Ersparnis. Teilen Sie die Entwicklungskosten durch die monatliche Ersparnis, und Sie haben die Amortisationsdauer.

Fuer die meisten Stufe-2-Projekte liegt die Amortisationsdauer bei 3-6 Monaten. Ein EUR 10.000 Dokumentenverarbeitungssystem, das 40 Stunden pro Monat bei EUR 40/Stunde Vollkosten einspart, generiert EUR 1.600/Monat an Arbeitskosteneinsparung, abzueglich ~EUR 800/Monat Betriebskosten, fuer einen monatlichen Nettovorteil von ~EUR 800. Amortisation in etwa 12-13 Monaten — oder schneller, wenn Sie die schwerer quantifizierbaren, aber ebenso realen Verbesserungen bei Geschwindigkeit und Konsistenz einbeziehen.

Wenn sich der ROI nicht rechnet

Wenn die manuelle Aufgabe weniger als 20 Stunden pro Monat braucht, verlaengert sich die Amortisationsdauer auf ueber ein Jahr, und Sie sollten ernsthaft abwaegen, ob ein Custom Agent die Investition wert ist. Fuer Aufgaben mit geringem Volumen ist ein Standardtool oder sogar ein gut strukturierter ChatGPT-Prompt mit einem Custom GPT moeglicherweise die kluegere Wahl. Das sagen wir Ihnen schon im Discovery Call.

Bereit loszulegen?

Wenn Sie einen Geschaeftsprozess haben, der von einem Custom AI Agent profitieren koennte, ist der naechste Schritt ein Discovery Call. Wir bewerten Ihren Anwendungsfall, schaetzen Stufe und Zeitrahmen ein und geben Ihnen eine ehrliche Empfehlung, ob eine Individualentwicklung die richtige Investition ist.

Kein Verkaufsdruck. Keine vagen Versprechen ueber "KI-Transformation Ihres Unternehmens". Nur eine praktische Einschaetzung, was machbar ist, was es kostet und was Sie erwarten koennen.

Kostenlosen Discovery Call buchen — oder schauen Sie sich unsere Live-Demos an, um funktionierende Systeme zu sehen, bevor Sie sich auf ein Gespraech einlassen.

Rogue AI • Production Systems •