Skip to content
Neu

EDDI v6 wurde veröffentlicht! Jetzt starten

Jetzt Starten

Intelligente Modell-Kaskadierung

Kostenoptimiertes Multi-Modell-Routing — günstige Modelle zuerst, Eskalation bei niedriger Konfidenz. Budgets pro Konversation und Kostenobergrenzen pro Mandant.

Intelligente Modell-Kaskadierung

Intelligente Kostenoptimierung

EDDIs Modell-Kaskadierungssystem ermöglicht kostenoptimiertes Multi-Modell-Routing. Beginnen Sie mit schnellen, kostengünstigen Modellen und eskalieren Sie automatisch zu leistungsfähigeren (und teureren) Modellen nur bei niedriger Konfidenz — so senken Sie KI-Kosten ohne Qualitätseinbußen.

Kaskadierungsfunktionen

So funktioniert es

Konfigurieren Sie eine Kaskadenkette von Modellen, sortiert nach Kosten. Für jede Benutzernachricht probiert EDDI zunächst das günstigste Modell aus und bewertet die Konfidenz. Fällt die Konfidenz unter den Schwellenwert, wird automatisch zum nächsten Modell in der Kette eskaliert. Dieser Ansatz kann die LLM-Kosten um 60-80% senken für typische Workloads, bei denen die meisten Anfragen einfach genug für kleinere Modelle sind.