Skip to content
Nuevo

¡EDDI v6 ya está disponible! Comenzar

Empezar

Cascada de Modelos Inteligente

Enrutamiento multi-modelo optimizado en costes — probar modelos baratos primero, escalar ante baja confianza. Presupuestos por conversación y techos de coste por inquilino.

Cascada de Modelos Inteligente

Optimización Inteligente de Costes

El sistema de Cascada de Modelos de EDDI permite enrutamiento multi-modelo consciente de costes. Comience con modelos rápidos y económicos y escale automáticamente a modelos más potentes (y costosos) solo cuando la confianza es baja — reduciendo costes de IA sin sacrificar calidad.

Funciones de Cascada

Cómo Funciona

Configure una cadena de cascada de modelos ordenados por coste. Para cada mensaje del usuario, EDDI prueba primero el modelo más económico y evalúa la confianza. Si la confianza cae por debajo del umbral, escala automáticamente al siguiente modelo de la cadena. Este enfoque puede reducir los costes de LLM entre un 60-80% para cargas de trabajo típicas donde la mayoría de las consultas son lo suficientemente simples para modelos más pequeños.