Skip to content

EDDI v6开发者预览版现已发布! 立即开始

立即开始

智能模型级联

成本优化的多模型路由 — 先尝试廉价模型,低置信度时升级。每对话预算和租户成本上限。

智能模型级联

智能成本优化

EDDI的模型级联系统实现成本感知的多模型路由。从快速且低廉的模型开始,仅在置信度低时自动升级到更强大(更昂贵)的模型 — 在不牺牲质量的情况下降低AI成本。

级联功能

工作原理

按成本顺序配置模型的级联链。对于每条用户消息,EDDI先尝试最低廉的模型并评估置信度。如果置信度低于阈值,它会自动升级到链中的下一个模型。这种方法可以在典型工作负载中将LLM成本降低60-80%