Skip to content
ใหม่

EDDI v6 เปิดตัวแล้ว! อ่านบทความ

เริ่มต้น

การเรียงซ้อนโมเดลอัจฉริยะ

การเราท์แบบหลายโมเดลที่ปรับต้นทุนให้เหมาะสม — ลองโมเดลถูกก่อน เพิ่มระดับเมื่อความเชื่อมั่นต่ำ งบประมาณต่อสนทนาและเพดานต้นทุนต่อผู้เช่า

การเรียงซ้อนโมเดลอัจฉริยะ

การเพิ่มประสิทธิภาพต้นทุนอัจฉริยะ

ระบบ Model Cascading ของ EDDI ช่วยให้การเราท์แบบหลายโมเดลที่คำนึงถึงต้นทุน เริ่มด้วยโมเดลที่เร็วและถูก และเพิ่มระดับไปยังโมเดลที่แรงกว่า (และแพงกว่า) โดยอัตโนมัติเมื่อความเชื่อมั่นต่ำ — ลดต้นทุน AI โดยไม่เสียคุณภาพ

ฟีเจอร์การเรียงซ้อน

วิธีการทำงาน

กำหนดค่า cascade chain ของโมเดลเรียงตามต้นทุน สำหรับแต่ละข้อความผู้ใช้ EDDI จะลองโมเดลถูกที่สุดก่อนและประเมินความเชื่อมั่น หากความเชื่อมั่นต่ำกว่าเกณฑ์จะเพิ่มระดับไปยังโมเดลถัดไปใน chain โดยอัตโนมัติ วิธีนี้สามารถลดต้นทุน LLM ได้ 60-80% สำหรับ workload ทั่วไป