¿Qué es el Enrutamiento Híbrido?
El Enrutamiento Híbrido es una capa inteligente de selección de modelos que determina automáticamente el modelo de IA más adecuado para cada pregunta entrante — maximizando la calidad en consultas complejas y minimizando los costes en las simples.
Cómo funciona
Para cada pregunta, el enrutador analiza: complejidad de la pregunta, sensibilidad (términos médicos, legales, financieros) y disponibilidad del modelo. En función de estas señales, la dirige al modelo apropiado de su grupo de modelos configurado.
Configuración
- Establezca el grupo de modelos de presupuesto para preguntas rutinarias (p. ej., Mistral 7B, GPT-4o Mini).
- Establezca el grupo de modelos premium para preguntas complejas (p. ej., Claude 3.5 Sonnet, GPT-4o).
- Defina el umbral de complejidad — desde "ahorro agresivo" hasta "calidad primero".
Potencial de ahorro
De media, el 60–70% de las preguntas de los clientes son rutinarias y pueden gestionarse excelentemente con un modelo ligero. El Enrutamiento Híbrido puede reducir los costes de créditos para esas preguntas en un 50–80% en comparación con usar siempre un modelo premium.