BETA · LLM privacy & servidores de voz operativos · mejora de GPU en curso para respuestas más rápidas · los paquetes aún pueden cambiar Estado & Roadmap →

Enrutamiento inteligente de IA: cómo el sistema elige automáticamente el modelo adecuado

El Enrutamiento Híbrido analiza cada pregunta y la dirige automáticamente al modelo de IA más adecuado. Las preguntas simples van a un modelo local ligero; las complejas a un modelo premium. Ahorre costes sin sacrificar calidad.

← ← Volver a la base de conocimiento

¿Qué es el Enrutamiento Híbrido?

El Enrutamiento Híbrido es una capa inteligente de selección de modelos que determina automáticamente el modelo de IA más adecuado para cada pregunta entrante — maximizando la calidad en consultas complejas y minimizando los costes en las simples.

Cómo funciona

Para cada pregunta, el enrutador analiza: complejidad de la pregunta, sensibilidad (términos médicos, legales, financieros) y disponibilidad del modelo. En función de estas señales, la dirige al modelo apropiado de su grupo de modelos configurado.

Configuración

  1. Establezca el grupo de modelos de presupuesto para preguntas rutinarias (p. ej., Mistral 7B, GPT-4o Mini).
  2. Establezca el grupo de modelos premium para preguntas complejas (p. ej., Claude 3.5 Sonnet, GPT-4o).
  3. Defina el umbral de complejidad — desde "ahorro agresivo" hasta "calidad primero".

Potencial de ahorro

De media, el 60–70% de las preguntas de los clientes son rutinarias y pueden gestionarse excelentemente con un modelo ligero. El Enrutamiento Híbrido puede reducir los costes de créditos para esas preguntas en un 50–80% en comparación con usar siempre un modelo premium.