BETA · privacy LLM's & voice servers operationeel · GPU-upgrade onderweg voor snellere responses · pakketten kunnen nog wijzigen Status & Roadmap →

Intelligente AI-verdeling: hoe het systeem automatisch het juiste model kiest

Hybrid Routing analyseert elke vraag en stuurt die automatisch naar het meest geschikte AI-model. Eenvoudige vragen gaan naar een lichtgewicht lokaal model; complexe vragen naar een premium model. U bespaart kosten zonder in te leveren op kwaliteit.

← ← Terug naar kennisbank

Wat is Hybrid Routing?

Hybrid Routing is een intelligente modelkeuzelaag die voor elke gebruikersvraag automatisch bepaalt welk AI-model het meest geschikt is. Dit combineert twee doelen: maximale kwaliteit voor complexe vragen, en minimale kosten voor eenvoudige vragen.

Hoe werkt het?

Bij elke inkomende vraag analyseert de router een aantal signalen:

Op basis van deze analyse stuurt de router de vraag naar het meest geschikte model uit de door u geconfigureerde modelpool.

Configuratie

In het Einstein-dashboard konfigureert u de routeringsstrategie per bot:

  1. Stel de goedkope modelpool in voor routinevragen (bijv. Mistral 7B of GPT-4o Mini).
  2. Stel de premium modelpool in voor complexe vragen (bijv. Claude 3.5 Sonnet of GPT-4o).
  3. Definieer de drempelwaarde voor complexiteit — u kunt dit instellen op "agressief besparen" (meer vragen naar het goedkope model) of "kwaliteit voorop" (meer vragen naar het premium model).

Besparingspotentieel

Uit analyses van klantgesprekken blijkt dat gemiddeld 60–70% van de vragen routinevragen zijn die uitstekend door een lichtgewicht model worden beantwoord. Met Hybrid Routing kunt u de creditkosten voor die vragen met 50–80% reduceren ten opzichte van altijd het premium model gebruiken.