Hoe leert de AI van uw documenten?
Het Einstein AI-platform gebruikt een techniek die Retrieval-Augmented Generation (RAG) heet. Kort gezegd: u laadt uw eigen documenten in — handleidingen, FAQ's, productsheets, beleidsdocumenten — en het systeem verwerkt die in een doorzoekbare vectordatabase. Wanneer een gebruiker een vraag stelt, zoekt het systeem in milliseconden naar de meest relevante passages uit uw documenten en stuurt die als context mee naar het taalmodel. Het taalmodel genereert vervolgens een antwoord dat gebaseerd is op uw specifieke kennis, niet op wat er willekeurig op internet te vinden is.
Dit is fundamenteel anders dan een chatbot die alleen is getraind op algemene data. Uw bot weet bijvoorbeeld precies wat uw retourbeleid is, welke versie van uw software momenteel actueel is, of welke producten beschikbaar zijn — omdat die informatie rechtstreeks uit uw eigen documenten komt.
Welke bestandsformaten worden ondersteund?
Het platform ondersteunt een breed scala aan documenttypen:
- PDF — handleidingen, brochures, rapporten, contracten
- Word (.docx) — procedures, beleidsdocumenten, teksten
- Excel (.xlsx) — prijslijsten, producttabellen, FAQ-overzichten
- Platte tekst (.txt, .md) — kennisbankartikelen, release notes
- Webpagina's — via de ingebouwde webcrawler (zie het artikel over Website Crawler)
Bestanden worden bij het uploaden automatisch geïndexeerd. U ziet in het dashboard de indexeerstatus en eventuele verwerkingswaarschuwingen (bijv. als een PDF beveiligd is of afbeeldingen bevat zonder alttext).
Hoe organiseert u uw kennisbank optimaal?
De kwaliteit van de antwoorden die uw bot geeft, hangt sterk af van hoe goed uw kennisbank is opgebouwd. Enkele aanbevelingen:
- Gebruik duidelijke koppen en secties: Het RAG-systeem gebruikt documentstructuur als signaal. Goed gestructureerde PDF's of Word-documenten met koppen leveren betere zoekresultaten op dan ongestructureerde tekst.
- Voeg een FAQ-document toe: Een apart document met de 20–30 meest gestelde vragen en concrete antwoorden versnelt de nauwkeurigheid van de bot enorm.
- Houd documentatie actueel: Verouderde informatie leidt tot verkeerde antwoorden. Stel een reviewcyclus in — bijv. elk kwartaal — en herlaad gewijzigde documenten via het dashboard.
- Gebruik bronlabels: U kunt elk document een label geven (bijv. "Producthandleiding v3.2" of "Retourbeleid 2025"). De bot kan deze labels gebruiken bij bronvermelding, wat het vertrouwen van gebruikers vergroot.
- Splits grote documenten op: Bestanden van meer dan 50 pagina's kunnen worden gesplitst in logische hoofdstukken. Kleinere, gefocuste documenten verbeteren de zoekprecisie.
Privacy en veiligheid van uw documenten
Uw documenten worden opgeslagen in een geïsoleerde omgeving per tenant. Andere klanten van het platform hebben nooit toegang tot uw kennisbank. U kunt documenten op elk moment verwijderen via het dashboard. Als u kiest voor de Strict Privacy Mode of de eigen API-key optie, worden uw documenten uitsluitend verwerkt op de door u gespecificeerde infrastructuur — zie de betreffende artikelen voor meer details.