BETA · LLM privacy & servidores de voz operativos · mejora de GPU en curso para respuestas más rápidas · los paquetes aún pueden cambiar Estado & Roadmap →

Rastreador web: escanee automáticamente su sitio web para obtener contenido de la base de conocimientos

El rastreador web integrado escanea su sitio web existente y lo convierte automáticamente en contenido de base de conocimientos con capacidad de búsqueda. Sin necesidad de copiar texto manualmente.

← ← Volver a la base de conocimiento

¿Qué hace el Rastreador web?

El Rastreador web visita las páginas de su sitio web, extrae el contenido de texto y lo almacena en la base de conocimientos de su bot — todo en minutos, sin ninguna carga manual.

Cómo funciona

  1. Introduzca la URL de inicio y los patrones opcionales de inclusión/exclusión de URL.
  2. Establezca la profundidad de rastreo.
  3. Inicie el rastreo — los elementos de navegación y pie de página se eliminan y el contenido principal se conserva.
  4. El texto se divide automáticamente en fragmentos e se indexa en la base de datos vectorial.
  5. Programe rastreos automáticos periódicos (semanales, mensuales) para mantener actualizada la base de conocimientos.

Limitaciones y uso ético

Se respeta el archivo robots.txt; las páginas con noindex/disallow se omiten. No se extraen imágenes, vídeos ni contenido renderizado por JavaScript. El rastreador solo puede utilizarse en sitios web de su propiedad o para los que esté autorizado a rastrear.