Kennisbank: Web-URL’s en links
Deze handleiding geeft je meer inzicht in bottraining met web-URL’s, en waar je op moet letten.
Stappen om je bot te trainen met web-URL’s
- Ga naar “Bot Training” (Bottraining).
- Vul een volledige URL in (inclusief https://) en kies één van de drie web-crawling-modi (hieronder uitgelegd).
- Wacht tot de URL’s zijn opgehaald en gecrawld.
- Selecteer de URL’s en klik op “Train Bot” (Bot trainen).
- Elke URL wordt getraind en toegevoegd aan de tabel hieronder met de juiste status. Wacht tot alle URL’s zijn getraind voordat je de bot gebruikt.
URL-limiet (per Knowledge Base): je kunt tot 4.000 web-URL’s trainen in één Knowledge Base.
URL crawling-modi
Exacte URL
Dit is de aanbevolen optie voor nauwkeurige training. Met de methode Exacte URL crawlt de bot precies de URL die je opgeeft en traint zichzelf daarop.
Stappen:
- Kies de optie “Exact URL” (Exacte URL).
- Vul de URL in die je wilt crawlen en klik op “Get Data” (Gegevens ophalen).
- De URL wordt gecrawld, de bot wordt getraind en de URL wordt toegevoegd aan de “Uploaded Links Table” (Tabel met geüploade links).
Alle URL’s in dit domein
Train je bot met meer informatie van één specifiek domein. De bot crawlt alle pagina’s en links op het opgegeven domein, en laat je daarna kiezen welke URL’s je wilt trainen.
Stappen:
- Kies de optie “All URLs in this domain” (Alle URL’s in dit domein).
- Vul de URL in en klik op “Get Data” (Gegevens ophalen).
- Wacht tot de pagina’s geladen zijn. Daarna zie je een lijst met beschikbare URL’s.
- Kies welke pagina’s relevant zijn voor de training en klik op “Train Bot” (Bot trainen).
Tijdens het selecteren van pagina’s (stap 4) zie je twee lijsten:
- New Pages (Nieuwe pagina’s) - nieuwe URL’s die nog niet in de trainingsdata van de bot staan. Als je deze selecteert, worden ze na de training toegevoegd aan de “Uploaded Links”-tabel.
- Existing Pages (Bestaande pagina’s) - URL’s die al in de trainingsdata van de bot staan en zichtbaar zijn in de “Uploaded Links”-tabel. Als je deze selecteert, worden de geselecteerde URL’s opnieuw ververst.

Alle URL’s met dit pad
De bot crawlt alle pagina’s op de URL die je opgeeft en laat je kiezen welke pagina’s je wilt trainen, op basis van de aanwezigheid van het opgegeven pad in de pagina-URL. De vervolgstappen zijn hetzelfde als bij “Alle URL’s in dit domein”.
Tabel met geüploade links
Alle links en URL’s waarop de bot is getraind, zie je terug in de tabel met geüploade links. Getrainde URL’s kun je verversen (de bot traint opnieuw op de nieuwste informatie) of verwijderen (de informatie wordt uit de kennisbank van de bot gehaald).
Elke URL heeft één van deze drie statussen:
- Getting Data (Gegevens ophalen) - de bot traint opnieuw op deze URL, dus de informatie wordt ververst.
- Trained (Getraind) - de bot heeft succesvol geleerd van deze URL. Je ziet ook “Last data refreshed at” (Laatste keer ververst), zodat je kunt bepalen of een refresh nodig is.
- Failed (Mislukt) - de bot kon niet trainen op deze URL. Je kunt de URL verversen en opnieuw proberen, of de URL verwijderen.

URL’s worden niet direct toegevoegd aan de tabel met geüploade links. Wacht tot alle URL’s in de tabel staan voordat je de bot gebruikt. Korte en relevante data verbetert de prestaties van de bot. Controleer de tabel met geüploade links regelmatig en verwijder oude URL’s voor betere antwoorden.