Festi Market
Teaching AI not to hallucinate
Industrialiser la production de contenu B2B via l'IA tout en éliminant les hallucinations grâce à un prompt engineering itératif. Une étude de cas : apprendre aux modèles de langage à ne pas inventer de mensonges crédibles.
100
Products
8
~5%
After 8 iterations
The final prompt
What we did
Apprendre de ses échecs
Le premier produit semblait parfait jusqu'à ce que nous remarquions l'URL du logo. L'IA avait inventé logo-neumarker-professional.png, en respectant si bien les conventions de nommage du site que le lien paraissait réel.
La documentation B2B du deuxième produit était truffée d'emojis. Le septième inventait des liens de collection qui ne menaient nulle part. Le douzième tronquait les titres techniques, supprimant ainsi les spécifications précises recherchées par les acheteurs.
We didn't try to anticipate every failure upfront. Each mistake became a new rule. "Never invent logo URLs" got added after product one. "Preserve complete titles" came from product twelve. By product fifty, we had eight pages of defense mechanisms built from actual failures, not hypothetical problems. The prompt evolved into a forensic record of how the AI actually misbehaved.
Intégrer la vérification au génératif
The breakthrough was making the AI verify before claiming anything as true. Before any URL went into a product page, it had to search for it. Before listing specs, it had to fetch the manufacturer's page. This wasn't "generate then verify"—it was "verify while generating."
Nous avons rendu l'utilisation de web_search obligatoire pour chaque lien de collection. L'IA ne pouvait plus affirmer l'existence de /collections/professional-griddles sans avoir d'abord effectué une recherche site:festi-market.com.
Pour les données fabricants, web_fetch récupérait les pages réelles, limitant ainsi l'IA aux informations documentées plutôt qu'à des suppositions plausibles.
La contrepartie était la vitesse : le traitement de chaque produit demandait plus de temps. Mais nous avons éliminé trente minutes de vérification a posteriori par produit.
Apprentissage lié au contexte
All 100 products were generated in a single Claude Project. Each correction—"don't invent URLs," "verify links," "preserve titles"—propagated forward. Pattern recognition emerged across products. When the AI consistently struggled with items lacking certain specs, we added explicit handling: "If the manufacturer page doesn't list dimensions, omit that table row rather than guessing."