Ce que fait un validateur llms.txt
Ce validateur récupère le fichier `/llms.txt` (et optionnellement `/llms-full.txt`) depuis votre domaine, le parse comme Markdown selon la spec llmstxt.org, et vous montre exactement ce qu'un agent IA verra : titre H1, résumé en blockquote, sections H2 avec leurs liens bullets.
`llms.txt` est essentiellement un plan de site écrit pour les modèles de langage, similaire à la manière dont `robots.txt` fonctionne pour les crawlers de recherche. ChatGPT, Claude, Perplexity et d'autres outils IA l'utilisent pour comprendre la structure d'un site sans broyer le HTML complet. Un bon `llms.txt` améliore mesurablement la qualité des réponses IA sur votre produit.
Le validateur fait trois jobs : il montre le fichier brut, il le parse en arbre (titre, résumé, sections, liens), et il HEAD-probe les 20 premiers liens (avec un fallback GET-range) pour que vous voyiez instantanément si une référence renvoie un 404.
Mode d'emploi
- Entrez un domaine (par exemple `exemple.fr`) ou une URL complète se terminant par `/llms.txt`. On préfixe automatiquement `https://` s'il manque.
- Choisissez un fichier : `llms.txt` (navigation concise), `llms-full.txt` (contenu complet en un fichier) ou Les deux - on récupère les deux pour que vous puissiez les diff.
- Cliquez sur "Vérifier". On récupère avec un timeout de 8 secondes, on parse le Markdown, et on probe les liens.
- Le panneau Arbre parsé montre le titre, le résumé, et les sections H2 avec leurs bullets. Chaque lien reçoit un badge de santé coloré (200 / 3xx / 4xx / timeout).
- Le panneau Issues flague les pièces manquantes : pas de H1, pas de sections, bullet malformé, Content-Type suspect, erreur HTTP. Chaque issue porte un numéro de ligne.
- La vue brute dans une section dépliable montre exactement ce qu'on a reçu du serveur - pratique pour diff contre la sortie de votre CMS.
- Corrigez, redéployez, cliquez sur "Vérifier" à nouveau. Le validateur ne cache jamais ; chaque requête récupère frais.
Quand cet outil est utile
Six situations où le validateur `llms.txt` vous épargne une session de débogage :
- Premier déploiement de `llms.txt`. Vous venez d'en livrer un et voulez confirmer que le format est correct avant que les agents IA ne le découvrent. Le validateur attrape les H1 manquants, bullets malformés, et URLs relatives que certains parsers rejettent.
- Conséquence de migration CMS. Votre liste de liens dans `llms.txt` peut maintenant pointer vers des pages mortes. La sonde de santé en 4 secondes vous montre chaque bullet qui 404.
- Livrable d'audit AI-SEO. Un client veut un rapport "à quoi ressemble votre site pour ChatGPT et Claude" - la sortie du validateur est un point de départ propre, copier-collable.
- Diff de variantes : le mode "Les deux" pulle `llms.txt` et `llms-full.txt` en parallèle pour que vous puissiez confirmer qu'ils ne se sont pas désynchronisés (sections différentes, dates périmées, pages manquantes).
- Votre générateur d'étape de build a commencé à livrer un fichier cassé. Le parser d'Anthropic le refuse mais le message d'erreur est opaque. Le validateur vous pointe vers la ligne exacte.
- Recherche concurrentielle. Mettez le domaine d'un concurrent, étudiez sa structure `llms.txt`, apprenez ce qu'il pense valoir la peine de surfacer.
Liés : validateur robots.txt + sitemap.xml, aperçu OpenGraph, consultation DNS, inspecteur d'en-têtes HTTP.