Qué hace un validador de llms.txt
Este validador descarga el fichero `/llms.txt` (y opcionalmente `/llms-full.txt`) de tu dominio, lo parsea como Markdown según la spec llmstxt.org y te muestra exactamente lo que verá un agente IA: título H1, resumen en blockquote, secciones H2 con sus enlaces en bullets.
`llms.txt` es esencialmente un mapa del sitio escrito para modelos de lenguaje, similar a cómo `robots.txt` funciona para crawlers de búsqueda. ChatGPT, Claude, Perplexity y otras herramientas IA lo usan para entender la estructura de un sitio sin tragarse el HTML completo. Un buen `llms.txt` mejora medidamente la calidad de las respuestas IA sobre tu producto.
El validador hace tres trabajos: muestra el fichero raw, lo parsea en un árbol (título, resumen, secciones, enlaces) y sondea con HEAD los primeros 20 enlaces (con fallback a GET-range) para que veas instantáneamente si alguna referencia devuelve 404.
Cómo usarla
- Introduce un dominio (p. ej. `ejemplo.com`) o una URL completa terminada en `/llms.txt`. Anteponemos `https://` automáticamente si falta.
- Elige un fichero: `llms.txt` (navegación concisa), `llms-full.txt` (contenido completo en un fichero) o Ambos: descargamos ambos para que puedas diffearlos.
- Pulsa "Comprobar". Descargamos con un timeout de 8 segundos, parseamos el Markdown y sondeamos los enlaces.
- El panel Árbol parseado muestra el título, el resumen y las secciones H2 con sus bullets. Cada enlace recibe un badge de salud coloreado (200 / 3xx / 4xx / timeout).
- El panel Issues marca las piezas ausentes: sin H1, sin secciones, bullet mal formado, Content-Type sospechoso, error HTTP. Cada issue lleva un número de línea.
- Vista raw en una sección colapsable muestra exactamente lo que recibimos del servidor, útil para diffear contra la salida de tu CMS.
- Arregla, redespliega, vuelve a pulsar "Comprobar". El validador nunca cachea; cada petición descarga fresco.
Cuándo es útil
Seis situaciones en las que el validador de `llms.txt` te ahorra una sesión de depuración:
- Primer rollout de `llms.txt`. Acabas de publicar uno y quieres confirmar que el formato es correcto antes de que los agentes IA lo descubran. El validador pilla H1s ausentes, bullets mal formados y URLs relativas que algunos parsers rechazan.
- Resaca de migración de CMS. Tu lista de enlaces en `llms.txt` puede apuntar ahora a páginas muertas. La sonda de salud de 4 segundos te muestra cada bullet que da 404.
- Entregable de auditoría AI-SEO. Un cliente quiere un reporte "cómo se ve tu sitio para ChatGPT y Claude": la salida del validador es un punto de partida limpio y copia-pegable.
- Diffear variantes: el modo "Ambos" tira de `llms.txt` y `llms-full.txt` en paralelo para que puedas confirmar que no se han desincronizado (secciones distintas, fechas obsoletas, páginas ausentes).
- Tu generador de paso de build empezó a entregar un fichero roto. El parser de Anthropic lo rechaza pero el mensaje de error es opaco. El validador te apunta a la línea exacta.
- Investigación competitiva. Mete el dominio de un competidor, estudia su estructura de `llms.txt`, aprende qué piensan que merece la pena resaltar.
Relacionadas: validador robots.txt + sitemap.xml, previsualización OpenGraph, consulta DNS, inspector de cabeceras HTTP.