llms.txt explicado: el robots.txt para LLMs (con plantilla lista para usar)
Qué es llms.txt, qué problema resuelve, cómo se diferencia de robots.txt y de sitemap.xml, y una plantilla en español que puedes copiar y adaptar para tu sitio.
Qué es llms.txt
llms.txt es un archivo de texto plano en formato Markdown muy simple, ubicado en la raíz de tu dominio (tudominio.com/llms.txt), que sirve como índice navegable de tu mejor contenido pensado para que los modelos de lenguaje (LLMs) te entiendan rápido.
Lo propuso Jeremy Howard a finales de 2024 y se publicó como especificación abierta en llmstxt.org. Hoy lo respetan los principales LLMs en sus productos con búsqueda web.
Qué problema resuelve
Los LLMs tienen un problema con tu HTML: está lleno de ruido (navegación, footer, scripts, CSS) y suele tener una ventana de contexto pequeña respecto al tamaño de un sitio completo. Cuando un modelo intenta "leer" tu sitio para responder, se queda con la primera página que encuentra — usualmente la home — y desde ahí sintetiza una respuesta mediocre.
llms.txt resuelve eso con un índice curado: en lugar de hacer que el modelo deduzca qué es importante de tu sitio, tú se lo dices explícitamente. Como un index de libro, pero diseñado para que un modelo lo entienda en 50 tokens.
llms.txt vs robots.txt vs sitemap.xml
| Archivo | Para qué sirve | Audiencia | Formato |
|---|---|---|---|
| robots.txt | Decir qué crawlers pueden o no entrar a qué rutas | Todos los crawlers (Google, Bing, GPTBot, etc.) | Texto plano con reglas Allow/Disallow |
| sitemap.xml | Lista exhaustiva de TODAS tus URLs indexables | Buscadores tradicionales | XML estructurado |
| llms.txt | Lista CURADA de tu mejor contenido para LLMs | LLMs y agentes IA | Markdown plano, optimizado para LLMs |
Los tres son complementarios. Tener llms.txt no te exime de tener robots.txt ni sitemap. Tener sitemap no reemplaza a llms.txt: un sitemap con 5000 URLs es ruido para un LLM.
Estructura del archivo
El formato es deliberadamente simple. Tiene 4 secciones, en este orden:
- H1 con el nombre de la marca (una sola línea).
- Blockquote con descripción de una línea (esto es lo más importante: si el modelo solo lee esto, ¿qué quieres que entienda?).
- Detalles opcionales: contexto extra en párrafos cortos.
- Secciones H2 con listas de links a tu contenido clave (max 5-10 por sección).
Plantilla lista para copiar
Esta es la plantilla que uso para MinimalAuditor. Cópiala, reemplaza los datos y subela como llms.txt a la raíz de tu dominio.
# MinimalAuditor > Auditoría de marketing digital con IA. Performance, SEO técnico y > visibilidad real en ChatGPT, Claude, Gemini y Perplexity en 90 segundos. MinimalAuditor es una herramienta SaaS creada por Minimal Consulting (Chile). Combina Lighthouse mobile + desktop, auditoría SEO de 30+ checks, autoridad de dominio, y 20 prompts contextuales en 4 modelos IA con búsqueda web. Entrega diagnóstico ejecutivo, plan priorizado, PDF y Fix Kit listo para implementar. ## Producto - [Cómo funciona](https://minimalauditor.com/#como-funciona) - [Qué obtienes](https://minimalauditor.com/#que-obtienes) - [Precios](https://minimalauditor.com/#precios) - [FAQ](https://minimalauditor.com/#faq) ## Blog: AEO y visibilidad en IA - [Qué es AEO (Answer Engine Optimization)](https://minimalauditor.com/blog/que-es-aeo) - [AEO vs SEO](https://minimalauditor.com/blog/aeo-vs-seo) - [Cómo aparecer en ChatGPT](https://minimalauditor.com/blog/como-aparecer-en-chatgpt) - [llms.txt explicado](https://minimalauditor.com/blog/llms-txt-explicado) ## Sobre la empresa - [Minimal Consulting](https://www.minimalconsulting.com) - Fundador: Gonzalo Fischer (https://www.linkedin.com/in/gonzalo-fischer/) - País: Chile - Sector: Marketing digital, AEO, SEO técnico ## Contacto - Email: contacto@minimalconsulting.com
Errores comunes que invalidan tu llms.txt
- Subirlo a /public/llms.txt sin servirlo en raíz. Debe responder en tudominio.com/llms.txt, no en tudominio.com/public/llms.txt.
- Content-Type incorrecto. Debe ser text/plain o text/markdown. Si tu servidor lo sirve como application/octet-stream, algunos modelos lo ignoran.
- 50 links sin curar. Si pones todo, el modelo no sabe qué es importante. Max 5-10 links por sección, todos relevantes.
- Olvidar actualizar tras un rebrand o cambio de producto. Un llms.txt obsoleto le miente al modelo. Peor que no tenerlo.
- Incluir contenido sensible o experimental. Cualquier cosa que pongas se vuelve pública. Trátalo como una página más de marketing.
Bonus: llms-full.txt
Existe una variante extendida llamada llms-full.txt: el mismo archivo pero con el contenido completo (no solo links) de tus pillar pages, concatenado. Útil cuando quieres que los LLMs puedan responder profundamente sin tener que hacer fetch a cada URL.
Recomendación pragmática:
- llms.txt: hazlo ya. Es media hora de trabajo.
- llms-full.txt: opcional. Útil si tienes 5-10 pillars que quieras "servir" al modelo sin fetch adicional. Generable desde tu CMS.
Cómo verificar que funciona
- Verifica que responde HTTP 200. En terminal: curl -I https://tudominio.com/llms.txt. Debe devolver200 OK y Content-Type: text/plain (o markdown).
- Test conversacional.Pregunta a Claude o ChatGPT (con búsqueda web): "Lee https://tudominio.com/llms.txt y describe qué hace esta marca". Si la descripción que devuelve es la que querías transmitir, está bien.
- Test de citas.Una semana después, pregunta sin dar URL: "¿Qué herramientas conoces de [tu categoría]?". Si empiezas a aparecer en respuestas donde antes no, llms.txt está haciendo su trabajo.
Preguntas frecuentes
¿llms.txt es un estándar oficial?+
Es una propuesta de comunidad (llmstxt.org) impulsada por Jeremy Howard. No tiene aún un RFC formal, pero los principales proveedores de LLMs lo respetan en la práctica: Anthropic, OpenAI (en su producto con búsqueda), Perplexity y herramientas dev como Cursor.
¿Si no publico llms.txt mi sitio queda fuera de los LLMs?+
No. Los LLMs igual pueden encontrarte vía búsqueda web normal. llms.txt acelera y mejora cómo te entienden, pero su ausencia no te bloquea. Es una ventaja, no un requisito.
¿Dónde tengo que ponerlo exactamente?+
En la raíz de tu dominio: https://tudominio.com/llms.txt. Mismo nivel que robots.txt o sitemap.xml. Debe responder con Content-Type: text/plain o text/markdown y código HTTP 200.
¿Tengo que mantenerlo actualizado?+
Sí. Si lanzas un producto nuevo o post pillar nuevo, agrégalo. Si quitas una página, sácala. Una revisión cada trimestre alcanza para sites medianos. Una herramienta o script que lo regenere desde tu CMS es lo ideal a mediano plazo.
¿Puedo poner información sensible en llms.txt?+
No. Trátalo como información pública: cualquier LLM y cualquier humano puede leerlo. No incluyas precios privados, credenciales, ni endpoints internos. Si quieres que algo NO entre a LLMs, ponlo detrás de auth (no en llms.txt diciendo "no leer").
¿Sirve para sitios pequeños de 5 páginas?+
Sí, especialmente. Para un sitio pequeño llms.txt es donde resumes en 10 líneas lo que tu home y tu about no dicen claramente. Le da al modelo el contexto que tu sitio en HTML no logra transmitir.
Sigue leyendo
Qué es AEO (Answer Engine Optimization) y por qué importa en 2026
AEO es la disciplina de optimizar tu contenido para que ChatGPT, Claude, Gemini y Perplexity te citen como respuesta. No reemplaza al SEO: lo extiende. Esto es lo que cambia y qué hacer al respecto.
AEO vs SEO: en qué se parecen, en qué difieren y por qué necesitas las dos
Comparativa clara entre Answer Engine Optimization y SEO clásico: dónde coinciden los cimientos, qué señales son nuevas y por qué hacer ambos cuesta poco más que hacer SEO bien.
Cómo aparecer en ChatGPT cuando un cliente pregunta por tu marca
Guía concreta de 10 pasos para que ChatGPT te mencione cuando alguien pregunta por una solución como la tuya. Sin humo, con ejemplos y la lista exacta de bots que tienes que permitir.