3 études sur 456 000 domaines montrent que llms.txt n’impacte pas vos citations IA. Pourtant Chrome Lighthouse l’audite depuis mai 2026. Voici quand y consacrer du temps, par type de site.

Ce qu’il faut retenir :

  • 3 études (SE Ranking 300k domaines, OtterlyAI 62 100 visites bot, ALLMO 94 000 citations) ne trouvent aucun lien entre llms.txt et la fréquence de citations IA.
  • Google Search le dit explicitement inutile, mais Chrome Lighthouse 13.3 (mai 2026) l’audite quand même pour les agents IA.
  • llms.txt mérite votre temps uniquement si vous publiez de la doc technique consommée par des outils IA tiers (Mintlify, Cursor, copilotes SaaS).
  • Vos vrais leviers de citation sont les domaines référents (32k+), la présence sur Reddit/Quora, les profils G2/Trustpilot et un FCP sous 0,4 seconde.

llms.txt en 2026 : faut-il y consacrer du temps ? La réponse directe

Non, sauf cas précis. Pour 8 sites sur 10, le fichier llms.txt ne déclenchera aucune citation supplémentaire dans ChatGPT, Claude, Gemini ou Perplexity. Les données convergent. Voici mon arbre de décision concret, validé sur les 3 études de référence disponibles fin mai 2026.

Et votre marque, ChatGPT la recommande-t-il ?

Mesurez votre présence et identifiez les marques citées à votre place. Sans carte bancaire.

Tester 14 jours gratuits →

 

Avant de copier-coller un template trouvé sur llmstxt.org, identifiez votre profil de site. C’est lui qui décide, pas l’effet de mode.

Profil de site Verdict Priorité GEO réelle
SaaS B2B avec API/documentation technique (style Stripe, Vercel, Cursor) Oui, à faire Haute (utile aux outils IA tiers)
Média, blog, site éditorial Non prioritaire Basse (gain mesuré : nul)
E-commerce, SaaS B2C, site vitrine local Non, perte de temps Très basse (zéro impact démontré)
Agence, freelance, consultant Optionnel (signal pédago client) Moyenne uniquement comme démonstration

La logique derrière ce tableau s’appuie sur la distinction clé que John Mueller a posée publiquement le 22 mai 2026 sur Bluesky : llms.txt sert la « fonctionnalité » des agents IA, pas la « découverte » par les moteurs. Autrement dit, il aide un agent une fois qu’il est arrivé chez vous, il ne le fait pas venir.

Si votre business ne dépend pas d’agents IA qui parsent votre documentation pour l’exécuter, le rapport coût/gain s’effondre.

Qu’est-ce que le fichier llms.txt et à quoi sert-il réellement ?

llms txt utile ou non pour le geo

llms.txt est un fichier Markdown placé à la racine d’un domaine (exemple.com/llms.txt) qui donne aux grands modèles de langage un index curaté du contenu prioritaire d’un site. La spec a été proposée par Jeremy Howard d’Answer.AI en septembre 2024 sur llmstxt.org.

Son objectif initial est simple : réduire le bruit du HTML pour les LLM. Une page web standard contient navigation, scripts, pop-ups et trackers que les modèles doivent filtrer avant d’atteindre le contenu réel. llms.txt propose un résumé Markdown propre. Économie de tokens, parsing plus rapide.

La proposition originale de Jeremy Howard (Answer.AI, 2024)

La spec définit deux variantes. Le fichier llms.txt contient une table des matières avec des descriptions d’une ligne pour chaque ressource importante. Le fichier llms-full.txt embarque le contenu complet de ces ressources en Markdown.

Howard formule clairement l’intention : « Une proposition pour standardiser un fichier /llms.txt qui fournit des informations pour aider les LLM à utiliser un site au moment de l’inférence. » L’expression clé est « inference time », pas « ranking time ». L’auteur ne promet rien sur la visibilité dans les réponses IA.

Anthropic (Claude), Cursor et Mintlify le supportent officiellement. OpenAI, Perplexity et Google ne l’utilisent pas comme signal de citation. Meta et Mistral non plus.

La différence avec robots.txt et le sitemap.xml

Ces trois fichiers sont souvent confondus. Ils jouent pourtant des rôles distincts.

  • robots.txt contrôle l’accès des crawlers (autoriser ou bloquer GPTBot, ClaudeBot, etc.).
  • sitemap.xml liste les URLs à indexer par les moteurs de recherche.
  • llms.txt propose un résumé optimisé à des LLM qui voudraient consommer rapidement votre contenu.

Comparer llms.txt à robots.txt est trompeur. robots.txt est un standard de facto respecté par 100 % des crawlers majeurs depuis 1994. llms.txt n’est pas standardisé, pas obligatoire, et reconnu par moins de 10 % des plateformes IA.

Les 3 études qui démontrent que llms.txt n’impacte pas les citations IA

Trois recherches indépendantes, publiées entre novembre 2025 et avril 2026, totalisent 456 000 domaines et plus de 156 000 citations IA analysées. Aucune ne trouve d’effet positif de llms.txt sur la visibilité dans les réponses IA. C’est la convergence qui rend la conclusion solide.

SE Ranking : 300 000 domaines, aucune corrélation mesurable

SE Ranking a publié en novembre 2025 l’étude la plus large à ce jour. L’équipe a analysé 300 000 domaines, croisé la présence d’un fichier llms.txt avec leur fréquence de citation par les principaux LLM, puis appliqué une analyse statistique classique et un modèle XGBoost.

Résultat principal : retirer la variable llms.txt du modèle prédictif a amélioré la précision. Le fichier introduisait du bruit, pas du signal. Adoption mesurée : 10,13 % des domaines. Parmi les 50 domaines les plus cités par les IA, un seul possédait un llms.txt.

L’étude identifie les vrais prédicteurs de citation :

  • Sites avec plus de 32 000 domaines référents : 3,5 fois plus cités par ChatGPT
  • Présence sur Reddit et Quora (millions de mentions) : 4 fois plus de chances d’être cité
  • Profils sur Trustpilot, G2, Capterra, Yelp : 3 fois plus de chances pour ChatGPT
  • Pages avec FCP sous 0,4 seconde : 6,7 citations en moyenne vs 2,1 pour les pages lentes

OtterlyAI : 84 visites bot sur 62 100 (0,1 %)

OtterlyAI a mené une expérience plus terrain en février 2026. L’équipe a déployé un llms.txt valide à la racine d’un site et a monitoré les logs serveur pendant 90 jours, en isolant les user-agents IA.

Sur 62 100 visites de bots IA enregistrées sur la période, seules 84 ont ciblé /llms.txt. Soit 0,1 % du trafic agentique IA total. Une page de contenu standard du même site recevait en moyenne 265 visites bot. llms.txt a sous-performé d’un facteur 3 par rapport à une page lambda.

Conclusion d’OtterlyAI : « Du point de vue des bots, llms.txt est quasi-invisible. » L’éditeur a même retiré llms.txt de son audit GEO public à la suite de cette étude.

ALLMO : 94 000 URLs citées, llms.txt présent dans moins de 1 %

ALLMO a pris l’angle inverse. Plutôt que de tracker les bots, l’équipe a analysé 94 000 URLs effectivement citées dans 11 000 réponses IA collectées entre août et décembre 2025. Modèles inclus : ChatGPT, Claude, Gemini, Grok et Perplexity.

Si llms.txt jouait un rôle, on s’attendrait à le trouver chez environ 10 % des sites cités, proportionnellement au taux d’adoption global. En réalité, il était présent dans moins de 1 % des 120 sites analysés en profondeur. L’effet est négligeable et reproductible sur 5 modèles différents.

Les 3 études convergent sur un constat unique : llms.txt n’est ni un signal de classement, ni un signal de découverte pour les principaux moteurs IA en 2026.

Les chiffres-clés à retenir

  • 10,13 % : taux d’adoption mondial de llms.txt (SE Ranking, 300 000 domaines)
  • 0,1 % : part du trafic bot IA qui consulte le fichier (OtterlyAI, 62 100 visites)
  • 3,5x : multiplicateur de citations ChatGPT pour les sites avec plus de 32 000 domaines référents
  • 6,7 vs 2,1 : citations moyennes pour les pages avec FCP sous 0,4 seconde contre les pages lentes

Pourquoi Chrome Lighthouse audite-t-il llms.txt si Google Search dit l’inverse ?

C’est la contradiction la plus discutée du printemps 2026. Google Search a publié mi-mai 2026 un guide officiel affirmant que les sites n’ont besoin ni de llms.txt, ni de versions Markdown, ni de balisage spécifique pour apparaître dans les fonctionnalités IA de Google Search. Quelques jours plus tard, Chrome a déployé Lighthouse 13.3 qui audite la présence de llms.txt à la racine du domaine.

La cohérence apparaît dès qu’on sépare deux missions distinctes : être trouvé (Search) versus être utilisable par un agent (Chrome/Lighthouse).

La distinction « Discoverability vs Functionality » de John Mueller

Lily Ray a interpellé John Mueller sur Bluesky le 22 mai 2026 en pointant l’ironie : Google utilise lui-même llms.txt et des pages Markdown sur ses propres propriétés (developers.google.com) tout en disant aux SEO que c’est inutile. Mueller a répondu en posant une distinction qu’il juge fondamentale.

  • Discoverability : être trouvé par un moteur de recherche. C’est le SEO classique. llms.txt n’y joue aucun rôle.
  • Functionality : aider un agent ou un outil IA à accomplir une tâche une fois sur votre site. C’est là que llms.txt peut servir, sur de la documentation technique consommée par des assistants de code.

Mueller a été explicite : créer une version Markdown des caractéristiques d’une chaussure ne génère pas plus de ventes. Le périmètre utile se limite aux sites de documentation technique. Il qualifie même le besoin de « béquille temporaire », les LLM sachant de mieux en mieux parser du HTML brut.

Ce que change Lighthouse 13.3 (mai 2026)

Lighthouse 13.3 a sorti le 7 mai 2026 la catégorie Agentic Browsing de son statut expérimental. Elle est désormais activée par défaut. PageSpeed Insights l’a reçue dans les 2 semaines suivantes. Chrome 150 DevTools dans la foulée.

L’audit ne produit pas un score 0-100 pondéré comme Performance. Il affiche un ratio de réussite fractionnaire avec des pass/fail/warning sur chaque critère. Les contrôles couvrent :

  • La présence d’un résumé machine-readable à la racine (llms.txt)
  • L’intégration WebMCP (exposition des actions du site aux agents)
  • La qualité de l’arbre d’accessibilité (a11y tree)
  • La stabilité du layout (Cumulative Layout Shift)

Un audit Lighthouse qui flagge l’absence de llms.txt n’est pas un signal de classement Google Search. C’est un indicateur de préparation à l’agentic web. Les deux scopes ne se chevauchent pas.

Quand llms.txt vaut vraiment 30 minutes de votre temps

Trois cas concrets justifient la mise en place. Hors de ceux-là, j’arbitre contre.

Cas 1 : Documentation technique consommée par des assistants de code. Si vos pages /docs servent de référence à Cursor, Continue, Claude Code ou des copilotes IA internes, un llms.txt avec llms-full.txt apporte une vraie économie de tokens. Stripe, Vercel, Mintlify, Cursor ont implémenté le fichier dans cette logique précise. Les outils IA tiers gagnent en vitesse et en coût d’inférence.

Cas 2 : Plateforme SaaS B2B avec produit consommé en API ou via intégrations. Si vos clients construisent des automatisations qui interrogent votre doc, leur agent IA est votre cible. Donner une porte d’entrée propre réduit les frictions et améliore la satisfaction des intégrateurs.

Cas 3 : Site éditorial spécialisé avec ambition d’être cité dans des outils verticaux. Cas plus rare, mais valable si vous publiez des données de référence (statistiques sectorielles, base de connaissances métier) qu’un outil IA niche pourrait ingérer. Le bénéfice reste limité, mais le coût est minimal.

Dans tous les cas, le coût marginal de création est faible (15 à 30 minutes pour un site bien structuré). Le gain n’est pas en visibilité IA grand public, il est en qualité d’expérience pour les agents qui touchent déjà votre contenu.

Quand llms.txt est une perte de temps : 4 profils concernés

Quatre profils n’ont aucun retour mesurable à attendre. Je passe mon temps ailleurs.

Site e-commerce généraliste. Vos pages produits, vos descriptions et vos avis sont déjà parsés par les LLM via HTML standard. Un llms.txt qui pointe vers /collections/chaussures n’augmentera pas vos recommandations dans ChatGPT. Vos vrais leviers : Trustpilot, Reddit, Quora, fiches Google Business, presse spécialisée.

SaaS B2C grand public. Spotify, Netflix, Airbnb n’ont pas besoin de llms.txt pour être cités. Les LLM les connaissent via la masse d’avis, d’articles et de citations existantes. La marque pèse plus que le fichier.

Site média ou blog éditorial. Vos articles individuels portent la valeur, pas un fichier racine. Mieux vaut investir dans la fraîcheur du contenu et le balisage Schema.org adapté.

Site vitrine local ou TPE. Le ROI est nul. Votre fiche Google Business, vos avis Google et votre maillage local font 100 % du travail de visibilité IA.

Les 5 vraies priorités GEO à exécuter avant llms.txt

Si vous avez 4 heures à investir dans votre visibilité IA cette semaine, voici dans quel ordre je les utilise. Toutes ces priorités sont sourcées par les mêmes études qui démontent llms.txt.

1. Travailler vos domaines référents. Le seuil de 32 000 backlinks de SE Ranking sépare les sites « 3,5x plus cités » des autres. Une campagne de digital PR ciblée bat tout fichier technique.

2. Construire une présence Reddit et Quora. Les domaines avec millions de mentions sur ces plateformes ont 4 fois plus de chances d’être cités. Les LLM y trouvent la voix réelle des utilisateurs. Réponses utiles, pas spam.

3. Créer des profils G2, Capterra, Trustpilot complets. 3x plus de chances d’être cité par ChatGPT pour les sites présents sur ces plateformes. Le ROI est immédiat et mesurable.

4. Optimiser le First Contentful Paint sous 0,4 seconde. 6,7 citations en moyenne pour les pages rapides, contre 2,1 pour les lentes. La performance n’est pas qu’un signal Core Web Vitals, c’est un signal de priorisation IA.

5. Implémenter un chunking propre et un balisage Schema.org actualisé. Les LLM extraient des blocs autonomes, pas des articles entiers. Les paragraphes de 150 à 300 mots, les titres en questions, les listes structurées augmentent la probabilité d’extraction.

Comment créer un llms.txt propre en 15 minutes (si vous y allez)

Vous tombez dans un des 3 cas où ça vaut le coup ? Voici la version minimale qui respecte la spec llmstxt.org sans surcharger votre site.

Étape 1 : Listez vos 10 à 20 pages prioritaires. Documentation, pages produit critiques, guides de référence, API. Pas tout le site.

Étape 2 : Rédigez une description d’une ligne par ressource. 80 caractères maximum. Précise, factuelle, sans marketing.

Étape 3 : Structurez en Markdown selon le format officiel. Un H1 avec le nom du site, un paragraphe de blockquote pour le contexte, puis des sections H2 avec listes de liens.

Étape 4 : Déployez à la racine. Le fichier doit être accessible à votredomaine.com/llms.txt en HTTP 200, type text/markdown ou text/plain.

Étape 5 : Soumettez l’URL dans Google Search Console pour accélérer l’indexation. Une étude de cas dev5310 a montré que cette soumission peut déclencher des passages de OAI-SearchBot et ChatGPT-User en moins de 4 jours.

Étape 6 : Monitorez les logs serveur pendant 30 jours. Filtrez les user-agents IA. Si vous voyez moins de 10 hits sur /llms.txt, c’est cohérent avec les chiffres OtterlyAI. Pas grave, vous l’avez fait pour les intégrateurs, pas pour Google.

Un llms-full.txt en complément (export Markdown du contenu réel) ne se justifie que pour la documentation technique. Pour le reste, la table des matières suffit.

Mon verdict final sur llms.txt en 2026

llms.txt n’est pas un levier GEO en 2026. Les données convergent sur 3 études indépendantes et la position officielle de Google Search le confirme. Le fichier sert la fonctionnalité des agents IA, pas la découverte par les moteurs IA grand public. 30 minutes investies dans un profil G2 ou une réponse Reddit utile produiront plus de citations que n’importe quel llms.txt. Pour les sites de documentation technique consommés par des outils IA tiers, l’intérêt existe et le coût est minime. Pour 80 % des sites, c’est une perte de temps.

Pour vérifier l’impact réel de vos optimisations GEO sur vos citations IA, testez Cockpyt AI gratuitement pendant 14 jours.

FAQ : vos questions sur llms.txt en 2026

llms.txt est-il un facteur de classement Google ?

Non. Google Search a confirmé en mai 2026 que llms.txt n’est utilisé ni dans les AI Overviews, ni dans AI Mode, ni dans les classements traditionnels. Gary Illyes l’a comparé en juillet 2025 à la balise meta keywords abandonnée.

ChatGPT lit-il mon llms.txt ?

OpenAI n’a pas communiqué officiellement sur le sujet. Les expériences logs d’OtterlyAI et d’autres acteurs indépendants montrent que les bots d’OpenAI (OAI-SearchBot, ChatGPT-User) accèdent rarement directement au fichier. Claude (Anthropic) est le seul grand LLM à avoir explicitement intégré le support.

Faut-il un llms.txt pour passer l’audit Agentic Browsing de Lighthouse ?

Oui pour passer ce critère spécifique, non pour votre SEO ou GEO. L’audit Lighthouse Agentic Browsing est un signal de préparation aux agents IA, sans lien avec le classement Google Search ou la visibilité dans les réponses IA grand public.

Quelle différence entre llms.txt et llms-full.txt ?

llms.txt est une table des matières avec descriptions courtes. llms-full.txt embarque le contenu Markdown complet des ressources listées. Le second est utile pour la documentation technique, inutile pour un site éditorial classique.

WordPress génère-t-il automatiquement un llms.txt ?

Yoast SEO et Rank Math proposent une génération automatique depuis fin 2025. La fonctionnalité crée un fichier basé sur le sitemap XML existant. Le résultat est souvent trop long et peu sélectif. Une rédaction manuelle de 15 minutes produit un fichier plus utile.

Combien coûte la mise en place d’un llms.txt ?

15 à 30 minutes de travail pour un site bien structuré. Aucune dépendance technique, pas de plugin requis. Le coût caché est le coût d’opportunité : ce temps investi ailleurs (digital PR, profils G2, fraîcheur de contenu) produit un ROI mesurable.

llms.txt va-t-il devenir obligatoire en 2027 ?

Aucun signal en ce sens. Le standard n’est pas validé par le W3C ni adopté par OpenAI, Google, Meta ou Mistral comme signal de citation. L’intégration dans Lighthouse 13.3 ne préfigure pas une obligation pour le SEO Search. La situation peut évoluer si l’agentic web décolle, mais rien ne le garantit aujourd’hui.

Sources

  • SE Ranking, « LLMs.txt: Why Brands Rely On It and Why It Doesn’t Work » (novembre 2025) — étude sur 300 000 domaines. seranking.com/blog/llms-txt
  • OtterlyAI, « Llms.txt Experiment: What Marketers Get Wrong about llms.txt » (Thomas Peham, 5 février 2026) — analyse de 62 100 visites bot IA sur 90 jours. otterly.ai/blog/the-llms-txt-experiment
  • ALLMO, « LLMs.txt for AI Search Report 2026 » (janvier 2026) — 94 000 URLs citées analysées. allmo.ai/articles/llms-txt
  • Abondance, « Le fichier llms.txt ne sert à rien, mais Lighthouse le vérifie quand même » (Johan Sellitto, 22 mai 2026) — position John Mueller. abondance.com
  • Chrome for Developers, « Lighthouse Agentic Browsing scoring » (mise à jour 5 mai 2026). developer.chrome.com
  • Search Engine Journal, « LLMs.txt Shows No Clear Effect On AI Citations, Based On 300k Domains » (Matt G. Southern, novembre 2025). searchenginejournal.com
  • llmstxt.org — spécification originale par Jeremy Howard, Answer.AI (septembre 2024). llmstxt.org
Florian Zorgnotti

Co-fondateur de Cockpyt AI et consultant SEO à Nice depuis 2016. J’ai mené plus de 300 projets, avec une expertise sur WordPress, Shopify et le GEO pour développer la visibilité des marques sur les moteurs de recherche et les IA.