Optimisation GEO : comment ChatGPT choisit ses sources

Être indexé par Google ne suffit plus à exister dans les réponses de l’IA. L’optimisation GEO est le sujet de l’étude publiée par AirOps en mars 2026, portant sur 548 534 pages récupérées lors de 15 000 requêtes originales, le confirme avec une précision inédite : ChatGPT récupère bien plus de sources qu’il n’en cite. Entre la récupération d’une page et sa citation dans une réponse, il se joue un processus de sélection invisible, gouverné par des mécanismes que la plupart des équipes marketing ne mesurent pas encore.

Ce n’est ni une question de volume de contenu produit ni même de position dans les SERP traditionnels. C’est une question de compréhension des règles du jeu propres aux moteurs de réponse IA. Ainsi, les marques qui maîtrisent ces règles captent une visibilité que les autres laissent sur la table, souvent sans le savoir.

En résumé : les 7 chiffres clés à retenir sur l’optimisation GEO

85 % des pages récupérées par ChatGPT ne sont jamais citées dans la réponse finale
32,9 % des pages citées n’apparaissaient que dans les SERP d’une requête de fan-out, pas dans la requête originale
89,6 % des requêtes originales génèrent deux fan-out queries ou plus
95 % des requêtes fan-out ont un volume de recherche mensuel nul selon les outils SEO classiques
Les pages classées #1 sur Google sont citées 3,5 fois plus que celles hors top 20
55,8 % des pages citées figuraient dans le top 20 Google pour au moins une requête
Les sites avec une DA entre 20 et 80 captent 63,6 % de toutes les citations

La mécanique cachée de ChatGPT : récupération ≠ citation

Qu’est-ce que la récupération de pages (retrieval) ?

Retrieval (récupération) : processus par lequel ChatGPT, en mode recherche activée, interroge le web pour collecter des pages susceptibles d’alimenter sa réponse. Cette étape précède systématiquement la sélection et la citation. Une page peut être récupérée sans jamais apparaître dans la réponse visible de l’utilisateur.

Lorsqu’un utilisateur soumet une requête à ChatGPT en mode recherche, le modèle ne se contente pas d’interroger un moteur de résultats. Au contraire, il déclenche une séquence en plusieurs étapes : il interroge le web, collecte des pages, évalue leur pertinence, puis synthétise une réponse. Il ne cite alors qu’une partie des sources réellement consultées. Ainsi, cette distinction entre récupération et citation constitue le cœur de l’étude AirOps.

Optimisation GEO : pourquoi 85 % des sources récupérées ne sont jamais citées

Sur les 548 534 pages récupérées par ChatGPT au cours de l’étude, seulement 15 % apparaissent dans la réponse finale. Ainsi, une marque peut être techniquement accessible, correctement indexée, récupérée et évaluée par ChatGPT, mais rester totalement absente de la réponse que l’utilisateur lit.

Ce taux de non-citation ne se répartit pas uniformément selon le type de requête. Les requêtes orientées découverte de produits et les requêtes « comment faire » affichent les taux de citation les plus élevés, à respectivement 18,3 % et 16,9 %. Au contraire, les requêtes de validation et de comparaison s’établissent plus bas, à 11,3 % et 13,1 %.

Deux facteurs structurent fortement la sélection finale. Les pages dont le titre recouvre au moins 50 % des termes de la requête affichent un taux de citation de 20,1 %, contre 9,3 % pour celles avec moins de 10 % de recouvrement, soit un écart multiplicateur de 2,2. Par ailleurs, la lisibilité joue un rôle mesurable : un score Flesch Reading Ease de 50 ou plus est plus fréquent parmi les pages que ChatGPT choisit de citer.

Le tableau ci-dessous synthétise les taux de citation par type d’intention de recherche :

Type de requête	Catégorie	Taux de citation
Découverte produit (Awareness)	Commerciale	18,3 %
Comment faire (How-to)	Informationnelle	16,9 %
Exploration	Informationnelle	~15 %
Définition	Informationnelle	~14 %
Comparaison	Commerciale	13,1 %
Validation	Commerciale	11,3 %

Source : AirOps Research, mars 2026

Le fan-out : la deuxième surface de recherche que les marques ignorent

Comment ChatGPT génère ses requêtes secondaires

Fan-out queries : requêtes secondaires générées automatiquement par ChatGPT à partir d’une requête initiale. Ces sous-requêtes étendent la surface de recherche du modèle bien au-delà du mot-clé de départ, en explorant des angles connexes, des sous-sujets ou des questions complémentaires.

Le phénomène de fan-out est probablement la découverte la plus structurante de cette étude GEO. Sur les 15 000 requêtes originales analysées, ChatGPT a généré deux fan-out queries ou plus dans 89,6 % des cas. Cela porte l’ensemble du corpus de requêtes de 15 000 à 43 233 soit une expansion quasi triple.

Ce chiffre a une implication directe pour les équipes SEO. Ainsi, 32,9 % des pages citées qui figuraient dans un top 20 Google n’y apparaissaient que grâce à une requête fan-out, et non à la requête originale. Autrement dit, près d’un tiers des citations provient de chemins de recherche que les outils de suivi de mots-clés classiques ne tracent pas.

Plus déconcertant encore : 95 % des fan-out queries générées par ChatGPT affichent un volume de recherche mensuel nul selon les métriques SEO traditionnelles. Ces requêtes existent dans la logique de l’IA, pas dans les outils de planification de mots-clés.

Infos/commercial : deux comportements de fan-out très différents

La structure des fan-out queries varie significativement selon la nature de la requête initiale. Pour les requêtes informationnelles, ChatGPT tend à rester proche du libellé original : 39,9 % des fan-out informationnels sont quasi-verbatim. Les requêtes de définition sont les plus stables, restant verbatim à 51,6 %.

Le comportement commercial est sensiblement différent. Les requêtes de comparaison se décomposent en sous-requêtes dans 38,4 % des cas, le taux le plus élevé de toutes les catégories. Une requête comme « HubSpot vs Salesforce » devient ainsi plusieurs recherches distinctes : tarification, fonctionnalités, avis. Pour les équipes qui produisent du contenu à visée commerciale, cela signifie qu’une page de comparaison exhaustive a davantage de chances de capter des citations qu’une page qui ne traite que l’angle principal.

Optimisation GEO : Google reste un signal fort mais pas le seul

Les pages classées #1 sont citées 3,5 fois plus souvent

Le référencement naturel joue un rôle déterminant dans la visibilité IA. En effet, 55,8 % des pages citées figurent dans le top 20 de Google pour au moins une requête de l’étude. Cet avantage se révèle particulièrement marqué en tête du classement.

Les pages classées en première position sur Google obtiennent un taux de citation par ChatGPT de 43,2 %, soit 3,5 fois plus que celles situées hors du top 20. Ainsi, le référencement Google reste un levier clé de visibilité dans les systèmes d’IA. En effet, il ne garantit pas la citation, mais il augmente fortement les probabilités d’être sélectionné. Il offre aussi donc un avantage compétitif dans le processus de choix des sources.

La priorité stratégique se déplace dès lors vers la densification des positions : ne pas simplement viser le top 20, mais concentrer les efforts sur les pages déjà positionnées entre la 10e et la 20e place pour les requêtes à forte intention. Cela permet de les rapprocher du sommet où l’avantage en termes de citation est le plus marqué.

La DA n’est pas le ticket d’entrée qu’on croit pour l’optimisation GEO

L’un des enseignements les plus contre-intuitifs de l’étude concerne l’autorité de domaine (DA). Près des trois quarts des citations vont à des sites dont la DA est inférieure à 80. Les sites avec une DA comprise entre 20 et 80 totalisent 63,6 % de toutes les citations, et le segment DA 20-40 à lui seul dépasse le segment DA 80-100 en volume de citations (26 % contre 25,4 %).

Plus frappant encore, les systèmes récupèrent fréquemment les sites à très haute autorité (DA 80-100). Par contre, ils ne les citent qu’à hauteur de 15 %, soit le taux le plus faible de tous les segments. En revanche, les sites dont le DA se situe entre 0 et 80 obtiennent des taux de citation plus élevés, oscillant entre 21,5 % et 23,6 %.

La visibilité IA ne se gagne pas uniquement par la notoriété de domaine. Elle se construit par la pertinence thématique et la couverture des requêtes. Cela comprend les fan-out queries que les grandes publications ignorent souvent, occupées à couvrir les sujets à fort volume.

Ce que cette étude GEO change pour l’optimisation de votre stratégie de contenu

Les résultats d’AirOps invitent à revoir trois priorités pratiques pour toute équipe contenu ou SEO cherchant à s’imposer dans les réponses IA.

Première priorité : étendre le suivi au-delà des mots-clés primaires

Les outils de suivi de positions mesurent la visibilité sur les requêtes que les équipes ont identifiées. Mais l’expansion du corpus de requêtes de 15 000 à 43 233 lors de l’étude illustre à quel point ChatGPT élargit sa recherche bien au-delà du point de départ. Identifier les fan-out queries générées sur les requêtes stratégiques devient un chantier à part entière.

Deuxième priorité : adapter le format éditorial à l’intention

Les requêtes informationnelles récompensent la profondeur sur le sujet central, tandis que les requêtes commerciales récompensent une couverture modulaire incluant tarification, fonctionnalités, alternatives et comparaisons. Une page unique qui tente de tout couvrir superficiellement se fait systématiquement distancer par des pages organisées autour de sous-intentions spécifiques.

Troisième priorité : utiliser le rafraîchissement de contenu comme levier de fan-out

Les pages déjà positionnées sur des requêtes à fort potentiel peuvent augmenter leur couverture des sujets adjacents que ChatGPT explore lors de ses fan-out. Et pour cela, il n’y a besoin de création de contenus entièrement nouveaux. Les données montrent que 44,2 % de toutes les citations LLM proviennent des 30 premiers pourcents d’un texte (l’introduction). Cela fait de l’optimisation des premières lignes un levier prioritaire pour maximiser les chances d’extraction.

Optimisation GEO : vers une nouvelle mesure de la visibilité

Le référencement ne se mesure plus uniquement en positions et en clics. En effet, l’étude GEO d’AirOps dessine les contours d’une nouvelle discipline. La chaîne de valeur va de la récupération à la sélection, puis de la sélection à la citation. Ainsi, vous pouvez optimiser chaque maillon à condition de bien le connaître.

Les marques qui adaptent dès maintenant leur stratégie éditoriale à cette réalité, en couvrant les fan-out queries, en renforçant l’alignement titre-requête et en améliorant la lisibilité de leurs contenus, construisent une avance difficile à combler. Celles qui continuent à mesurer leur succès uniquement à l’aune des SERP traditionnels risquent de se retrouver récupérées, évaluées… et jamais citées.

FAQ — Vos questions sur l’optimisation GEO et les citations ChatGPT

Qu’est-ce qu’une fan-out query dans le contexte de ChatGPT ?

Une fan-out query est une requête secondaire que ChatGPT génère automatiquement à partir d’une question initiale. Elle lui permet d’élargir sa recherche vers des angles connexes. Sur 15 000 requêtes analysées par AirOps, 89,6 % ont déclenché deux fan-out queries ou plus. Cela porte le total à plus de 43 000 requêtes effectives.

Pourquoi une page bien classée sur Google peut-elle ne pas être citée par ChatGPT ?

Le classement Google favorise l’entrée dans le processus de récupération, mais il ne garantit pas la citation. En effet, l’algorithme évalue ensuite l’alignement entre le titre et la requête, la lisibilité et la couverture des sous-intentions. Ainsi, il peut ignorer une page classée #1 mais peu alignée thématiquement au profit d’une page moins bien positionnée mais plus pertinente.

Une marque avec une faible autorité de domaine peut-elle être citée par ChatGPT ?

Oui. L’étude AirOps montre que les sites avec une DA entre 20 et 40 obtiennent plus de citations que les sites à très haute autorité (DA 80-100). Ils affichent paradoxalement le plus faible taux de conversion récupération-citation (15 %). La pertinence thématique et la couverture des requêtes comptent davantage que la notoriété de domaine.

Comment identifier les fan-out queries générées sur mes requêtes cibles ?

Les outils SEO traditionnels ne les tracent pas : 95 % des fan-out queries ont un volume de recherche nul. Des plateformes spécialisées en analyse IA, comme AirOps, permettent de les cartographier. Une alternative consiste à simuler manuellement les réponses ChatGPT pour identifier les sous-questions abordées dans chaque réponse générée.

Le GEO remplace-t-il le SEO traditionnel ?

Non. Les deux disciplines sont complémentaires. Un bon positionnement sur Google multiplie par 3,5 la probabilité que ChatGPT cite les pages en première position. En revanche, le GEO ajoute une couche d’optimisation spécifique aux moteurs IA : couverture des fan-out queries, alignement titre-requête, lisibilité et structure adaptée à l’extraction automatique.

Quel type de contenu obtient les meilleurs taux de citation dans ChatGPT ?

Les contenus orientés découverte de produits et les guides pratiques (how-to) affichent les taux les plus élevés, avec respectivement 18,3 % et 16,9 %. Au contraire, les pages dont le recouvrement titre-requête atteint au moins 50 %. En plus, elles génèrent 2,2 fois plus de citations que celles dont le recouvrement reste inférieur à 10 %.

Source : The Influence of Retrieval, Fan-out, and Google SERPs on ChatGPT Citations — AirOps Research, Oshen Davidson — Mars 2026

Influence Start

Optimisation GEO : comment ChatGPT choisit ses sources

En résumé : les 7 chiffres clés à retenir sur l’optimisation GEO

La mécanique cachée de ChatGPT : récupération ≠ citation

Qu’est-ce que la récupération de pages (retrieval) ?

Optimisation GEO : pourquoi 85 % des sources récupérées ne sont jamais citées

Le fan-out : la deuxième surface de recherche que les marques ignorent

Comment ChatGPT génère ses requêtes secondaires

Infos/commercial : deux comportements de fan-out très différents

Optimisation GEO : Google reste un signal fort mais pas le seul

Les pages classées #1 sont citées 3,5 fois plus souvent

La DA n’est pas le ticket d’entrée qu’on croit pour l’optimisation GEO

Ce que cette étude GEO change pour l’optimisation de votre stratégie de contenu

Première priorité : étendre le suivi au-delà des mots-clés primaires

Deuxième priorité : adapter le format éditorial à l’intention

Troisième priorité : utiliser le rafraîchissement de contenu comme levier de fan-out

Optimisation GEO : vers une nouvelle mesure de la visibilité

FAQ — Vos questions sur l’optimisation GEO et les citations ChatGPT

Qu’est-ce qu’une fan-out query dans le contexte de ChatGPT ?

Pourquoi une page bien classée sur Google peut-elle ne pas être citée par ChatGPT ?

Une marque avec une faible autorité de domaine peut-elle être citée par ChatGPT ?

Comment identifier les fan-out queries générées sur mes requêtes cibles ?

Le GEO remplace-t-il le SEO traditionnel ?

Quel type de contenu obtient les meilleurs taux de citation dans ChatGPT ?

J’aime ça :

Laisser un commentaireAnnuler la réponse.

E-Niort, référence client

Tendances e-commerce 2023 pour mieux vendre

Atteignez vos objectifs commerciaux grâce aux réseaux sociaux !

Influence Start

Optimisation GEO : comment ChatGPT choisit ses sources

En résumé : les 7 chiffres clés à retenir sur l’optimisation GEO

La mécanique cachée de ChatGPT : récupération ≠ citation

Qu’est-ce que la récupération de pages (retrieval) ?

Optimisation GEO : pourquoi 85 % des sources récupérées ne sont jamais citées

Le fan-out : la deuxième surface de recherche que les marques ignorent

Comment ChatGPT génère ses requêtes secondaires

Infos/commercial : deux comportements de fan-out très différents

Optimisation GEO : Google reste un signal fort mais pas le seul

Les pages classées #1 sont citées 3,5 fois plus souvent

La DA n’est pas le ticket d’entrée qu’on croit pour l’optimisation GEO

Ce que cette étude GEO change pour l’optimisation de votre stratégie de contenu

Première priorité : étendre le suivi au-delà des mots-clés primaires

Deuxième priorité : adapter le format éditorial à l’intention

Troisième priorité : utiliser le rafraîchissement de contenu comme levier de fan-out

Optimisation GEO : vers une nouvelle mesure de la visibilité

FAQ — Vos questions sur l’optimisation GEO et les citations ChatGPT

Qu’est-ce qu’une fan-out query dans le contexte de ChatGPT ?

Pourquoi une page bien classée sur Google peut-elle ne pas être citée par ChatGPT ?

Une marque avec une faible autorité de domaine peut-elle être citée par ChatGPT ?

Comment identifier les fan-out queries générées sur mes requêtes cibles ?

Le GEO remplace-t-il le SEO traditionnel ?

Quel type de contenu obtient les meilleurs taux de citation dans ChatGPT ?

Partager :

J’aime ça :

Laisser un commentaireAnnuler la réponse.

Articles similaires

E-Niort, référence client

Tendances e-commerce 2023 pour mieux vendre

Atteignez vos objectifs commerciaux grâce aux réseaux sociaux !

En savoir plus sur Influence Start