ChatGPT Search : de quoi parle-t-on exactement ?
ChatGPT Search est la fonctionnalité de recherche web intégrée dans ChatGPT, déployée progressivement depuis novembre 2024. C'est l'une des surfaces centrales de la Generative Engine Optimization. Quand un utilisateur pose une question nécessitant des informations récentes, ChatGPT peut déclencher un retrieval web via le robot OAI-SearchBot, puis synthétiser les résultats en citant ses sources avec des numéros de référence cliquables.
Il faut bien distinguer les trois bots OpenAI :
- GPTBot : crawl pour l'entraînement des modèles. Bloquer ne protège pas de ChatGPT Search.
- OAI-SearchBot : crawl pour ChatGPT Search, le bot à autoriser si vous voulez être cité.
- ChatGPT-User : exécute des requêtes à la demande d'utilisateurs via navigation ChatGPT. Utile à autoriser en complément.
Vérifiez votre robots.txt : si vous avez un Disallow: / sur GPTBot, il ne s'applique
pas à OAI-SearchBot. Chaque bot doit être géré séparément.
Architecture de ChatGPT Search : retrieval + mémoire modèle
La principale différence avec Perplexity est d'ordre architectural. Perplexity est quasi-exclusivement RAG-based : sa réponse est construite à partir du retrieval temps réel. ChatGPT Search fonctionne différemment : GPT-4o dispose d'une base de connaissance dense (entraînement jusqu'à mi-2024) et décide, en cours de génération, si un retrieval supplémentaire est nécessaire.
Cette architecture hybride a des conséquences pratiques importantes :
- Les sources citées sont moins nombreuses que dans Perplexity (souvent 2 à 4 contre 6 à 10) parce que le modèle complète la réponse avec sa propre mémoire.
- Le retrieval est déclenché sélectivement, principalement pour les données récentes, les prix, les événements en cours, les statistiques fragilisables.
- La concurrence pour la citation est plus intense : moins de slots disponibles dans la réponse signifie une sélection plus sévère.
Critères de sélection des sources par ChatGPT Search
1. Accessibilité à OAI-SearchBot
Condition nécessaire mais non suffisante. Votre page doit être crawlable par OAI-SearchBot, rendue côté serveur (SSR/SSG, pas de SPA JavaScript sans rendu serveur), et retourner un 200 stable. Un contenu derrière login, paywall ou JavaScript lourd ne sera pas indexé.
2. Autorité du domaine dans le secteur
ChatGPT Search évalue l'autorité thématique du domaine. Les signaux observés : Domain Rating (Ahrefs) ou Domain Authority (Moz) élevé, trafic organique significatif, présence dans des domaines voisins de référence. Un site avec une topical authority étroite mais profonde (expert sur un domaine spécifique) surperforme les généralistes à DR identique.
3. Fraîcheur du contenu
ChatGPT Search privilégie les pages récemment mises à jour pour les requêtes où la fraîcheur est critique.
Les signaux : dateModified dans le schema Article, balise <meta name="last-modified">,
en-tête HTTP Last-Modified, et la date visible dans le contenu. Les trois doivent être cohérents.
4. Autoportance des sections
Comme tout système RAG, ChatGPT Search chunke le contenu et sélectionne les passages les plus pertinents. Une page dont chaque section peut se comprendre hors contexte (autoportance) augmente la probabilité qu'un chunk soit sélectionné et cité. Une section qui commence par « Comme mentionné ci-dessus… » est un chunk inutilisable.
5. Signal d'E-E-A-T et données structurées
Schema Article avec author, datePublished et dateModified.
Schema Organization avec sameAs. Ces signaux structurés sont les proxy-signaux E-E-A-T
les plus directement lisibles par un système de retrieval.
6. Densité factuelle
ChatGPT Search est plus sélectif que Perplexity sur la densité factuelle : il préfère les sources qui apportent des chiffres, des dates, des noms, des définitions précises. Un contenu générique (« il est important de noter que… », « plusieurs facteurs entrent en jeu… ») a peu de chances d'être sélectionné quand une source plus factuelle est disponible.
ChatGPT Search vs Perplexity : tableau comparatif
| Dimension | ChatGPT Search | Perplexity |
|---|---|---|
| Architecture | Modèle + RAG sélectif | RAG-first, quasi-exclusif |
| Sources citées / réponse | 2 à 4 en moyenne | 6 à 10 en moyenne |
| Bot de retrieval | OAI-SearchBot | PerplexityBot |
| Déclenchement retrieval | Sélectif (fraicheur, faits récents) | Systématique |
| Biais de sources | Vers domaines connus, autorité élevée | Plus ouvert aux sources spécialisées |
| Sensibilité à la fraicheur | Très élevée pour les faits récents | Élevée (défaut temps réel) |
| Mesure de visibilité | Trafic chatgpt.com + monitoring tiers | Trafic perplexity.ai + monitoring tiers |
6 leviers d'optimisation pour ChatGPT Search
Levier 1, Autoriser OAI-SearchBot et ChatGPT-User
Vérifiez votre robots.txt. Les lignes à ajouter si absentes :
User-agent: OAI-SearchBot
Disallow:
User-agent: ChatGPT-User
Disallow:
Un Disallow: vide signifie « tout est autorisé ». Vérifiez aussi que ces bots ne sont pas
bloqués par un WAF ou Cloudflare en mode bot-fight.
Levier 2, Rendu serveur strict
ChatGPT Search n'exécute pas de JavaScript pour le rendu de contenu principal. Vos pages doivent
retourner le contenu texte dans le HTML initial (SSR ou SSG). Testez avec curl -A "OAI-SearchBot"
sur une URL : si le HTML de réponse contient votre contenu, vous êtes correctement servis.
Levier 3, Fraicheur visible et cohérente
Mettez à jour dateModified dans votre schema Article à chaque revision significative.
Affichez la date de dernière mise à jour de façon visible dans l'article. Assurez-vous que
l'en-tête HTTP Last-Modified est cohérent avec la date schema.
Levier 4, Sections autoportantes avec titres factuels
Chaque section H2/H3 doit fonctionner comme une réponse autonome. Le titre de section doit inclure le concept clé (« OAI-SearchBot », « retrieval ChatGPT Search ») pour que le chunk sélectionné soit directement utilisé. Terminez chaque section par une conclusion actionnable ou un chiffre clé.
Levier 5, Densité factuelle ciblée
Incluez dans chaque page au moins 3 à 5 affirmations factuelles avec des chiffres précis, dates ou exemples concrets. Ce ne doit pas être du remplissage, chaque fait doit être sourceable. Les contenus « à haute densité factuelle » sont ce que ChatGPT Search cherche à citer pour crédibiliser ses réponses.
Levier 6, Construire l'autorité thématique du domaine
ChatGPT Search favorise les domaines reconnus dans leur secteur. Deux actions prioritaires : publier régulièrement du contenu de référence sur votre spécialité (topical authority en profondeur), et obtenir des mentions et backlinks de sources thématiques reconnues qui apparaissent dans les corpus d'entraînement OpenAI.
Mesurer sa visibilité dans ChatGPT Search
En l'absence de console officielle ChatGPT Search, les proxys disponibles en 2026 :
- Trafic référent chatgpt.com : dans Google Analytics 4 ou Plausible, segment
source = chatgpt.com. Ce trafic est sous-estimé (beaucoup d'utilisateurs copient-collent sans cliquer) mais donne un plancher mesurable. - Logs OAI-SearchBot en GSC : Google Search Console ne montre pas les bots tiers, mais les logs serveur (Nginx/Apache/Cloudflare) montrent les requêtes OAI-SearchBot avec les URLs crawlées.
- Monitoring LLM actif : des outils comme Profound, AthenaHQ, Peec et Otterly interrogent régulièrement ChatGPT sur des requêtes cibles et détectent quand votre site est cité. C'est la méthode la plus directe même si elle reste coûteuse en tokens.
- Test manuel régulier : posez chaque semaine dans ChatGPT 5 à 10 requêtes de votre secteur avec la fonctionnalité de recherche activée (le globe → icone web). Notez si votre domaine apparaît dans les sources citées.
FAQ, ChatGPT Search et optimisation
- Quelle est la différence entre GPTBot et OAI-SearchBot ?
- GPTBot crawle pour alimenter l'entraînement des modèles OpenAI. OAI-SearchBot crawle pour ChatGPT Search, la fonctionnalité de recherche temps réel. Ce sont deux robots distincts. Bloquer GPTBot n'empêche pas ChatGPT Search de vous citer.
- ChatGPT Search cite-t-il des sources comme Perplexity ?
- Oui, mais moins systématiquement. Perplexity est quasi-exclusivement RAG-based. ChatGPT Search combine la mémoire du modèle avec un retrieval sélectif : les sources citées sont moins nombreuses (2 à 4 vs 6 à 10) mais sélectionnées avec plus d'arbitrage.
- Faut-il autoriser OAI-SearchBot dans robots.txt ?
- Si vous souhaitez être cité dans ChatGPT Search, oui. OAI-SearchBot est le bot de retrieval de ChatGPT Search. Le bloquer signifie ne pas être candidat à la citation.
- ChatGPT Search privilégie-t-il certains types de sites ?
- D'après les observations disponibles en 2026, ChatGPT Search cite plus fréquemment les sites à fort trafic organique, les sources autoritaires dans leur secteur, et les pages avec des données structurées propres. Les spécialistes étroits performent mieux que les généralistes.
- Peut-on mesurer sa visibilité dans ChatGPT Search ?
- Pas directement. Proxys disponibles : trafic référent chatgpt.com, logs OAI-SearchBot, monitoring LLM actif (Profound, AthenaHQ, Peec), et test manuel régulier avec la fonctionnalité de recherche ChatGPT activée.
Checklist ChatGPT Search (8 points)
- OAI-SearchBot et ChatGPT-User sont autorisés dans robots.txt et ne sont pas bloqués par WAF.
- Les pages clés sont rendues SSR ou SSG, le contenu est dans le HTML initial.
- dateModified dans schema Article est à jour et cohérent avec la date visible et l'en-tête HTTP Last-Modified.
- Chaque section H2/H3 est autoportante et commence par le concept clé (pas de « comme dit plus haut »).
- Chaque page contient au moins 3 affirmations factuelles avec chiffres, dates ou exemples concrets.
- Schema Article est implémenté avec author, datePublished et dateModified.
- Le monitoring de visibilité ChatGPT Search est en place (trafic référent + monitoring LLM).
- La topical authority du domaine est construite via un cluster de contenus de référence sur le sujet principal.