Transverses · Vocabulaire de référence

Glossaire. Définitions stables.

Le vocabulaire francophone du LLM Optimization, défini en une à trois phrases. Datées, sourcées quand pertinent. Le glossaire évolue à la marge ; chaque modification est journalisée.

Termes · 20 définitions Catégories · 4 Mise à jour · 20 mai 2026
A

Answer Engine Optimization

AEO Discipline

Optimisation pour les moteurs de réponse. Vise l'extraction d'un passage qui répond directement à une question (featured snippet Google, réponses des assistants vocaux). Plus ancien que le GEO, hérité des Position Zero.

Autorité thématique

Méthode

Capacité reconnue d'une marque à parler d'un champ. Pour un LLM, elle se construit par couverture par cluster, page pilier dédiée par concept clé et signaux d'autorité externes (mentions, citations, présence Wikipedia).

B

Bot IA

Technique

User-agent appartenant à un éditeur de modèle de langage. Récupère du contenu pour l'entraînement, l'indexation d'un moteur génératif ou la récupération à la volée pour répondre à un utilisateur. Voir GPTBot, ClaudeBot, PerplexityBot, Google-Extended.

C

Chunk

Technique

Unité de découpage d'un document, généralement un paragraphe ou un passage de quelques phrases. Les LLMs et les systèmes de retrieval opèrent sur des chunks, pas sur des pages entières. La qualité du chunking conditionne directement la qualité de citation.

Citation IA

Mesure

Apparition d'une marque ou d'une URL dans la réponse d'un moteur génératif, soit en lien explicite, soit en mention textuelle. Métrique de référence du GEO, mesurée par requête, par moteur, dans le temps.

E

Entité

Ontologie

Concept, marque ou personne désignée de manière non équivoque dans le graphe d'un moteur. Une entité résolue est rattachée à des identifiants stables (Wikidata, Wikipedia) et porte des attributs vérifiables (type, propriétés, relations).

Embedding

Technique

Représentation numérique d'un mot, d'un passage ou d'un document sous forme de vecteur. Les embeddings sont ce qui rend possible la recherche sémantique et le retrieval pertinent dans un système RAG.

Voir aussiRAGChunk
G

Generative Engine Optimization

GEO Discipline

Optimisation pour les moteurs de recherche génératifs (ChatGPT Search, Google AI Overviews, Perplexity, Gemini, Claude). Vise la citation dans une réponse synthétisée à partir de plusieurs sources. Terme popularisé fin 2023 par un papier de recherche.

Voir aussiAEOSEOLLMO

GPTBot

Bot IA

User-agent du robot d'exploration d'OpenAI, utilisé pour collecter du contenu en vue de l'entraînement des modèles GPT. À distinguer de OAI-SearchBot (index ChatGPT Search) et ChatGPT-User (récupération à la volée).

Voir aussiBot IA
L

Large Language Model

LLM Modèle

Modèle de langage entraîné sur de très grands corpus textuels, capable de générer du texte en réponse à un prompt. Les LLMs grand public actuels incluent GPT-4 et 5 (OpenAI), Claude (Anthropic), Gemini (Google), Llama (Meta), Mistral (Mistral AI).

LLM Optimization

LLMO Discipline

Terme générique pour l'ensemble des pratiques visant à rendre un site web exploitable par un LLM. Couvre le GEO et l'AEO ; sur ce hub, employé comme terme de couverture par défaut.

Voir aussiPage pilier

llms.txt

Convention

Fichier Markdown placé à la racine d'un site, proposé en 2024 par Jeremy Howard (Answer.AI). Décrit la structure du site et expose ses ressources de référence sous forme directement exploitable par un LLM. Convention émergente, non encore standardisée.

Voir aussiNotre llms.txt

LOOP

Framework

Framework méthodologique de ce hub, en quatre dimensions : Lisibilité, Ontologie, Opérations, Performance. Conçu pour être rejoué en boucle, pas exécuté linéairement.

P

Passage autoportant

Lisibilité

Passage de texte qui peut être cité hors contexte sans perdre son sens. Forme typique : phrase ou paragraphe avec sujet explicite, sans pronom anaphorique dépendant du contexte amont. Format préféré des LLMs pour la citation.

Voir aussiChunk

Prerendering

Technique

Génération de pages HTML statiques avant la requête du visiteur, par opposition au rendu côté client. Indispensable pour les bots IA qui n'exécutent pas, ou exécutent partiellement, JavaScript.

Voir aussiSSRSSG
R

Retrieval-Augmented Generation

RAG Architecture

Architecture dans laquelle un LLM consulte une base externe de documents au moment de la requête, pour ancrer sa réponse dans des sources actualisées plutôt que dans son entraînement seul. ChatGPT Search, Perplexity, Google AI Overviews fonctionnent sur ce principe.

Voir aussiEmbeddingChunk
S

sameAs

Schema.org

Propriété schema.org pointant vers une représentation alternative et faisant autorité de la même entité (typiquement Wikipedia, Wikidata, LinkedIn). Levier le plus simple pour désambiguïser une entité de marque.

schema.org

Vocabulaire

Vocabulaire structuré standardisé permettant de baliser le sens des éléments d'une page (Organization, Article, FAQPage, Product) en JSON-LD ou microdata. Maintenu par un consortium incluant Google, Microsoft, Yahoo, Yandex.

Search Engine Optimization

SEO Discipline

Optimisation pour le classement de pages dans les SERP des moteurs de recherche classiques (Google, Bing). Discipline historique, qui reste le socle technique sur lequel se construit le LLMO.

Voir aussiGEOAEO

Share of Voice IA

Mesure

Part de la marque dans le total des citations sur une liste de requêtes, par moteur, sur une période. Métrique de pilotage du GEO, à comparer dans le temps et face à des concurrents nommés.

SSR · Server-Side Rendering

Technique

Rendu d'une page côté serveur à la requête. Garantit que le contenu critique est présent dans la première réponse HTML, avant exécution JavaScript côté client.

Voir aussiPrerendering

SSG · Static Site Generation

Technique

Génération de toutes les pages d'un site en HTML statique au moment du build, servies ensuite sans calcul serveur. Astro, Hugo, Eleventy, Jekyll fonctionnent par défaut sur ce principe.