Glossaire du LLM Optimization · Vocabulaire de référence

A

Answer Engine Optimization

AEO Discipline

Optimisation pour les moteurs de réponse. Vise l'extraction d'un passage qui répond directement à une question (featured snippet Google, réponses des assistants vocaux). Plus ancien que le GEO, hérité des Position Zero.

Voir aussiGEO SEO Comparatif

Autorité thématique

Méthode

Capacité reconnue d'une marque à parler d'un champ. Pour un LLM, elle se construit par couverture par cluster, page pilier dédiée par concept clé et signaux d'autorité externes (mentions, citations, présence Wikipedia).

Voir aussiOntologie Entité

B

Bot IA

Technique

User-agent appartenant à un éditeur de modèle de langage. Récupère du contenu pour l'entraînement, l'indexation d'un moteur génératif ou la récupération à la volée pour répondre à un utilisateur. Voir GPTBot, ClaudeBot, PerplexityBot, Google-Extended.

Voir aussiOptimisation technique

C

Chunk

Technique

Unité de découpage d'un document, généralement un paragraphe ou un passage de quelques phrases. Les LLMs et les systèmes de retrieval opèrent sur des chunks, pas sur des pages entières. La qualité du chunking conditionne directement la qualité de citation.

Voir aussiPassage autoportant RAG

Citation IA

Mesure

Apparition d'une marque ou d'une URL dans la réponse d'un moteur génératif, soit en lien explicite, soit en mention textuelle. Métrique de référence du GEO, mesurée par requête, par moteur, dans le temps.

Voir aussiShare of voice IA

E

Entité

Ontologie

Concept, marque ou personne désignée de manière non équivoque dans le graphe d'un moteur. Une entité résolue est rattachée à des identifiants stables (Wikidata, Wikipedia) et porte des attributs vérifiables (type, propriétés, relations).

Voir aussiDésambiguïsation sameAs

Embedding

Technique

Représentation numérique d'un mot, d'un passage ou d'un document sous forme de vecteur. Les embeddings sont ce qui rend possible la recherche sémantique et le retrieval pertinent dans un système RAG.

Voir aussiRAG Chunk

G

Generative Engine Optimization

GEO Discipline

Optimisation pour les moteurs de recherche génératifs (ChatGPT Search, Google AI Overviews, Perplexity, Gemini, Claude). Vise la citation dans une réponse synthétisée à partir de plusieurs sources. Terme popularisé fin 2023 par un papier de recherche.

Voir aussiAEO SEO LLMO

GPTBot

Bot IA

User-agent du robot d'exploration d'OpenAI, utilisé pour collecter du contenu en vue de l'entraînement des modèles GPT. À distinguer de OAI-SearchBot (index ChatGPT Search) et ChatGPT-User (récupération à la volée).

Voir aussiBot IA

L

Large Language Model

LLM Modèle

Modèle de langage entraîné sur de très grands corpus textuels, capable de générer du texte en réponse à un prompt. Les LLMs grand public actuels incluent GPT-4 et 5 (OpenAI), Claude (Anthropic), Gemini (Google), Llama (Meta), Mistral (Mistral AI).

LLM Optimization

LLMO Discipline

Terme générique pour l'ensemble des pratiques visant à rendre un site web exploitable par un LLM. Couvre le GEO et l'AEO ; sur ce hub, employé comme terme de couverture par défaut.

Voir aussiPage pilier

llms.txt

Convention

Fichier Markdown placé à la racine d'un site, proposé en 2024 par Jeremy Howard (Answer.AI). Décrit la structure du site et expose ses ressources de référence sous forme directement exploitable par un LLM. Convention émergente, non encore standardisée.

Voir aussiNotre llms.txt

LOOP

Framework

Framework méthodologique de ce hub, en quatre dimensions : Lisibilité, Ontologie, Opérations, Performance. Conçu pour être rejoué en boucle, pas exécuté linéairement.

Voir aussiMéthodologie LOOP

P

Passage autoportant

Lisibilité

Passage de texte qui peut être cité hors contexte sans perdre son sens. Forme typique : phrase ou paragraphe avec sujet explicite, sans pronom anaphorique dépendant du contexte amont. Format préféré des LLMs pour la citation.

Voir aussiChunk

Prerendering

Technique

Génération de pages HTML statiques avant la requête du visiteur, par opposition au rendu côté client. Indispensable pour les bots IA qui n'exécutent pas, ou exécutent partiellement, JavaScript.

Voir aussiSSR SSG

R

Retrieval-Augmented Generation

RAG Architecture

Architecture dans laquelle un LLM consulte une base externe de documents au moment de la requête, pour ancrer sa réponse dans des sources actualisées plutôt que dans son entraînement seul. ChatGPT Search, Perplexity, Google AI Overviews fonctionnent sur ce principe.

Voir aussiEmbedding Chunk

S

sameAs

Schema.org

Propriété schema.org pointant vers une représentation alternative et faisant autorité de la même entité (typiquement Wikipedia, Wikidata, LinkedIn). Levier le plus simple pour désambiguïser une entité de marque.

Voir aussiDésambiguïsation

schema.org

Vocabulaire

Vocabulaire structuré standardisé permettant de baliser le sens des éléments d'une page (Organization, Article, FAQPage, Product) en JSON-LD ou microdata. Maintenu par un consortium incluant Google, Microsoft, Yahoo, Yandex.

Voir aussiSection technique

Search Engine Optimization

SEO Discipline

Optimisation pour le classement de pages dans les SERP des moteurs de recherche classiques (Google, Bing). Discipline historique, qui reste le socle technique sur lequel se construit le LLMO.

Voir aussiGEO AEO

SSR · Server-Side Rendering

Technique

Rendu d'une page côté serveur à la requête. Garantit que le contenu critique est présent dans la première réponse HTML, avant exécution JavaScript côté client.

Voir aussiPrerendering

SSG · Static Site Generation

Technique

Génération de toutes les pages d'un site en HTML statique au moment du build, servies ensuite sans calcul serveur. Astro, Hugo, Eleventy, Jekyll fonctionnent par défaut sur ce principe.

Answer Engine Optimization

Autorité thématique

Bot IA

Chunk

Citation IA

Entité

Embedding

Generative Engine Optimization

GPTBot

Large Language Model

LLM Optimization

llms.txt

LOOP

Passage autoportant

Prerendering

Retrieval-Augmented Generation

sameAs

schema.org

Search Engine Optimization

Share of Voice IA

SSR · Server-Side Rendering

SSG · Static Site Generation