Un token est l'unité de base du texte qu'un grand modèle de langage lit et génère — en général un court fragment comme un mot, une partie de mot ou un signe de ponctuation. Les modèles ne voient ni caractères ni phrases entières directement ; ils voient des séquences de tokens, et tout ce qu'ils font se mesure en tokens.Pour les agents de codage IA, les tokens sont l'unité de coût et de capacité. Chaque prompt envoyé et chaque réponse reçue est comptabilisé en tokens d'entrée et de sortie, et les fournisseurs facturent (et limitent le débit) sur ce nombre. En anglais, une règle approximative est qu'un token représente environ quatre caractères, soit ~750 mots pour ~1 000 tokens — mais le code se tokenise différemment, souvent en plus de tokens que la prose.
Pourquoi les tokens sont importants en 2026
Les tokens sont importants parce que les outils de codage agentiques relisent leur contexte de travail à chaque étape, si bien que les mêmes tokens sont payés encore et encore au fil d'une session. La partie coûteuse d'une session de codage n'est rarement la sortie du modèle — c'est l'entrée que l'agent continue d'ingérer : fichiers, sorties de commandes et conversation croissante. Maîtriser l'utilisation des tokens est donc le principal levier sur le coût et les limites de débit. Voir Comment réduire l'utilisation de tokens d'un agent de codage IA.
Quand le comptage de tokens est moins utile
Pour les prompts ponctuels et courts où le coût est négligeable — l'optimisation ne vaut pas l'effort.
Pour comparer des modèles différents sans précaution — le même texte donne un nombre de tokens différent selon les tokenizers, les comptages ne sont donc pas directement comparables d'un fournisseur à l'autre.