Context Window

Résumer avec l'IA
Citer cette page

Qu'est-ce qu'une context window ?

Une context window est la quantité maximale de texte — mesurée en tokens — qu'un modèle de langage peut prendre en compte à un moment donné. Elle contient tout ce que le modèle « pense » à un tour donné : le prompt système, la conversation en cours, les fichiers ou résultats de recherche intégrés, les définitions d'outils et les sorties de commandes. Si l'entrée combinée dépasse la fenêtre, quelque chose doit être supprimé ou résumé. Les modèles de codage modernes ont de grandes fenêtres (souvent des centaines de milliers de tokens), ce qui peut inciter à les remplir. Mais la fenêtre est un budget, pas un objectif : tout ce qu'on y met est facturé, et refacturé à chaque tour où l'agent le relit.

Pourquoi la context window est importante en 2026

Elle est importante parce que remplir la fenêtre a un coût caché sur la qualité, en plus du prix évident. Les modèles portent moins d'attention aux informations enfouies au milieu d'un long contexte, donc une fenêtre bourrée de fichiers peu pertinents peut en réalité dégrader les réponses — le signal dont le modèle a besoin se perd dans le bruit. Gérer ce qui entre dans la fenêtre est la discipline du context engineering ; la garder petite est le moyen le plus rapide de réduire les coûts sans sacrifier la qualité.

Quand une context window plus grande n'aide pas

  • Quand le contenu supplémentaire est peu pertinent — ajouter des fichiers inutiles réduit la qualité des réponses et augmente le coût.
  • Quand la récupération ciblée suffit — récupérer les quelques fonctions pertinentes via semantic code search est bien plus efficace que de tout déverser dans une grande fenêtre.

À lire aussi