Le semantic code search est une façon de trouver du code par sens plutôt que par correspondance de texte exacte. Au lieu de faire un grep sur une chaîne littérale, il encode la requête et le code en vecteurs (embeddings) et retourne les fragments dont le sens est le plus proche — ainsi une recherche comme « où valide-t-on le token de connexion » peut faire remonter la bonne fonction même si ces mots exacts n'y apparaissent pas.Les bonnes implémentations sont orientées code : elles classent la définition d'un symbole avant ses nombreuses utilisations, et préfèrent les sources aux tests, pour que l'agent voie la source de vérité en premier.
Pourquoi le semantic code search est important en 2026
Il est important parce que la récupération ciblée est le plus grand levier sur les tokens pour les agents de codage. Sans lui, un agent s'oriente en lisant des fichiers entiers ou en déversant des répertoires dans sa context window — coûteux, et refacturé à chaque tour. Avec lui, l'agent extrait les trois fragments pertinents au lieu des trente fichiers environnants. C'est pourquoi le semantic search est une pierre angulaire du context engineering et de la réduction de l'utilisation des tokens.
Quand le semantic search n'est pas idéal
Pour les recherches de symboles exacts — quand on connaît le nom précis de la fonction, une recherche directe par symbole ou mot-clé peut être plus rapide et moins coûteuse.
Pour les petites bases de code — si l'ensemble du projet est petit, le surcoût de récupération ne vaut peut-être pas la peine.