Fenêtre de contexte : ce que « 128k tokens » change vraiment
Une grande fenêtre de contexte ouvre des usages — mais a ses pièges.
La fenêtre de contexte, c’est la mémoire de travail du modèle pour un appel : tout ce qu’il peut lire (votre prompt + l’historique + les documents) plus ce qu’il génère. 128k tokens, c’est l’équivalent de centaines de pages.
Concrètement, ça permet d’analyser un long cahier des charges, une base de code ou des transcriptions sans tout découper. Mais attention : plus le contexte est long, plus c’est lent et cher, et certains modèles « oublient » le milieu d’un très long texte.
Bonne pratique : ne remplissez pas la fenêtre par réflexe. Donnez le contexte pertinent, pas tout le contexte possible.