IA générative

Fenêtre de contexte : ce que « 128k tokens » change vraiment

Une grande fenêtre de contexte ouvre des usages — mais a ses pièges.

黒

kuro
kuro · rédaction en chef · 12 juin 2024

La fenêtre de contexte, c’est la mémoire de travail du modèle pour un appel : tout ce qu’il peut lire (votre prompt + l’historique + les documents) plus ce qu’il génère. 128k tokens, c’est l’équivalent de centaines de pages.

Concrètement, ça permet d’analyser un long cahier des charges, une base de code ou des transcriptions sans tout découper. Mais attention : plus le contexte est long, plus c’est lent et cher, et certains modèles « oublient » le milieu d’un très long texte.

Bonne pratique : ne remplissez pas la fenêtre par réflexe. Donnez le contexte pertinent, pas tout le contexte possible.