LLMが一度に処理できるトークン数の上限。GPT-4の8kからGemini 2.0の2Mまで急拡大中。広いほど長い文書や会話を扱えるが、コスト・遅延が増す。
「コンテキストウィンドウ200kあるから、本一冊まるごと貼れる。」