模型上下文窗口与预算

设计时间：2026-05-18 状态：已实现（已迁移自 design/）

1. 问题

改动前 ContextBudget 以全局固定值工作：

这会导致两个问题：

本地审计的 Codex 比较检出中，相关默认值为：

上下文预算从"全局 provider 初始化值"改为"每轮按实际选中模型解析"：

ModelCapabilities 增加模型窗口元数据：
- context_window
- max_context_window
- effective_context_window_percent
- auto_compact_token_limit
ContextConfig / ContextBudget 默认值提升到现代 fallback：
- max_tokens = 272000
- reserved_tokens = 10000
build_context_budget() 支持传入 ModelCapabilities：
- 有模型窗口时使用模型窗口作为硬上限。
- 默认按 effective_context_window_percent 派生响应/系统余量。
- 默认按 90% context window 派生软压缩阈值。
SessionRunner 在每轮 resolve provider/model 之后创建本轮 ContextBuilder，并传给 AgentLoop。
文档和测试同步更新，明确模型上下文在哪里声明与生效。