开发任务被拆分后,新增某个功能、修复某个BUG仅需改动少量文件,64K上下文足以覆盖绝大多数开发场景,没必要使用1M超大上下文;该配置本地模型、在线API模型全部通用:本地部署优化Token输出速率,在线调用减少计费Token损耗,使用者也可按需根据单个任务自行上调至128K或256K。
1. .codex/config.toml
model = "gpt5.5” #"qwen3.6-35b-a3b"
model_context_window = 64000
model_auto_compact_token_limit = 56000
compact_min_interval_ms = 90000
compact_recent_turns_keep = 5
max_tool_output_tokens = 1024
如需更大窗口,自行修改 model_context_window = 128000,同步把压缩阈值改为 model_auto_compact_token_limit = 112000
2. .codex/AGENTS.md
# 全局开发约束规则
1. 常规开发新增功能、BUG调试仅修改少量文件,64K上下文可覆盖全部需求,拒绝盲目使用1M冗余上下文,个人可按需调整为128K。
2. 代码变更仅输出Diff差异片段,严禁返回完整源码文件,避免大量Token浪费。
3. 持续增量维护项目状态清单,仅追加新增改动内容,已记录信息不再重复复述、改写。
4. 状态记录维度:当前任务、已完成事项、待办列表、文件变更、问题修复、目录调整、关键架构决策。
5. 执行内置 /compact 压缩时:同步更新项目状态,剔除重复代码、冗余终端日志,严格保留最近5轮原始对话。
6. 全程遵循极简输出原则,已有上下文内的信息不再额外赘述,持续降低Token消耗。
使用说明
1. 将配置文件放入对应目录后重启Codex
2. Token用量达到阈值时自动触发内置压缩
3. 需要手动精简上下文,直接输入指令:/compact
夜雨聆风