关于OpenAI Codex的工作模式、Token配置速率、所集成模型

有三种模式：

Chat
纯聊天模式。只进行对话与建议，不主动在你的工作区做任何操作（不改文件、不跑命令、不装依赖）。适合问原理、查错思路、让它给示例代码，但真正的改动由你亲自粘贴/执行。
Agent
代理模式（受限权限）。在得到你的逐步确认后，代理可以帮你执行具体动作：创建/修改文件、运行命令、安装依赖、调用少量扩展能力等，但通常会每一步弹出确认或在“计划—执行”里让你点“Approve/Run”。适合让它半自动修复问题、搭脚手架、跑单测，同时保持安全可控。
Agent (full access)
代理模式（完全访问）。给予代理更高权限，很多操作会自动执行或只需一次性授权：批量修改代码、在终端里连跑多条命令、读写更多工作区文件、可能还会访问本机/网络资源等。适合“让我全盘搞定”的场景（搭建工程、迁移框架、系统化重构），但风险更高：要信任它的计划，并及时查看变更（如 Git diff、终端输出）。

下图是 Codex（VS Code 扩展里的 AI 助手）显示的速率限制 / 配额面板，表示你在不同时间窗口内可用的用量额度。

5h：滚动的 5 小时窗口。
图里“10% · 8:59 PM”表示：过去/当前这 5 小时窗口你已用掉 10% 的额度，窗口将在 8:59 PM 重新滚动（重置）。剩余 90% 可用；若到 100%，这段时间内的新请求会被限流/拒绝，直到窗口滚动。
Weekly：按周的窗口。
“13% · Nov 1”表示本周已使用 13%，到 Nov 1（本周重置时间）刷新。若本项达到 100%，即使 5h 还有余量，仍会被限流，需等到周窗口重置。

一般包括你在 IDE 助手里发起的请求（聊天、让 Agent 执行动作、运行计划/命令、读取与修改文件等）及其消耗的上下文/生成内容（可理解为一定的“用量点数/令牌”）。UI 用百分比做了总体抽象。

当前，Codex所集成的模型分成两大类：gpt-5-codex（面向编码/IDE 代理）和gpt-5（通用对话/生成）。每类都有不同“强度”（minimal / low / medium / high），强度越高，一般上下文读写更积极、推理更深、质量更好，但更慢、更费配额。

gpt-5-codex (low / medium / high)
专为 VS Code 的 Codex 代理调优：更擅长读仓库、规划修改、批量重构、运行命令等“动手”任务。
- low：快、省额度；适合小修小补、单文件修改。
- medium：质量/速度折中；适合日常修复、加测试、少量重构。
- high：最强规划与跨文件变更能力，但“Consumes rate limits quickly”；适合大型重构、脚手架搭建、复杂迁移。
gpt-5 (minimal / low / medium / high)
通用对话/代码讲解/方案讨论；不强调主动操作工作区。
- minimal/low：响应快、便宜；适合问原理、要片段代码、改提示词。
- medium：更稳更准；适合设计评审、方案权衡、长答案。
- high：最高质量长推理；适合难题分析、长文档生成，但更耗配额。

小贴士：强度越高越“费”你的 5h / Weekly 配额；做重活再开 high，平时用 low/medium 更划算。