一、工作模式
有三种模式:
- Chat
纯聊天模式。只进行对话与建议,不主动在你的工作区做任何操作(不改文件、不跑命令、不装依赖)。适合问原理、查错思路、让它给示例代码,但真正的改动由你亲自粘贴/执行。 - Agent
代理模式(受限权限)。在得到你的逐步确认后,代理可以帮你执行具体动作:创建/修改文件、运行命令、安装依赖、调用少量扩展能力等,但通常会每一步弹出确认或在“计划—执行”里让你点“Approve/Run”。适合让它半自动修复问题、搭脚手架、跑单测,同时保持安全可控。 - Agent (full access)
代理模式(完全访问)。给予代理更高权限,很多操作会自动执行或只需一次性授权:批量修改代码、在终端里连跑多条命令、读写更多工作区文件、可能还会访问本机/网络资源等。适合“让我全盘搞定”的场景(搭建工程、迁移框架、系统化重构),但风险更高:要信任它的计划,并及时查看变更(如 Git diff、终端输出)。
何时用哪种?

- 只聊思路/要片段代码 → 选 Chat
- 想让 AI 动手但你要把关每一步 → 选 Agent
- 赶工或重活儿交给它全套执行、你事后审查 → 选 Agent (full access)
小提示
- 在 Agent 和 Full access 下,养成随时看 计划(Plan)、变更(diff)、终端输出 的习惯。
- 用 Git 管理项目,先建分支再授权执行,方便回滚。
- 涉及秘密凭证、生产环境命令时,优先用 Agent(受限)或回到 Chat 手动执行。
二、Token配额速率
下图是 Codex(VS Code 扩展里的 AI 助手)显示的速率限制 / 配额面板,表示你在不同时间窗口内可用的用量额度。

- 5h:滚动的 5 小时窗口。
图里“10% · 8:59 PM”表示:过去/当前这 5 小时窗口你已用掉 10% 的额度,窗口将在 8:59 PM 重新滚动(重置)。剩余 90% 可用;若到 100%,这段时间内的新请求会被限流/拒绝,直到窗口滚动。 - Weekly:按周的窗口。
“13% · Nov 1”表示本周已使用 13%,到 Nov 1(本周重置时间)刷新。若本项达到 100%,即使 5h 还有余量,仍会被限流,需等到周窗口重置。
都在计什么?
一般包括你在 IDE 助手里发起的请求(聊天、让 Agent 执行动作、运行计划/命令、读取与修改文件等)及其消耗的上下文/生成内容(可理解为一定的“用量点数/令牌”)。UI 用百分比做了总体抽象。
用量满了会怎样?
- 达到某窗口的 100% 时,对应窗口内的新请求会暂时被阻止或排队,直到该窗口重置/滚动。
- 两个窗口都需要“有余量”才能顺利请求;周配额通常是更“硬”的上限。
节省/避限小技巧
- 复杂长对话前先精炼上下文;减少无关文件的自动读取。
- 批量操作让 Agent 一次完成,避免零碎多次执行。
- 只需思路时用 Chat 模式;需要它动手再切 Agent/Agent (full access)。
- 大型生成或长日志可分段进行,或等窗口重置后再跑。
三、所集成模型
当前,Codex所集成的模型分成两大类:gpt-5-codex(面向编码/IDE 代理)和gpt-5(通用对话/生成)。每类都有不同“强度”(minimal / low / medium / high),强度越高,一般上下文读写更积极、推理更深、质量更好,但更慢、更费配额。

两类模型怎么理解
- gpt-5-codex (low / medium / high)
专为 VS Code 的 Codex 代理调优:更擅长读仓库、规划修改、批量重构、运行命令等“动手”任务。- low:快、省额度;适合小修小补、单文件修改。
- medium:质量/速度折中;适合日常修复、加测试、少量重构。
- high:最强规划与跨文件变更能力,但“Consumes rate limits quickly”;适合大型重构、脚手架搭建、复杂迁移。
- gpt-5 (minimal / low / medium / high)
通用对话/代码讲解/方案讨论;不强调主动操作工作区。- minimal/low:响应快、便宜;适合问原理、要片段代码、改提示词。
- medium:更稳更准;适合设计评审、方案权衡、长答案。
- high:最高质量长推理;适合难题分析、长文档生成,但更耗配额。
选用建议
- 只聊思路/要示例 → gpt-5 low/medium
- 代理动手改代码(可控用量) → gpt-5-codex medium
- 大型重构/自动化搭建 → gpt-5-codex high
- 产出长文档/深入分析 → gpt-5 high
- 配额吃紧/追求速度 → minimal/low
小贴士:强度越高越“费”你的 5h / Weekly 配额;做重活再开 high,平时用 low/medium 更划算。