OpenAI工程师如何使用Codex

Codex用于加速各种工程任务，包括理解复杂的系统、重构大型代码库、交付新功能以及在紧急期限内解决事件。通过采访OpenAI工程师和分析内部使用数据，文档How OpenAI uses Codex汇编了展示Codex如何帮助团队提高速度、改善工作质量和管理复杂性的用例和最佳实践。

一、用例 (Use Cases)

Codex的使用涵盖了工程开发的七个关键领域：

1. 代码理解 (Code understanding)

◦ 帮助团队在入职、调试或调查事件时快速熟悉不熟悉的代码库部分。

◦ 常用于定位核心逻辑、描绘服务或模块间的关系，以及追踪数据流。

◦ 在事件响应期间，帮助工程师通过揭示组件间的交互或追踪故障状态的传播，快速进入新领域。

◦ 示例提示： “此存储库中身份验证逻辑在哪里实现？”；“总结请求如何从入口点流经此服务直至响应”。

2. 重构和迁移 (Refactoring and migrations)

◦ 常用于跨多个文件或包的更改，例如更新 API 或迁移新依赖项。

◦ 它使得跨数十个文件一致性地应用更改变得容易，尤其是在需要结构和依赖关系意识的情况下（这用简单的正则表达式难以捕获）。

◦ 用于代码清理，如拆分超大模块、用现代模式替换旧模式或准备代码以提高可测试性。

◦ 示例提示： “将此文件按关注点拆分为单独的模块，并为每个模块生成测试”。

3. 性能优化 (Performance optimization)

◦ 用于识别和解决性能瓶颈。

◦ 工程师提示Codex分析缓慢或内存密集型的代码路径（如低效循环、冗余操作、昂贵查询），并建议优化的替代方案。

◦ 有助于识别仍在使用的有风险或已弃用的模式，以减少长期技术债务并主动防止回归。

◦ 示例提示： “优化此循环以提高内存效率，并解释您的版本为何更快”；“建议一种更快的方式来批处理此函数中的 DB 查询”。

4. 提高测试覆盖率 (Improving test coverage)

◦ 帮助工程师更快地编写测试，尤其是在覆盖率薄弱或缺失的地方。

◦ 用于为新代码生成单元测试或集成测试，或在修复错误时建议覆盖边缘情况和可能失败路径的测试。

◦ 对识别边界条件（如空输入、最大长度或不寻常但有效的状态）特别有帮助。

◦ 示例提示： “为该函数编写单元测试，包括边缘情况和失败路径”。

5. 提高开发速度 (Increasing development velocity)

◦ 加速开发周期的开始和结束。

◦ 在启动新功能时，用于搭建样板代码（如生成文件夹、模块和 API 存根）。

◦ 在项目临近发布时，处理小型但必要的任务，如分类错误、填补最后的实现空白，以及生成部署脚本或配置。

◦ 可以将产品反馈或规范粘贴进去，生成一个粗略的草稿代码。

◦ 示例提示： “Scaffold a new API route for POST /events with basic validation and logging.”（为 POST /events 搭建一个新的 API 路由，包含基本验证和日志记录）。

6. 保持专注/心流状态 (Staying in flow)

◦ 帮助工程师在日程碎片化或经常中断时保持高效。

◦ 用于捕获未完成的工作、将笔记转化为工作原型，或分离探索性任务，以便后续回顾。这使得暂停和恢复工作变得更容易，而不会丢失上下文。

◦ 示例提示： “总结此文件，以便我明天可以接着上次停下的地方继续”。

7. 探索与构思 (Exploration and ideation)

◦ 适用于开放性工作，如寻找替代解决方案或验证设计决策。

◦ 可以提示要求解决问题的不同方法、探索不熟悉的模式或对假设进行压力测试。

◦ 有助于识别相关错误；给定已知问题，Codex可以在代码库其他地方识别相似的模式。

◦ 示例提示： “如果系统是事件驱动而不是请求/响应式的，它将如何工作？”。

二、最佳实践 (Best Practices)

OpenAI 团队总结了以下习惯，以便在日常工作中从 Codex 中持续获得价值：

• 从“询问模式”（Ask Mode）开始:

◦ 对于大型更改，首先提示 Codex 提供实施计划（使用 Ask Mode），然后将该计划作为后续“代码模式”（Code Mode）提示的输入。

◦ 这种两步流程有助于保持 Codex 的执行基础，并避免输出错误。

◦ Codex最适用于范围明确的任务，这些任务通常需要大约一小时完成，或实现几百行代码。

• 迭代改进 Codex 的开发环境:

◦ 设置启动脚本、环境变量和互联网访问可以显著降低 Codex 的错误率。

◦ 通过迭代调整环境配置来解决构建错误，长远来看可以获得显著的效率提升。

• 像编写 Github Issue 一样构建提示:

◦ 当提示内容模拟在 PR 或 Issue 中描述更改的方式时（包括文件路径、组件名称、差异和文档片段），Codex 的响应会更好。

◦ 使用诸如“以 [模块 X] 中的方式实现此功能”的模式可以改善结果。

• 将 Codex 任务队列用作轻量级待办事项（Backlog）:

◦ 发出任务以捕获切线想法、部分工作或附带的修复。

◦ Codex 可以作为暂存区，在重新集中注意力时可以返回处理。

• 使用 AGENTS.md 提供持久性上下文:

◦ 维护一个 AGENTS.md 文件，其中包含命名约定、业务逻辑、已知怪癖或 Codex 无法仅从代码推断出的依赖项。

• 利用 “Best of N” 改进输出:

◦ “Best of N”功能允许同时为单个任务生成多个响应，以便快速探索多种解决方案并选择最佳方案。

◦ 对于更复杂的任务，可以审查多个迭代，并组合不同响应的部分以获得更好的结果。

展望未来: Codex 仍处于研究预览阶段，但它已在构建软件的方式上产生了实际影响。随着模型的改进以及 Codex 更深度地集成到工作流中，OpenAI 期待解锁更多强大的软件开发方式。

一、用例 (Use Cases)

二、最佳实践 (Best Practices)

相关文章：

发表评论 取消回复

发表评论取消回复