笔记 | 【AI智能体】Codex AI 辅助编程高级技能实战操作详解

Codex 被誉为2026年最值得上手的 AI 工具，它不仅是一个编程 Agent，更是一个几乎可以替换掉任何对话工具的全能 AI。配合高性价比的定价机制和充足的 Token 额度，只要你能想到的场景，它都能帮你自动化搞定。可以说，Codex 完美复刻了ChatGPT的模板，让普通的用户也能方便使用一款专属定制、性能强大的桌面版AI助手。同时，在AI编程领域，Codex 也展现出了极高的水准，背后关联的ChatGPT5.5 最新的大模型在编程能力也是独树一帜，本篇将详细介绍如何在日常项目开发中借助Codex 进行AI辅助编程。

二、Codex 介绍

Codex 是 OpenAI 推出的一款AI 编程智能体。与简单的聊天机器人或代码补全工具不同，Codex 能够像一个真实的开发人员一样，独立理解复杂任务、操作你的电脑、编写并修改代码、运行终端命令，甚至自动修复bug。访问入口：https://openai.com/zh-Hans-CN/codex/?utm_source=Ai138.com

2.1 Codex 是什么

简单来说，可以把 Codex 看作一个“能帮你干活的AI工程师”。

它是“目标驱动”而非“指令驱动”：你只需告诉它最终的目标（例如：“帮我搭建一个带用户登录功能的网站”），它会自动拆解任务，规划步骤并执行，而不需要你一步步告诉它该怎么做。
它不只是一个聊天框：虽然你可以在ChatGPT网页版找到它，但它真正的威力在于桌面应用和命令行工具（CLI）。在这些地方，它可以直接访问你的文件系统、运行终端命令，甚至操作其他软件。
它的用户远超程序员：官方数据显示，Codex每周有超过300万用户，其中近一半（50%）的使用场景并非编码。从写周报、整理文档到数据分析，它都足以胜任。

2.2 Codex能做什么？

近期的重大更新让Codex的能力大幅跃升，使其不再局限于编程领域：

动打开软件、运行模拟器、发现问题、修改代码，并再次测试验证，搞定一整套开发闭环。
所见即所得的开发（内置浏览器）：Codex内置了一个浏览器。当你开发网页时，它可以直接在浏览器中展示效果。你可以直接在渲染出的网页上圈出问题，比如圈出一个标题并写上评论“字体太大，颜色改成蓝色”，Codex就能理解视觉和空间上下文，并精准地修改对应的代码。
“心跳”机制与长期记忆：

自动排班：你可以交付给它一个需要数小时甚至数周的长线任务。即使你关掉电脑，它也会在约定的时间点“自动醒来”，在后台继续工作。

记忆功能：它会记住你的编码偏好和纠正过的错误，下次再合作时，就不需要从头开始解释了。

强大的工具生态：Codex已经接入了超过90个插件，可以无缝连接JIRA、GitLab、Microsoft Suite、Slack、Gmail等常用工具。你可以让它去Notion里读文档、去邮箱里看邮件、去项目管理工具里筛选Bug，再把所有信息汇总成一份报告给你。

2.3 Codex的不同使用模式

Codex提供了多种使用方法，用户可以根据自己的需求选择不同的入口：

使用方法

适合人群

核心优势

桌面应用

追求最佳体验的用户

具备最完整的功能，如可视化代码审查、并行任务管理、“操作电脑”功能等

命令行 (CLI)

习惯终端操作的程序员

路径最短，与代码仓库、编辑器和命令行工作流结合最紧密

IDE 插件

不想改变现有开发环境的程序员

在你熟悉的VS Code或Cursor等编辑器中直接调用Codex的能力，接入成本最低

网页版 (ChatGPT)

普通用户或轻度使用者

无需安装，登录 chatgpt.com 即可在左侧边栏找到它，适合处理简单的一次性任务

2.4 Codex 在AI编程中的应用场景介绍

根据截至2026年6月的信息，Codex已从一个AI编程助手，演进为一个能独立搞定复杂开发任务的自主智能体（Agent）。它的应用场景也早已超越了单纯的代码补全，深度覆盖了软件开发的整个生命周期，下面对Codex的AI编程使用场景做详细的介绍。

2.4.1 智能体驱动开发：从"助手"到"执行者"

这是Codex最具革命性的应用。它不再被动等待指令，而是能独立设定目标、规划并执行任务。

7x24小时无人值守工作：Codex可以被委派一个长期目标（如"全面重构登录模块"），它会自动分解任务、编写代码、运行测试，即使在你休息时也能持续工作。有团队用它从零开发了一款约100万行代码的产品，且全部由Codex编写完成。
自主闭环调试：Codex可以自己打开Xcode或Android Studio等IDE，运行应用、测试功能、发现Bug，然后直接定位并修复代码，最后重新编译验证。一个完整的Debug流程通常不到一分钟就能完成。
自我进化与"蒸馏"：Codex能回顾过去的工作记录（最长可设置30天），自动识别出你反复执行的、可标准化的工作流程，并将其打包成"技能包"或"子智能体"，把重复劳动变成一键自动化。

2.4.2 所见即所得的前端开发

传统的前端开发需要在代码和浏览器间频繁切换，而Codex通过内置浏览器和"独立鼠标"能力，彻底改变了这一模式。

点哪改哪：你可以直接在渲染好的网页上点击任意元素（比如一个按钮或标题），并在旁边输入修改意见（如"把字体调大，颜色改成蓝色"）。Codex能理解这些针对具体UI元素的指令，并自动在后台找到并修改相应的CSS或HTML代码，网页会实时刷新效果。
图像生成前端代码：Codex已内置图像生成能力。你可以上传一张手绘的UI草图或产品概念图，它能分析图像内容，直接为你生成对应的前端代码（如React或Vue组件）。

2.4.3 贯穿全开发流程的"工具链大脑"

Codex已深度集成到整个开发生态中，像一个工程师的大脑，协调各种专业工具。

丰富的插件生态：通过 @ 符号，你可以让Codex直接与JIRA（项目管理）、CircleCI（持续集成）、GitLab Issues（问题追踪）、SharePoint（文档管理）等90多款开发工具交互。例如，可以输入" @JIRA 为本次迭代创建一个任务，并 @CircleCI 检查上一次构建失败的原因"。
深度上下文理解：它不仅仅是写代码，还能读取你的需求文档、产品说明书，理解整个项目的架构。配合其强大的记忆功能，它能记住你上周的编码规范和偏好，并在本次会话中自动应用，无需重复说明

2.4.4 企业级与专业化场景

在大型项目和严肃的商业环境中，Codex也展现出强大的价值。

遗留系统改造：面对老旧代码（如古老的FORTRAN语言），你可以通过注释描述目标，让Codex将其重构为现代语言（如Python的NumPy库），大大降低了系统维护和迁移的难度和风险。
自动化测试与质量保障：Codex在生成业务代码的同时，也能自动为其生成详尽的单元测试用例，包括边界值、异常情况等。有实践表明，这能将测试覆盖率从68% 提升至92%。
技术债务清理：它可以快速分析整个代码库，识别出重复代码、架构不合理等"技术债务"区域，并自动发起修复申请，帮助团队持续保持代码健康。

2.5 Codex 与其他AI编程产品的对比

提到AI编程，很难不与其他AI编程产品进行一个对比，把 Codex 和其他 AI 编程产品放在一起比，有一个核心前提：它们在 2026 年已经分化成了完全不同的产品形态。简单来说，你比较的已经不是几辆同型号的车，而是截然不同的"驾驶方法"。下面这张对比图，可以帮你快速建立一个整体印象：

下面，我会从几个最关键的维度，对几个目前市场上主流的AI编程产品，把这其中的差异展开说清楚。

工具

核心定位

一句话描述

工作方式

OpenAI Codex

云端自主智能体 (Cloud Agent)

一个可以完全委派任务的自主程序员

你把一个清晰的任务目标丢给它，它在云端隔离的沙箱环境里自主完成，然后通知你验收成果

Cursor

AI原生IDE (AI-Native IDE)

一个融入了顶级AI助手的代码编辑器

你的主要工作是写代码。AI围绕着你，在编辑器里实时提供补全、行内编辑、多文件修改建议

Claude Code

终端优先的智能体 (Terminal-First Agent)

一个常驻在终端里的高级开发伙伴

你更喜欢用命令行。它像你的高级搭档，能理解代码库结构、跑命令、做重构，并以协作的方式与你互动

GitHub Copilot

IDE集成代码助手 (IDE Assistant)

AI编程助手的鼻祖，功能全面的"副驾驶"

它深度融入你现有的 VS Code、JetBrains 等 IDE，提供实时代码补全、聊天、解释代码等功能，挺全面

三、Codex AI编程实战场景使用

有了上面对Codex 在AI编程领域中的基本了解，接下来通过实战案例详细介绍如何在实际项目开发中的应用。

3.1 Codex 辅助编码项目实战场景

3.1.1 创建项目

对于一个全新的项目，可以将提示词整理好，然后让Codex 生成项目框架，以后继续基于Codex 做持续的需求迭代开发，下面来看一个实际的案例。

创建一个springboot工程，技术栈为：springboot 3.2.X ，mysql8, lombok，mybatis-plus，jdk使用17版本，工程采用mvc架构风格，提供单元测试

创建工程有2种方式，可以基于cli命令行创建，也可以基于Codex 的桌面版的客户端，选择任何一种方式均可，看个人习惯，我这里使用桌面版创建，如下，打开本地的一个目录作为项目空间

打开之后，输入上面的提示词

中间会有跳出需要你手动确认的操作，这个跟claude code是一样的

注意：

通过codex 客户端创建出来工程后，为了后续操作方便，以及检查生成的代码的质量，建议可以导入到ide中进行人工校验。

通过IDE打开项目之后可以看到，完全是按照上述提示词的要求生成的项目框架代码，并且提供了单元测试代码

3.1.2 代码推送到远程git仓库

一般来说，新的项目创建之后，为了方便后续团队协作，需要将代码托管到git仓库，接下来可以直接在codex的客户端通过自然语言操作来完成这个事情

1）发起推送gitee仓库代码请求

如下，对话框输入自然语言，让AI 将代码推送远程仓库

AI识别这个请求后，开始做初始化项目的动作

2）提供个人gitee 仓库的登录认证信息

上一步初始化完成后，AI要求提供gitee的认证信息

然后提供你的gitee仓库地址

3）提交代码

通过认证后就可以完成代码的推送了

3.1.3 老旧项目改造

在日常工作中，比如入职一家新单位或者加入一个新的项目组之后，需要接手别人之前的老项目，需要对老项目进行优化、改造，或者基于老项目继续做迭代开发，在这种情况下，传统的开发模式下，一般是拿到项目后，参考项目相关的文档进行学习、研究，不排除挺多老旧项目文档缺失，这就给接手项目的人带来了挺多麻烦，造成接手老项目的难度挺大，有了AI编程，可以借助AI 来帮开发者对老旧项目一起进行理解、学习，从而加快改造的进度，如下，我们使用Codex 客户端打开一个历史项目，给出如下提示词：

在当前项目的根目录下生成一个项目介绍文档，该文档后续用于为其他参与这个项目开发的人员快速了解整个项目使用，生成的项目文档格式为 markdown格式，后续我将与你共创这个文档

在对话框中输入提示词

等待AI一段时间响应之后，可以看到项目介绍文档已经生成

接下来，开发者就可以一边参考这个文档对项目进行学习了解，另一方面也可以在后续的开发中持续优化完善这个文档。

3.1.4 开发新接口

使用Codex 帮我们开发一个新的接口，给出下面的提示词

在PdaPickingController中增加一个分页列表查询的接口

这里我使用CLI终端，输入上面的提示词

中间会有一些需要你手动确认的操作

注意：

AI生成了代码之后，开发者最好还是要对代码做一遍完整的review，确保AI生成的代码符合规范

3.1.5 代码诊断

或许你也遇到过这样的场景，线上某个功能突然变得很慢，然后问题提给你，需要你解决，通常情况下，这就是典型的性能诊断问题，对后端开发者来说，需要通过接口定位问题，传统方式下，需要通过一系列手段，甚至还需要借助外部的工具来帮助定位问题，有了AI之后，就可以让AI帮开发人员做一部分这样的接口性能诊断的事，如下，在项目中，有一个接口中可能存在性能问题，让AI来分析并给出一些建议

对InventoryCheckController这个接口类中的queryTailGoods查询逻辑进行性能诊断，然后给出诊断建议

在CLI命令行中输入进去，经过一段时间思考之后，给出了优化的建议，优化不仅包括代码层面的，也包括SQL调优

在AI执行的过程中，中间会有一些不确定的操作会列出来，然后等待操作者进行确认，相当于是复核的动作

3.2 Codex 记忆文件在项目开发中使用

3.2.1 AGENTS.md 文件介绍

在项目编程开发中使用 AGENTS.md，本质上就是给 Codex（以及其他 AI 编程助手）一份权威的项目说明书。它不是写给人的 README，而是写给 AI 的、可执行的上下文指令。这个跟Claude Code 中的那个CLAUDE.md文件功能效果是类似的。

核心价值在于：让 AI 一次性了解你的项目规则，避免每次对话都重复相同的信息。根据普林斯顿大学的研究，一份好的 AGENTS.md 能让 Codex 的任务执行时间缩短 28.6%，Token 消耗减少 16.6%

3.2.2 AGENTS.md 的核心内容框架

挺多同学会有疑问，在AGENTS.md文件中可以包括哪些内容呢？下面给出一些可以写入AGENTS.md文件的内容。

1）项目基本信息（3-5 行）

用几句话说明：这是什么项目、用什么技术栈、谁来调用。

# 项目名称

FastAPI 支付服务，Python 3.12，PostgreSQL 17，Redis 做幂等性。
下游消费者：移动端 App、Web 前端、合作伙伴后端。

2）命令清单

用表格形式列出所有常用命令，AI 会直接执行这些命令
关键要求：

命令要精确可执行，不要写"运行测试"这种模糊描述，要写 pytest tests/ -v

## Commands

| Intent | Command |
|--------|---------|
| 安装依赖 | `uv sync` |
| 启动开发服务器 | `uv run fastapi dev main.py` |
| 运行单元测试 | `uv run pytest tests/unit -v` |
| 运行契约测试 | `uv run pytest tests/contract -v` |
| 代码检查 | `uv run ruff check --fix .` |
| 数据库迁移 | `alembic upgrade head` |

3）项目架构说明

告诉 AI 代码是如何组织的：

## Architecture

- `/app/api/` - 路由层（薄，只做参数校验和响应格式化）
- `/app/services/` - 业务逻辑层（核心逻辑放这里）
- `/app/models/` - SQLAlchemy 模型
- `/app/schemas/` - Pydantic 请求/响应模型
- `/app/repositories/` - 数据访问层（不允许写原生 SQL）

4）代码规范（只写偏离默认的）

不要写"写干净的代码"这种废话，只写 AI 容易搞错的、项目特有的规则

## Code Style

- 所有函数必须有类型注解
- 默认使用 async/await（除非 legacy 模块）
- 错误返回 `{"code": string, "message": string, "details": object}` 格式
- 禁止使用 `eval()`，禁止使用 `* import`

5）边界约束

这是最容易出问题的地方，明确告诉 AI 哪些地方不能动

## Do NOT edit by hand

- `/gen/` 下的任何文件（由代码生成器生成）
- `/migrations/` 中已应用的迁移文件
- `.env` 相关文件（密钥管理）
- `/legacy/` 模块（故意使用同步代码，不要试图改造）

3.2.3 AGENTS.md 协作流程

如何在项目中编写和使用AGENTS.md呢，下面给出一个具体的操作步骤。

第一步：在项目根目录创建 AGENTS.md

可以手动创建，或者通过cli命令创建

第二步：与 Codex 的协作模式

日常开发工作流：

1. 开始任务前：Codex 会自动读取 AGENTS.md（你不需要在每次 Prompt 中重复规则）
2. 执行任务：AI 会按照 AGENTS.md 中的命令运行测试、启动服务
3. 提交代码：AI 会遵循文件中定义的规范和边界

一个有效 Prompt 示例：

在 payments/service.py 中新增一个 refund 方法。
要求：
- 先展示修改计划
- 遵循项目架构（逻辑放 service，不在 API 层写业务）
- 修改后运行单元测试
- 不要动 gen/ 下的文件

下面我通过CLI命令行创建一个AGENTS.md 文件，在命令行中给出下面的提示词

认真阅读并分析当前的PDA模块的项目，然后在当前模块的根目录下创建 AGENTS.md文件，该文件算是对pda模块项目的规范文件，后续整个开发团队都将遵守这个规范进行日常编程开发，我也会与你共创并完善这个文件

输入提示词之后，等待AI的响应，最终在项目根目录下生成了AGENTS.md 文件

通过检查这个文件，可以看到，AI 完整解析了当前的这个模块的代码结构、当前项目的代码规范、日志规范等，后续可以继续根据实际情况对这个文件进行持续完善

补充说明：

有了这个文件之后，后续在当前的服务模块中指挥AI写代码的时候，AI就会自动遵守这个文件中的规范编写，从而生成的代码质量更高

3.3 结合飞书CLI 一起使用

在之前学习claude code的时候，分享过一种实际项目开发中的模式，就是在CLI模式下，结合飞书文档一起使用，简单来说，如果你所在的开发团队有下面的场景，可以考虑结合飞书文档一起使用，当然前提是在你本机安装了飞书CLI技能包，具体来说：

需求说明书PRD文档在飞书文档管理
飞书文档格式为 markdown格式
本地安装了飞书CLI
Codex 借助飞书CLI 操作飞书文档

接下来通过一个实际案例完整演示下这个过程。

3.3.1 前置准备

本机安装飞书CLI技能包，我已经提前安装配置过了

3.3.2 准备飞书需求文档

下面是我放在飞书文档中的一个原始的需求说明书。

3.3.3 读取飞书需求文档，生成开发计划

在实际项目协作开发场景中，通常是需要进行需求的三方评审，评审完成后，开发人员根据需求生成开发设计方案，然后做编码开发，有了飞书CLI，借助Codex 操作飞书文档，生成开发计划，给出下面的提示词：

输入提示词后，等待响应，通过控制台输出可以看到中间调用了飞书CLI 提供的相关技能包

同时，在生成开发计划过程中，Codex 会根据自己对项目的理解，发现当前所在的这个模块并不适合承载用户管理的模块，并给出了合适的建议

3.3.4 基于开发计划生成代码

基于上一步生成的开发计划，接下来开发者需要做的是，手动或者通过多轮对话的方式完善这份开发计划，等到开发计划确认无误之后，直接在命令行输入提示词：

基于本次的开发计划，生成完整的代码

四、写在文末

本文通过实际案例操作，详细介绍了使用Codex 在日常项目开发中的一些实际场景的应用，覆盖了大多数的使用场景，基于这些场景可以助力开发人员快速上手使用Codex高效完成日常的编程开发，希望对看到的同学有用，本篇到此结束，感谢观看。

这篇笔记就先到这里，后面用到新的思路或者发现有问题再补充。

小丸子博客