Tarquin note

Agent 工作流：从调研到验证的闭环

2025.12.195 min read

Agent 可以很快，但没有边界的快，只会把问题扩散得更快。

一次可靠的 Agent 开发循环，应该从事实确认开始，经由计划拆解、模块实现、自动检查和视觉验收收尾。真正省时间的不是跳过步骤，而是让每一步都有可验证的出口。

我现在会把 Agent 当成一个 会写代码的协作者，而不是一个许愿池。你给它上下文、边界和验收标准，它才不容易把项目改成一堆看似努力的废料。

这套流程适合小到一个 CSS 修复，大到一次页面改造。区别只在于检查深度，不在于有没有流程。

第一步是确认事实

Agent 最容易犯的错是听完需求就开始写。正确做法是先读项目：路由在哪里、样式在哪里、已有组件怎么复用、哪些文件已经有未提交改动。

如果是 Next.js 项目，我还会顺手对照 Next.js 文档确认路由和构建行为，别靠记忆硬猜。

可以先跑这些只读命令：

git status --short
rg --files
rg -n "Callout|detail-body|article-row" app styles content

这些命令能快速确认变更边界。尤其是 git status --short，能避免把用户已有改动当成自己的垃圾一起卷进去。

没读代码就开改，是 Agent 工作流里最典型的灾难开关。越自信，越容易把项目结构撞散。

计划不需要写成论文，但每一步都要有出口。比如“改文章排版”太虚，“补 .detail-body 的标题、列表、代码块和 Callout 样式，并验证两篇 MDX”就能执行。

我会按这个顺序拆：

好的 TODO 不是提醒自己“要努力”，而是告诉下一步怎么判断完成。

实现完成以后，至少要跑项目自己的检查命令。对这个站点来说，常规组合就是：

bun run lint
bunx tsc --noEmit
bun run build

如果改的是视觉，还要打开浏览器看实际页面。工具输出通过只能说明代码大概率没炸，不能说明用户看见的页面舒服。

一轮 Agent 工作不应该以“我觉得好了”结束，而应该以“哪些检查通过、哪些页面验过、还剩什么风险”结束。把这个闭环固定下来，Agent 才能从会写代码，变成真的能交付。