Tarquin note
Tarquin note

Agent 可以很快,但没有边界的快,只会把问题扩散得更快。
一次可靠的 Agent 开发循环,应该从事实确认开始,经由计划拆解、模块实现、自动检查和视觉验收收尾。真正省时间的不是跳过步骤,而是让每一步都有可验证的出口。
我现在会把 Agent 当成一个 会写代码的协作者,而不是一个许愿池。你给它上下文、边界和验收标准,它才不容易把项目改成一堆看似努力的废料。
这套流程适合小到一个 CSS 修复,大到一次页面改造。区别只在于检查深度,不在于有没有流程。
Agent 最容易犯的错是听完需求就开始写。正确做法是先读项目:路由在哪里、样式在哪里、已有组件怎么复用、哪些文件已经有未提交改动。
如果是 Next.js 项目,我还会顺手对照 Next.js 文档 确认路由和构建行为,别靠记忆硬猜。
可以先跑这些只读命令:
git status --short
rg --files
rg -n "Callout|detail-body|article-row" app styles content
这些命令能快速确认变更边界。尤其是 git status --short,能避免把用户已有改动当成自己的垃圾一起卷进去。
没读代码就开改,是 Agent 工作流里最典型的灾难开关。越自信,越容易把项目结构撞散。
计划不需要写成论文,但每一步都要有出口。比如“改文章排版”太虚,“补 .detail-body 的标题、列表、代码块和 Callout 样式,并验证两篇 MDX”就能执行。
我会按这个顺序拆:
好的 TODO 不是提醒自己“要努力”,而是告诉下一步怎么判断完成。
实现完成以后,至少要跑项目自己的检查命令。对这个站点来说,常规组合就是:
bun run lint
bunx tsc --noEmit
bun run build
如果改的是视觉,还要打开浏览器看实际页面。工具输出通过只能说明代码大概率没炸,不能说明用户看见的页面舒服。
一轮 Agent 工作不应该以“我觉得好了”结束,而应该以“哪些检查通过、哪些页面验过、还剩什么风险”结束。把这个闭环固定下来,Agent 才能从会写代码,变成真的能交付。
| 阶段 | 输出物 | 不合格信号 |
|---|---|---|
| 调研 | 文件和事实清单 | |
| 实现 | 小范围 diff | 改动跨了无关模块 |
| 验证 | 命令和页面证据 | 只说“应该可以” |
git status --short。