关于第三代 AI 编程的思考

前几天 Cursor 团队提到了“第三代 Agent 模型”的概念。抛开概念炒作不谈，单看实际落地的工具，像 OpenClaw 这类框架确实已经有点全自动化编程的模子了。把需求扔进去，它自己去查文件、跑终端、看报错日志，大模型直接接管代码仓库的愿景似乎已经近在眼前。但作为每天都在实际业务中趟坑的开发者，从我的真实体感来看，这个“模子”要真正成为可靠的生产力，中间还隔着一道巨大的算力和工程鸿沟。

频频罢工的 Agent 与昂贵的算力消耗

我目前的工作流是这样的：重度开发直接上每月 200 刀的 Claude Max 订阅，日常轻度需求用每月 20 刀的 Gemini Pro。为了测试自动化工作流，我还在 AWS 上部署了 OpenClaw，底层接入的就是 Gemini。

但在实际使用中，OpenClaw 一天基本会罢工 2 到 3 次。这里的罢工是指直接触发 API 的 Limit 限制。有一次，我仅仅是让它去做一个非常普通的纯新项目，本以为可以体验一下“挂机干活”的快感，结果不到半个小时，频繁的内部循环和工具调用就直接把 Pro 账号的配额刷超限了。这意味着，我一天中起码有半天时间是无法让 OpenClaw 正常工作的。

经过这几次折腾，OpenClaw 现在在我的工作流里只能用来做轻度任务。

从监督到无监督：算力黑洞的根源

为什么 OpenClaw 会如此疯狂地吞噬 API 配额？在实际观察了它的运行日志后，我发现这其实是一个工作模式的根本差异。

我们平时用 Copilot 或者基础的对话框写代码，体感上非常像机器学习里的监督学习（Supervised Learning）。你作为人类，充当了那个给出 Label 的角色。你提供明确的上下文、划定边界、给出具体的指令，AI 在你的步步引导和监督下输出代码。这种模式可控、成本线性，且结果相对收敛。

而把整个项目扔给 OpenClaw 挂机干活，它的行为逻辑极其类似于无监督学习（Unsupervised Learning）。你只给了一个高维度的目标，然后把它丢进巨大的代码库里。它需要在没有人类中间介入的情况下，自己去寻找文件间的关联、自己去试错并阅读全局报错日志。

这种“无监督”的探索过程是充满盲目性的。一旦它的方向猜错，就会陷入不断调用本地工具、不断把错误日志重新塞回上下文的死亡循环。这正是导致 Token 用量呈指数级暴增的核心原因。

算一笔 OpenClaw 的 API 经济账

如果我们在这种“无监督”的模式下彻底放开手脚，直接绑上 API Key 跑全自动开发，成本到底有多夸张？

从我的实际体感来看，为了完成同一个任务，Agent 在自主模式下的 Token 用量至少是普通监督对话模式的 5 到 10 倍以上。

假设我们用主流旗舰大模型（按输入 $3/1M，输出 $15/1M 估算）来跑高强度的全自动编程：

日均消耗估算：在 10 倍的用量膨胀下，让 Agent 挂机排错一天，消耗 1000 万 (10M) 输入 Tokens 和 100 万 (1M) 输出 Tokens 是极其轻松的。
单日纯 API 成本：(10 * $3) + (1 * $15) = $45 / 天
月度纯算力开销：按 20 个工作日计算，每个月的 API 账单直接飙到 $900（约合人民币 6500 多元）。

压垮 ROI 的其实是兜底成本

很多人看到每月 $900 的算力成本会觉得：这还是比雇一个全职程序员便宜啊！但实际上，这里漏算了一笔最致命的开销。

你根本无法做到真正的“无监督”。因为 OpenClaw 搞不定的烂摊子，最终还是要人来收场。你要时刻盯着控制台，看它有没有陷入逻辑死循环，有没有删错文件，还要花费精力去 Review 和修改它生成的半成品代码。

当你把这 $900 的 API 账单，叠加上高级开发人员（你自己）高昂的擦屁股和兜底的时间成本，目前用这种全自动 Agent 完全替代人工的综合投入产出比（ROI）其实是非常低的。

软件开发已死？真正的危机是人才断层

伴随着 AI 编程的进化，“软件开发已死”的论调又开始盛行。但实际情况是，高级人才绝对不会死。

目前的大模型确实能够极其高效地解决开发中 80% 到 90% 的问题，但这也就意味着，剩下的那 10% 才是真正的深水区。这 10% 的问题涉及复杂的系统架构、深层的并发 Bug 或是模糊的业务边界，它需要高级人才依靠长年积累的经验、直觉和对代码的敏感度来解决。

AI 的普及导致了一个直接结果：低级人才正在被加速替换。现在一个初级人员可以通过依赖 AI，轻易伪装出中级人员的产出效率。

但这带来了一个致命的隐患。初级人员如果高度依赖 AI 去完成那 80% 的日常工作，他们就失去了在枯燥的业务代码中踩坑、排错和重构的机会。没有这些基础工作的“喂招”，他们在代码直觉和技术敏感度上根本无法形成有效的累积。

一个没有经验护城河的开发者，随时可以被更新一代的模型替代。这才是行业真正面临的问题：人员断层。当现在的初级开发者失去了成长为高级工程师的土壤，五年、十年后，谁来解决系统里那最致命的 10% 的难题？

关于第三代 AI 编程的思考：全自动 Agent 的真实成本与人才断层危机