关于第三代 AI 编程的思考
前几天 Cursor 团队提到了“第三代 Agent 模型”的概念。抛开概念炒作不谈,单看实际落地的工具,像 OpenClaw 这类框架确实已经有点全自动化编程的模子了。把需求扔进去,它自己去查文件、跑终端、看报错日志,大模型直接接管代码仓库的愿景似乎已经近在眼前。但作为每天都在实际业务中趟坑的开发者,从我的真实体感来看,这个“模子”要真正成为可靠的生产力,中间还隔着一道巨大的算力和工程鸿沟。
频频罢工的 Agent 与昂贵的算力消耗
我目前的工作流是这样的:重度开发直接上每月 200 刀的 Claude Max 订阅,日常轻度需求用每月 20 刀的 Gemini Pro。为了测试自动化工作流,我还在 AWS 上部署了 OpenClaw,底层接入的就是 Gemini。
但在实际使用中,OpenClaw 一天基本会罢工 2 到 3 次。这里的罢工是指直接触发 API 的 Limit 限制。有一次,我仅仅是让它去做一个非常普通的纯新项目,本以为可以体验一下“挂机干活”的快感,结果不到半个小时,频繁的内部循环和工具调用就直接把 Pro 账号的配额刷超限了。这意味着,我一天中起码有半天时间是无法让 OpenClaw 正常工作的。
经过这几次折腾,OpenClaw 现在在我的工作流里只能用来做轻度任务。
从监督到无监督:算力黑洞的根源
为什么 OpenClaw 会如此疯狂地吞噬 API 配额?在实际观察了它的运行日志后,我发现这其实是一个工作模式的根本差异。
我们平时用 Copilot 或者基础的对话框写代码,体感上非常像机器学习里的监督学习(Supervised Learning)。你作为人类,充当了那个给出 Label 的角色。你提供明确的上下文、划定边界、给出具体的指令,AI 在你的步步引导和监督下输出代码。这种模式可控、成本线性,且结果相对收敛。
而把整个项目扔给 OpenClaw 挂机干活,它的行为逻辑极其类似于无监督学习(Unsupervised Learning)。你只给了一个高维度的目标,然后把它丢进巨大的代码库里。它需要在没有人类中间介入的情况下,自己去寻找文件间的关联、自己去试错并阅读全局报错日志。
这种“无监督”的探索过程是充满盲目性的。一旦它的方向猜错,就会陷入不断调用本地工具、不断把错误日志重新塞回上下文的死亡循环。这正是导致 Token 用量呈指数级暴增的核心原因。
算一笔 OpenClaw 的 API 经济账
如果我们在这种“无监督”的模式下彻底放开手脚,直接绑上 API Key 跑全自动开发,成本到底有多夸张?
从我的实际体感来看,为了完成同一个任务,Agent 在自主模式下的 Token 用量至少是普通监督对话模式的 5 到 10 倍以上。
假设我们用主流旗舰大模型(按输入 $3/1M,输出 $15/1M 估算)来跑高强度的全自动编程:
- 日均消耗估算:在 10 倍的用量膨胀下,让 Agent 挂机排错一天,消耗 1000 万 (10M) 输入 Tokens 和 100 万 (1M) 输出 Tokens 是极其轻松的。
- 单日纯 API 成本:(10 * $3) + (1 * $15) = $45 / 天
- 月度纯算力开销:按 20 个工作日计算,每个月的 API 账单直接飙到 $900(约合人民币 6500 多元)。
压垮 ROI 的其实是兜底成本
很多人看到每月 $900 的算力成本会觉得:这还是比雇一个全职程序员便宜啊!但实际上,这里漏算了一笔最致命的开销。
你根本无法做到真正的“无监督”。因为 OpenClaw 搞不定的烂摊子,最终还是要人来收场。你要时刻盯着控制台,看它有没有陷入逻辑死循环,有没有删错文件,还要花费精力去 Review 和修改它生成的半成品代码。
当你把这 $900 的 API 账单,叠加上高级开发人员(你自己)高昂的擦屁股和兜底的时间成本,目前用这种全自动 Agent 完全替代人工的综合投入产出比(ROI)其实是非常低的。
软件开发已死?真正的危机是人才断层
伴随着 AI 编程的进化,“软件开发已死”的论调又开始盛行。但实际情况是,高级人才绝对不会死。
目前的大模型确实能够极其高效地解决开发中 80% 到 90% 的问题,但这也就意味着,剩下的那 10% 才是真正的深水区。这 10% 的问题涉及复杂的系统架构、深层的并发 Bug 或是模糊的业务边界,它需要高级人才依靠长年积累的经验、直觉和对代码的敏感度来解决。
AI 的普及导致了一个直接结果:低级人才正在被加速替换。现在一个初级人员可以通过依赖 AI,轻易伪装出中级人员的产出效率。
但这带来了一个致命的隐患。初级人员如果高度依赖 AI 去完成那 80% 的日常工作,他们就失去了在枯燥的业务代码中踩坑、排错和重构的机会。没有这些基础工作的“喂招”,他们在代码直觉和技术敏感度上根本无法形成有效的累积。
一个没有经验护城河的开发者,随时可以被更新一代的模型替代。这才是行业真正面临的问题:人员断层。当现在的初级开发者失去了成长为高级工程师的土壤,五年、十年后,谁来解决系统里那最致命的 10% 的难题?