Total Pageviews

Sunday, 3 May 2026

关于 vibe coding 和 agentic engineering 的区别

 Karpathy 最近在 Sequoia 的 AI Ascent 2026 上聊了一个多小时,信息量很大,我试着把核心观点捋一捋。

他说自己从去年 12 月开始,突然觉得"跟不上了"。原因很简单:最新的模型写代码几乎不出错了,他不断让 agent 多做一点,结果每次都做对了,慢慢就完全信任它,进入了纯粹的 vibe coding 状态。他强调这个转折点非常陡峭,很多人还停留在去年用 ChatGPT 搜搜东西的印象里,但 12 月之后的 agentic 工作流已经完全不同了。

然后他聊到"软件 3.0"这个概念。软件 1.0 是人写代码,2.0 是用数据训练神经网络,3.0 则是你的编程变成了写 prompt、管理上下文窗口。他举了个特别生动的例子:他自己 vibe code 了一个叫 MenuGen 的 app,拍餐厅菜单然后生成菜品图片,结果后来发现只要把照片丢给 Gemini 加一句提示词,模型直接在原图上渲染出菜品图,整个 app 根本不需要存在。这说明我们不能只把 AI 当成"加速器",它能做到以前根本不可能的事情。

关于 vibe coding 和 agentic engineering 的区别,他说得很清楚:vibe coding 是抬高地板,让所有人都能写软件;agentic engineering 是保住天花板,在不牺牲质量的前提下用 agent 加速。后者是一门严肃的工程学科,因为 agent 本质上是"尖刺状"的实体,能力分布极不均匀,你得学会协调它们。

他花了不少时间解释为什么模型能力如此"参差不齐"。核心原因是可验证性加上实验室的关注度。能被 RL 环境验证的领域(数学、代码)进步飞快,其他领域就会卡住。他举了个让人哭笑不得的例子:最强的模型能重构十万行代码库,却会告诉你"洗车店只有 50 米远,走路去吧"。这种荒谬的不一致说明你必须留在 loop 里,保持判断力。

最后他聊到人类还剩什么价值。现阶段 agent 像实习生,你负责审美、品味、架构设计和顶层规划,agent 负责填充细节。他引用了一句让他反复琢磨的话:"你可以外包你的思考,但你没法外包你的理解。" 理解力仍然是瓶颈,因为你得知道要构建什么、为什么值得做、怎么指挥你的 agent。这也是他做 LLM 知识库项目的原因,他觉得用不同视角重新投射信息,能帮助自己真正理解事物,而这件事目前模型还做不好。

美国若从德国撤军,德国将暗爽

生命的火花

解放初期,许多青年人为了祖国的需要,参加了开发边疆的队伍,来到西北的天山脚下,要在这里建起第一座农场。刘海英是这群青年中年纪较小的一个,她在劳动中吃苦耐劳,热情愉快。由于她努力钻研业务,很快学会了开拖拉机。

波音是如何自毁的?

-今天的美军打不赢伊朗,也是整个美国“脱实向虚”,放弃制造业,大玩金融业造成的恶果,实在怪不得别人。制造业空心化, 防空弹/拦截弹不能足量及时的造出来,还打仗?

以色列精銳几乎被全殲,鐵穹成廢鐵