今天这信号数据,看着就像一场“AI大跃进”和“现实骨感”的拉锯战。一边是大家对AI代理(Agent)的热情高涨,恨不得所有开发流程都塞进去;另一边,传统行业和普通用户还在为“好用”这两个字挣扎,甚至有些“拨乱反正”的味道。
先说这股子“Agent风”。你看GitHub上那些火爆的项目,什么`mattpocock/skills`、`forrestchang/andrej-karpathy-skills`,本质上都是在教AI怎么更好地写代码,怎么避坑。这说明啥?说明我们对AI的期望已经不满足于它写个Hello World了,我们想让它更聪明、更像个“人”一样思考。甚至还有`warpdotdev/warp`这种“代理式开发环境”,直接想把AI塞到终端里,让它帮你干活。还有什么`TradingAgents`、`hermes-agent`,甚至Hugging Face上那个`ML Intern`,这不就是把AI当成一个能自主思考、执行任务的“员工”甚至“同事”吗?
这股风吹得挺猛,但工程上,坑可不少。训练这些Agent,不光是模型大小的问题,更关键的是如何让它们稳定、可靠、可控。现在这些所谓的“Agent”,很多时候还是个“高级脚本”,离真正的自主学习、适应环境还远着呢。特别是像金融交易这种高风险领域,AI Agent一个指令跑偏,那可不是开玩笑的。对我们普通开发者来说,现在就一头扎进去做Agent,除非你有非常明确的应用场景和足够的技术储备,否则很可能就是给别人当“炼丹童子”了。与其追求大而全的“通用Agent”,不如先关注那些能解决特定痛点的、小而美的Agent工具,比如代码辅助、自动化测试之类的。商业化?现在大多数Agent还是概念阶段,真要落地,得把稳定性和安全性放在首位,不然就是个玩具。
再说另一边,Hacker News上那条“奔驰承诺把实体按钮带回来”,简直是给所有追求“智能”而忽略“人本”的产品经理一记响亮的耳光。这说明用户体验的本质是“好用”,而不是堆砌技术。再智能的屏幕、再酷炫的语音助手,也比不上一个盲操就能搞定的实体按钮。这事儿跟“TUI回潮”有异曲同工之妙,很多时候,命令行界面(TUI)比图形界面(GUI)更高效,就因为它的直接、无干扰。技术是工具,不是目的。
但同时,Hacker News上“OpenAI的o1在急诊诊断上胜过医生”这条又让我们看到了AI的巨大潜力。这可不是小打小闹,这是在核心业务上直接超越人类专家。如果AI真的能在高压、信息不足的环境下做出更准确的判断,那它对社会的影响将是颠覆性的。这事儿给我的感觉就是,AI正在从“辅助工具”向“决策者”转变,而且是在高风险领域。但这里面的风险也显而易见:AI出错谁负责?数据隐私怎么保障?这些问题不解决,任何“AI超越人类”的说法都只能是实验室里的狂欢。
总的来说,现在的技术图景就是:大家对AI Agent充满期待,想让它解决更多复杂问题,甚至替代部分人类工作;但同时,我们也不能忘了,技术最终是服务于人的,用户体验、稳定性和安全性才是王道。AI的未来,不是一味地追求“智能”,而是在“智能”和“好用”之间找到那个平衡点。现在就全面拥抱AI Agent?我觉得还是等等看,先让那些先驱们趟趟雷,把坑填平了,我们再上也不迟。