OpenClaw的爆火再次超出预期,结合近期关于Big Model与Big Harness的争论,我个人也深感技术发展之迅速,并对此感到些许迷茫。近期与一些业内人士交流后,针对目前AI发展最重要的三个要素:基模、脚手架和工具,我大致形成了一些看法,在此不妨分享。
人工智能的第一性原理:脚手架最终还是会被拆掉,大的脚手架不符合技术发展的终局
这本是我一贯的看法,但在OpenClaw这波热潮中受到很大挑战。我开始怀疑:有没有可能脚手架“自成气候”,然后基模要反过来适应脚手架?这或许已经不是可能,而是一定程度的现实。举几个明显例子:商业上,之前OpenClaw一度和各基模公司互掐,证明“脚手架”本身已经具备相当议价能力了。技术上,这一波更能适应Skills, 以及相关Memory系统的基模大放异彩,甚至可以预见,各大厂的基模会对于OpenClaw有一拨针对性的优化。然而,我仍然坚持之前的判断,认为这些属于短期趋势。脚手架本质是对基模的补丁,也没有任何理由不能被基模吸收。基模的长时记忆、流程控制、工具使用的能力一定会持续发展,直到大部分脚手架功能被覆盖。
在现有基模的水平上,脚手架有可能极大拓展应用边界,取得短期优势**
当前智能体主要优势,仍然是通过编排和流程控制、实现基模无法到达的效果。23年基模普遍不具备Reasoning能力的情况下,reflection和reasoning的流程编排是当时脚手架的核心。今天,长时记忆、持续学习、长程控制成了脚手架的核心。在大部分时候,脚手架所能实现的功能始终领先于模型,也引领基模不断向下一代迭代。但OpenClaw这类具有明显突破性的脚手架,意义却可能有所不同:当脚手架在短期内形成巨大入口优势,随之而来的海量的资本和数据将有可能称为下一代基模的关键要素。从这点看,目前的竞争格局其实十分扑朔迷离。
让模型适应工具,而不是工具适应模型和智能体**
OpenClaw的爆火也引发关于“AI原生软件”的讨论,如今天看到一个重要观点是“未来的软件应专门为AI而不是人类设计”以及“GUI已死”。这种看法并非没有依据,搜索就是典型的例子。过去搜索主要面向用户,要关注首页观感,要精心设计LOGO和搜索框。今天AI搜索的比例已经超过人类搜索比例,过去搜索的核心优势也就不复存在了。然而,并非所有软件和工具一定要去适应AI。我觉得GUI大概率不会死,在很多软件上,GUI仍然具有天然的效率优势。此外,未来AI也不会只能读懂Coding和Markdown。其实,这种认知在AI发展历史中其实频繁出现,例如:自动驾驶到底是该AI来适应人类道路,还是通过改造道路来满足当前AI技术需要(车路协同)?家务机器人到底应该变得更容易泛化到非结构化环境,还是应该改造每个家庭使其更结构化更能满足机器人当前的需要?这些问题今天都有非常明确的答案,但哪怕放到只是5年前,持有不同观点和我争论过的都比比皆是。
从大模型过去三四年的发展历程来看,其迭代和发展尽管迅速,但模式似乎已经逐渐清晰, 即 建构在基模上的脚手架拓展边界,基模迅速跟进,覆盖并超越上一代脚手架能力。 当然,这个趋势是否会一直持续下去还很难说。