通用智能非常识 | AGI non-obvious insights

OpenClaw的爆火再次超出预期，结合近期关于Big Model与Big Harness的争论，我个人也深感技术发展之迅速，并对此感到些许迷茫。近期与一些业内人士交流后，针对目前AI发展最重要的三个要素：基模、脚手架和工具，我大致形成了一些看法，在此不妨分享。

人工智能的第一性原理：脚手架最终还是会被拆掉，大的脚手架不符合技术发展的终局

这本是我一贯的看法，但在OpenClaw这波热潮中受到很大挑战。我开始怀疑：有没有可能脚手架“自成气候”，然后基模要反过来适应脚手架？这或许已经不是可能，而是一定程度的现实。举几个明显例子：商业上，之前OpenClaw一度和各基模公司互掐，证明“脚手架”本身已经具备相当议价能力了。技术上，这一波更能适应Skills, 以及相关Memory系统的基模大放异彩，甚至可以预见，各大厂的基模会对于OpenClaw有一拨针对性的优化。然而，我仍然坚持之前的判断，认为这些属于短期趋势。脚手架本质是对基模的补丁，也没有任何理由不能被基模吸收。基模的长时记忆、流程控制、工具使用的能力一定会持续发展，直到大部分脚手架功能被覆盖。

在现有基模的水平上，脚手架有可能极大拓展应用边界，取得短期优势**

当前智能体主要优势，仍然是通过编排和流程控制、实现基模无法到达的效果。23年基模普遍不具备Reasoning能力的情况下，reflection和reasoning的流程编排是当时脚手架的核心。今天，长时记忆、持续学习、长程控制成了脚手架的核心。在大部分时候，脚手架所能实现的功能始终领先于模型，也引领基模不断向下一代迭代。但OpenClaw这类具有明显突破性的脚手架，意义却可能有所不同：当脚手架在短期内形成巨大入口优势，随之而来的海量的资本和数据将有可能称为下一代基模的关键要素。从这点看，目前的竞争格局其实十分扑朔迷离。

让模型适应工具，而不是工具适应模型和智能体**

OpenClaw的爆火也引发关于“AI原生软件”的讨论，如今天看到一个重要观点是“未来的软件应专门为AI而不是人类设计”以及“GUI已死”。这种看法并非没有依据，搜索就是典型的例子。过去搜索主要面向用户，要关注首页观感，要精心设计LOGO和搜索框。今天AI搜索的比例已经超过人类搜索比例，过去搜索的核心优势也就不复存在了。然而，并非所有软件和工具一定要去适应AI。我觉得GUI大概率不会死，在很多软件上，GUI仍然具有天然的效率优势。此外，未来AI也不会只能读懂Coding和Markdown。其实，这种认知在AI发展历史中其实频繁出现，例如：自动驾驶到底是该AI来适应人类道路，还是通过改造道路来满足当前AI技术需要（车路协同）？家务机器人到底应该变得更容易泛化到非结构化环境，还是应该改造每个家庭使其更结构化更能满足机器人当前的需要？这些问题今天都有非常明确的答案，但哪怕放到只是5年前，持有不同观点和我争论过的都比比皆是。

从大模型过去三四年的发展历程来看，其迭代和发展尽管迅速，但模式似乎已经逐渐清晰, 即建构在基模上的脚手架拓展边界，基模迅速跟进，覆盖并超越上一代脚手架能力。当然，这个趋势是否会一直持续下去还很难说。

人工智能的第一性原理：脚手架最终还是会被拆掉，大的脚手架不符合技术发展的终局

在现有基模的水平上，脚手架有可能极大拓展应用边界，取得短期优势**

让模型适应工具，而不是工具适应模型和智能体**

FEATURED TAGS