从知识库到Agent原生OS,汪源想为 Agent 造一个操作系统

摘要

当软件的第一用户变成Agent。

 

 

3月31日,前网易集团副总裁、网易杭州研究院执行院长汪源,带着其创办的AI公司remio,发布了首个Agentic OS——rOS。此前,remio以 AI 个人知识库产品切入市场,核心能力是为用户打通网页、文档、会议录音、聊天消息等多源信息,构建可被 AI 高效检索与调用的个人数字记忆体系。

 

图片来源:极客公园

 

remio 此次推出了面向 Agent 原生应用打造的操作系统 rOS,以及运行在该系统之上的全新应用形态 aApp(Agentic App)。这套产品体系的核心,重构了 Agent 时代的软件设计逻辑:让软件的第一服务对象从人转向 Agent,为 AI 原生应用提供完整的运行底座;同时让普通知识工作者能开箱即用高价值的 Agent 能力,无需折腾复杂的技术配置;也让各垂直领域的行业专家,能把自己的行业经验转化为可直接商业化的 AI 应用。

 

在开源项目OpenClaw刷屏AI圈、无数从业者扎堆做Agent工具的当下,汪源在发布会开场直言:龙虾的爆火,根本算不上Agent时代的iPhone时刻。

 

在他看来,当下行业热议的Computer Use、Skill生态,都只是过渡性方案;而remio要做的,是给Agent时代搭好完整的操作系统底座,让普通用户拎包入住,让行业专家的经验能直接变现。

 

火遍全网的Agent,困在了“WAP时代”

 

过去一年,AI行业从未缺少关于Agent“iPhone时刻”的讨论,却始终尚未等来真正的全民普及。

 

OpenClaw的爆火,让AI第一次真正拥有了操作电脑的能力,无数用户跟风尝试,却很快陷入了困境:有人被复杂的配置流程拦在门外,真正能把龙虾“玩起来”的用户不足半数;有人好不容易完成了部署,却始终想不明白它能在日常工作里解决什么具体问题,新鲜感褪去后便再也没有打开。

 

此前红极一时的Sora,也曾让无数用户涌入尝鲜,但一个月后的用户留存率不足1%,最终落得被关停的结局;如今遍地开花的Skill、插件、MCP协议,看似构建起了繁荣的Agent生态,可真实的用户体验却是“电脑里装了上百个Skill,却没几个能真正持续用起来”,Skill与Skill之间还会相互冲突,最终沦为摆设。

 

在汪源看来,当下的Agent生态,像极了移动互联网爆发前夜的“WAP时代”。2000年初,为了让功能机也能访问互联网,WAP协议应运而生,它能把PC端的网页简化后搬到手机上,却始终受限于简陋的协议能力,没能带来真正的体验革命。而今天行业里热议的Computer Use、MCP、Skill,本质上都是同一种逻辑:让Agent去适配、操作那些原本为人类设计的软件,只是完成了旧生态与新能力的衔接,是过渡性的方案,而非Agent时代的终极形态。

图片来源:remio

 

对于当下最火的龙虾,汪源谈到,它最多只能算是Agent领域的Linux系统,能给一部分有技术能力的用户提供个性化搭建、配置的框架,让高手能折腾出复杂的玩法,但对普通用户而言,极高的使用门槛始终横在那里。remio始终想做的,则是iPhone、Mac式的产品——让普通用户不用折腾,开箱即用、拎包入住。

 

在汪源的判断里,这些过渡性方案中,Computer Use会是最快被行业淘汰的。“AI要去操作飞书,通过Computer Use视觉识别的方式也能做,但只要飞书提供了完善的接口和命令行工具,Agent就完全不需要用这种高成本、低效率的方式。”他直言,两三年之后,Computer Use在主流场景里几乎就会失去用武之地,只会在一些无法提供接口的“老古董软件”里保留一席之地。而API与传统SaaS软件的生命周期会更长,但最终也会被Agent原生应用逐步替代。

 

基于这个判断,remio拿出了自己的答案:rOS,为Agent原生应用打造的操作系统,以及运行在这个系统之上的全新应用形态——aApp(Agentic App)。

 

和当下用完即走、上下文清零的Skill不同,aApp更像我们手机里的原生App:它能在后台持续运行,通过事件触发主动响应,无需用户反复启动;也能直接访问用户完整的工作上下文,从邮件、会议录音到聊天消息、本地文件,无需用户每次手动投喂信息;它以自然语言为核心交互方式,开箱即用,通过对话就能完成个性化配置。

 

汪源在发布会上演示了「智能待办」aApp,就是个典型的例子:它能实时监听用户的邮件和会议录音,自动提取其中的待办事项,无需用户手动记录;识别到需要回复附件的邮件时,它能自动找到对应文件、写好邮件内容完成发送,形成完整的工作闭环。而这一切,都不需要用户对Agent进行复杂的指令编写,只需要最开始的一次自然语言配置确认。

 

aApp:软件的第一用户,从人变成了Agent

 

aApp与传统软件、Skill的核心差异,是软件设计逻辑的底层颠覆。

 

过去几十年,从PC互联网到移动互联网,所有软件的设计核心都围绕着一个准则:以人为核心的用户体验。我们设计图形界面、梳理信息层级、简化交互路径,本质上都是为了降低人的使用门槛,让人能更轻松地看懂、操作软件。哪怕是当下的Skill和插件,其核心逻辑依然是“把人类使用软件的经验,教给Agent去复刻”。

 

但rOS和aApp,推翻了这个延续了几十年的设计准则。汪源直言:Agent时代,软件的第一用户不再是人,而是Agent,人退居二线,成为间接使用者。

 

这个核心变化,带来了软件设计的重构。

 

首先,软件不再需要复杂的图形用户界面,只需要提供语义清晰的接口。对人类而言,一个接口吐出几十万字的信息是灾难级的用户体验,但对Agent来说,全量的语义信息反而能让它更精准地完成任务;人类需要按钮、菜单、表单来完成操作,而Agent只需要自然语言的语义指令,就能完成编排和执行。

 

其次,软件不再需要追求“大而全”的套件能力。过去,企业倾向于使用飞书、Google Workspace这样的全链路套件,核心原因是人类无法高效处理几十个互不打通的软件,频繁的复制粘贴会极大降低工作效率。但Agent天生具备极强的可编排能力,不同厂商开发的垂直aApp,可以像积木一样自由组合,企业无需再为了一体化体验妥协,只需要选择每个领域里最好用的aApp,剩下的协同工作全部交给Agent即可。

 

汪源进一步拆解了传统办公套件的核心困境:“钉钉卖的是阿里的工作方式,飞书卖的是字节的工作方式,但Agent时代有很多组织,它的工作方式既不是阿里的,也不是字节的。”在他看来,飞书这类全家桶产品,在Agent时代必然会面临边缘化的挑战——它不可能把所有环节都做到行业最好,而Agent的可编排能力,让企业可以自由组合不同厂商的优质工具,再也不用被单一套件绑定。

 

更重要的是,这个新的体系也给行业里的“非技术开发者”,提供了know-how商业化的直接路径。

图片来源:remio

 

在此之前,一个拥有多年客户管理经验的企业内训顾问,一个深谙招聘逻辑的资深HR,一个有成熟运营方法论的行业专家,他们的行业经验最多只能做成Skill、Prompt,却很难直接变现——Skill没有版权保护,极易被盗版,只能走“做Skill卖课程”的曲线救国路线,没有成熟的分发渠道和商业化体系。

 

rOS的aApp生态,在尝试解决这个问题。汪源在采访中谈到,如今AI Coding的技术能力已经足够成熟,在remio的平台上,哪怕是不懂代码的行业专家,只需要提出自己的设计思路和业务需求,AI就能生成可运行的aApp。这就像移动互联网早期,懂摄影的人能做出优质的拍照修图APP,懂人力资源的人能做出招聘管理工具,行业经验第一次能直接转化为可运行的产品,而不需要依赖专业的工程师团队。

 

同时,remio也给这些开发者铺好了商业化的道路。平台早期的开发者变现方式,会和移动互联网早期高度相似——直接靠卖软件收钱,一个工具类aApp定价一美金、几美金,卖一个就有一份收入。而支撑这个商业模式成立的,是remio内置的著作权管理和签名鉴权机制,解决了盗版问题:只有付费用户才能运行对应的aApp,哪怕安装包被分享,也无法正常使用。这也是此前Skill生态始终无法实现商业化的核心痛点。

 

对于aApp的开发逻辑,汪源也在专访中分享了自己的实践经验:和传统软件开发、Skill开发完全不同,aApp的核心是围绕业务模型做设计,要尽量避免写死固定的工作流,把步骤调度权交给Agent,同时不用做复杂的UI交互。这种设计思路,既保证了aApp的灵活性,能适配用户随时提出的个性化需求,也平衡了Agent执行的可靠性与成本,让非技术开发者也能快速上手。

 

remio的护城河:用时间堆出来的“数字记忆”壁垒?

 

在Agent这条赛道上,remio并不是先发者。

 

国内,字节跳动旗下的扣子已经将Agent编排能力推向企业市场;海外,无数开源项目和商业产品,早已在Computer Use、Agent工作流领域深耕许久。但在汪源看来,这些产品都有一个核心缺陷:每次启动都从空白开始,它不知道用户是谁,不知道用户上周做了什么,更不知道用户的工作习惯和核心诉求。

 

而这,恰恰是remio的壁垒。

 

remio成立于2024年,早期以AI知识库产品切入市场,核心能力是把用户的网页、文档、会议录音、聊天消息等多源信息,统一汇入可被AI检索的个人知识库。这款产品上线后,曾拿下ProductHunt日榜第一,入选2025年度全球Top 30 AI产品。但汪源从一开始就意识到,知识库只是手段,而非终点——一个只能回答问题的AI,和一个能帮用户处理真实工作的AI,是两件完全不同的事。

 

过去一年半,remio持续在个人上下文工程上投入核心资源,而这也成了rOS核心的底座。不同于其他Agent产品需要用户手动上传信息、补充上下文,rOS里的所有aApp,都能直接调用用户经过结构化处理的全量数字记忆。这些信息不是零散的文件,而是已经被处理成大模型可直接消费的语义数据,PPT、Word、PDF等各类格式的文档都被提前解析完成,开发者无需再做额外的处理;配合实时的内容更新订阅能力,aApp能第一时间响应用户的工作变化。

 

“同一个aApp,在remio上它一来就认识你。”汪源说,“用得越久,积累越深厚,用户的迁移成本就越高。这是时间驱动的护城河,没有捷径。”

 

汪源随后进一步点明了remio和大厂产品的本质区别:数据主权牢牢交还给用户。“大厂永远都希望把用户的数据抓在自己手里,所以我们做了一年多,也没看到大厂跟进这个思路。”在他看来,大厂的产品逻辑,决定了他们不会做一款“装在用户PC里、碰不到用户数据”的强软件,这也给remio留下了2-3年的成长窗口,不用担心大厂下场做同质化竞争。

 

针对用户最关心的安全问题,remio也在rOS里做了双重底层保障。汪源解释,安全的核心无非两件事:一是数据不泄露,remio的所有数据都在用户本地完成处理,除了调用云端大模型API的必要内容之外,用户数据不会被任何第三方服务商获取;二是数据不丢失,remio用类似杀毒软件的核心原理,对Agent所有的文件读写、修改、删除行为进行拦截,实时备份文件的历史版本,用户可以一键还原所有操作,彻底解决了Agent误删、改坏重要文件的行业痛点。

 

在硬件适配与商业模式上,remio也给出了清晰的规划。硬件层面,目前rOS优先适配Mac系统,核心原因是所有Mac电脑都标配了算力强劲的NPU,能支撑端侧AI的高效运行;Windows版本将在下周推出,而Windows端NPU的全面普及还需要1-2年,remio也会持续做对应的优化。

 

商业模式上,remio走了一条“运营商式”的路径:平台统一和用户结算Token消耗费用,推出分级会员体系,所有aApp运行产生的Token成本,都由平台与用户统一结算,开发者无需承担任何相关费用。这就像移动互联网时代,用户和运营商统一结算流量费,而不是每个APP单独向用户收取流量费,极大降低了开发者的入局门槛,也让生态的正向循环成为可能。

 

目前,remio的核心用户集中在三类群体:泛管理者(创业公司创始人、企业高管、产品经理、项目经理)、产研团队,以及学生、老师与科研人员。这些用户的共性,是典型的知识工作者,时间高度稀缺,对工作提效有强需求,也是AI与Agent技术最先渗透的群体。而汪源判断,未来这个范围会持续扩大,最终绝大多数岗位,都会进入“不强依赖AI就无法工作”的阶段。

 

Agent的iPhone时刻

 

从2007年第一代iPhone发布,到2010年iPhone4引爆移动互联网,苹果用三年时间证明了一个道理:所谓的“iPhone时刻”,从来不是单点技术的突破,而是一套完整生态体系的胜利。

 

苹果从来没有发明触摸屏,也没有发明手机摄像头,但它把这些技术整合起来,用优秀的工业设计和系统能力,搭建起了一套适配移动终端的软硬件体系;更重要的是,它用App Store构建了一套正向循环的开发者生态,让开发者能赚钱,让用户能获得更好的体验,最终开启了移动互联网的黄金十年。

 

今天的AI行业不缺技术突破。大模型的能力早已跨过了可用的门槛,多模态理解、Computer Use、Agent规划能力都在快速迭代,我们能让AI写代码、做PPT、操作电脑,却始终没能让Agent真正走进普通知识工作者的日常。核心原因就在于,整个行业都在忙着优化“让AI模仿人操作旧软件”的能力,却没有人为Agent打造一个原生的新世界。

 

remio的rOS,没有去优化Agent操作旧软件的效率,而是重新定义了Agent时代的软件设计逻辑,给Agent原生应用提供了一个完整的运行底座;它不仅关注用户的单次任务体验,也试图构建一个“用户数据沉淀-应用体验升级-开发者生态繁荣”的长期飞轮。

 

汪源提到了一个行业变化:AI与Agent带来的,不只是单个岗位的效率提升,也是职场组织形态与岗位设置的全面重构。在他的团队里,已经不再是产品经理提需求、工程师做实现的传统模式,一个人同时要兼具产品思维与开发能力,只会接需求的程序员,正在被AI快速淘汰。

 

这恰恰印证了remio所做事情的长期价值:Agent时代的终局,不是让AI成为人类操作旧软件的“机械手”,而是让AI成为人类工作的“数字分身”,重构整个知识工作的生产方式。而这个终局的到来,必然需要一个能承载原生应用的操作系统底座。

 

当然,这条路注定充满挑战。生态的建立从来不是一蹴而就的,开发者的培育、用户习惯的养成、核心场景的持续挖掘,都需要长期的投入和验证。

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。