出厂自带 6 个 7×24 小时在线的 AI「牛马」团队。
5月20日,腾讯正式宣布旗下操作系统层级AI助手Marvis(马维斯)全量上线,用户可直接通过官网(marvis.qq.com)下载使用,无需邀请码。Windows、Mac、安卓三端同步开放,同时面向所有用户送上福利:每人每天可免费使用1000万Token,估计这个额度基本能覆盖大多数人日常办公、学习、娱乐的需求。
区别于传统的AI对话工具或单一应用层Agent,Marvis的核心定位是“操作系统层级”的个人助手。它搭建了一个打通终端系统、文件、应用、算力与跨端连接的AI中间层——用户不用再记复杂的设置入口、文件路径或软件操作步骤,只用一句话说明目标,Marvis就能自动理解需求、拆解执行步骤、调度对应Agent完成任务,并且会在涉及隐私、安全和支付的关键环节,主动将控制权交回给用户确认。
跨端协同是Marvis的另一大核心优势。它支持Windows、Mac、iOS、Android全平台同账号无缝互通,用户可以在手机上实时查看电脑桌面,远程接管鼠标键盘完成操作,即便电脑处于锁屏状态,也能通过手机解锁并继续执行任务。和市面上单纯的远程控制工具不同,Marvis提供的是接近原生桌面的实时可视化操控体验,更注重任务的连续性和完整性。
后续,Marvis还将上线iOS版本、接入更多第三方应用、扩展MCP生态、完善技能系统完善以及持续升级端侧模型能力。
系统级深度打通,让电脑成为可对话的智能体
当前主流AI助手的核心局限,在于它们始终站在操作系统之上。即便是微软最新的Copilot+,虽然深度集成在Windows 11中,但对第三方应用的支持依然有限,很多操作需要用户手动授权才能完成。而那些被业内称为“小龙虾”的独立Agent产品,更是只能通过模拟鼠标点击的方式操作应用,遇到弹窗、权限验证就容易卡住,稳定性难以保证。
Marvis 产品团队在受访时谈到,和这类产品的核心差异在于 “基因” 与 “落地路径”。Marvis 选择了 “自下而上” 的路径:先理解用户、设备、文件、应用、行为路径,再反推服务。团队从 2023 年就开始深耕文件解析、格式转换等底层工具,先打好地基,再构建 Agent 框架。
Marvis的突破,来自于它在芯片、操作系统和应用生态三层的协同布局。在操作系统层,它与微软达成官方战略合作,基于Microsoft Foundry on Windows平台和WinML推理框架,接入了系统级文件MCP服务。这意味着它不需要用户手动上传文件,就能直接扫描、读取和编辑本地磁盘上的所有文档、表格和图片。
我试了一下让它帮我找一下之前存的发型设计的图片,它很快就完成了检索,从众多的图片中找到了相关的图片。

图片来源:极客公园
在芯片层,Marvis与Intel基于OpenVINO做了芯片级的运算优化,整体模型推理性能提升20%以上。在搭载NPU的AIPC上,中小尺寸模型的推理速度相比传统CPU能提升2-10倍,这让纯本地运行复杂任务成为可能。同时,它还做了大量设备兼容工作,最低仅需 8 核 CPU、16GB 内存和固态硬盘即可使用效率模式。
还有应用宝的技术沉淀。Marvis不仅能操作电脑上的EXE软件,还能直接在电脑上运行和操控手机APP。目前正式版已经支持同花顺、飞常准、汽车之家、唯品会等主流应用,后续还会扩展更多合作伙伴。
出于合规和安全考虑,Marvis 不支持任何涉及资金划转的自动交易操作,但对于查询行情、整理财报数据等辅助工作,可以提供高效支持。
预置多Agent团队
多Agent协作是2026年AI行业最火热的技术方向,但大多数Agent产品大多需要用户前期自行搭建工作流或配置skills技能。
Marvis尝试解决这个门槛问题。它出厂就预置了6个7×24小时在线的AI Agent,分别负责项目统筹、文件管理、系统运维、应用操作、网页交互和信息搜索。主Agent会自动拆解你的复杂指令,根据任务类型分配给对应的子Agent并行执行。用户可以同时让它整理上百张发票、优化电脑开机启动项,所有任务互不干扰,同步推进。整个过程不需要任何配置,安装完成就能直接使用。
由于最近我的电脑内存告急,但又暂时不想换电脑,就让Marvis查看了一下现在的存储空间并给出建议。可以看到,Marvis首先调用Computer Agent诊断出电脑存储空间告急,接着触发Browser Agent去电商平台查1TB存储卡的参数和价格,生成SD卡、TF卡不同档次的对比清单,最后结合性能和预算给出选购建议,把“看存储、买存储卡”这个需求拆解成了自动执行的闭环任务。
视频来源:极客公园
数据安全是所有AI用户最关心的问题。Gartner的数据显示,到2026年底将有超过40%的知识工作者优先使用本地AI工具,而非仅依赖云端平台。但目前的本地部署方案,比如Ollama、LM Studio,都需要用户具备一定的技术能力,而且只能提供基础的对话和代码生成功能。
Marvis 采取了云端与本地分层的模型策略:效率模式下,复杂问题的理解与规划在云端完成,采用混元和 DeepSeek V4 等最新顶尖模型,所有执行操作全部留在本地;隐私模式下,所有数据处理、指令响应和计算过程都在本地设备上进行,采用 Qwen 端侧模型。

开启隐私模式后,无论是文档解析、图片识别还是对话,全部在本地运行,拔掉网线也能正常使用,确保敏感数据物理隔离。针对用户担心的数据滥用问题,产品负责人表示,无论哪种模式,所有用户数据都不会被用于模型训练,真正做到 “数据不出域”。
为了防止 AI 误操作,Marvis 建立了 L2 级安全兜底机制。凡是涉及批量删除文件、修改系统核心配置等敏感操作,系统会强制弹出 “硬垂询” 确认框,列出所有即将执行的步骤和影响,必须用户本人点击同意后才能执行。而支付、资金划转等最高敏感级别的动作,Marvis 会直接拒绝自动执行,完全交由用户本人完成。
在图片隐私方面,首次使用时,用户可以自定义 Marvis 的索引范围,默认推荐目录可随时修改。在生成的文件图谱中,如果发现不希望被索引的图片,可以右键屏蔽。此外,Marvis 的端侧模型已针对极敏感图片做了基础过滤。
取消邀请码,三端全量开放
传统的远程控制工具,本质上只是把电脑的屏幕搬到了手机上。用户依然需要像操作自己的电脑一样,一步步点击鼠标和键盘,并没有真正解放双手。而市面上的AI远控产品,大多只能执行预设好的简单任务,一旦遇到需要复杂判断的场景大多会失效。
Marvis的跨端能力,是把整个操作系统级的AI能力,完整延伸到了用户的手机上。用户可以通过安卓手机实时查看电脑的桌面画面,用自然语言下达指令,让Marvis在电脑上完成任务。哪怕电脑处于锁屏状态,甚至断网断电,它也能自动切换到云电脑模式,继续执行大部分操作。

这次正式上线,Marvis最大的诚意之一在于普惠。它取消了邀请码制度,三端全量开放,每人每天提供1000万免费Token。对于绝大多数普通用户来说,这个额度完全足够日常使用。
关于未来的商业模式,产品负责人谈到,长期完全免费不现实,但会坚持普惠原则。未来会提供基础用量配额,并支持用户自带 API Key,同时通过大力优化端侧模型,将大部分常规操作消化在本地,从而大幅降低用户的云端 Token 消耗成本。此外,Marvis 还计划后续接入更多优秀的开源模型,供用户根据自己的需求选择。
过去几年,个人AI助手的竞争一直在比拼谁的大模型参数更大,谁的对话更流畅。但用户真正需要的,是能帮他们分担重复劳动、解决实际问题的工具。
不过,作为一款刚正式上线的产品,Marvis 还有很多需要完善的地方。Mac 版本的能力与 Windows 版本还有差距,视频内容的深度理解功能还在规划中,目前仅支持基于文件名的检索和轻量级处理,第三方应用的支持范围也需要进一步扩大。



