Agent AI 和物理 AI 同时爆发，阿里用一款芯片押注两个战场

3 月 24 日，达摩院在上海发布了玄铁 C950，单核 SPECint2006 突破 70 分，刷新全球 RISC-V CPU 性能纪录。

相比性能参数，更值得关注的是，这枚芯片首次在单颗 CPU 上跑通了 DeepSeek V3 671B 全量大模型推理，Qwen3 30B 可达 80 tokens/秒——这是 RISC-V 阵营第一次真正意义上进入顶级 AI 算力的朋友圈。

玄铁从 2019 年第一款产品 C910 至今走了整整 7 年，从嵌入式边缘一路打到高性能服务器级。而对于 RISC-V 而言，今天正在处于难得的发展窗口期——Agent AI 让推理需求重新回流到 CPU，物理 AI 让定制化芯片成为刚需，而这两件事恰好是 RISC-V 架构最擅长的部分。

但跑分只是起点。玄铁要真正立住，还有不少挑战需要面对。

玄铁 C950 是什么？它到底有多强

玄铁 C950 是达摩院基于 RISC-V 开源架构打造的新一代旗舰 CPU，历时两年研发。从架构参数看，这是一款颇具野心的产品：16 级流水线，指令窗口超过 1000 个，5 纳米工艺下主频 3.25GHz，单位性能 22 分/GHz。

数字说起来抽象，对照系一下：在 SPECint2006 这个 CPU 界公认的基准测试里，玄铁 C950 单核突破 70 分，不仅是当前全球性能最强的 RISC-V CPU，与业界现有主流高性能 CPU 产品相比也已处于同一量级。相比上一代玄铁 C930，整体性能提升了 3 倍。

但 C950 真正让人眼前一亮的地方，不只是通用算力，而是它和 AI 的深度融合方式。

达摩院这次在 RISC-V 架构上拓展了两个自研 AI 加速引擎——Vector 引擎和 Matrix 引擎，关键是采用了统一寻址设计。这和传统 NPU 最大的区别在于：计算过程中不需要频繁的内存拷贝，能大幅提升整体效率。Matrix 引擎兼容 FP8、FP4 在内的 11 种新型数据类型，理论算力利用率可达 90%——这个数字在 AI 加速领域相当难得。

实测推理能力同样惊艳：Qwen3 30B 模型可跑到 80 tokens/秒；Qwen2.5 235B 可跑到 34 tokens/秒；更重磅的是 DeepSeek V3 671B 全量大模型，在单芯片上跑到了 18 tokens/秒——这是 DeepSeek 671B 全量模型首次在单芯片上完成推理的案例。换句话说，C950 实现了在一颗 CPU 上原生运行千亿参数大模型，这在 RISC-V 阵营此前从未有过。

与 C950 同台发布的还有 C925——这是针对玄铁 C930 优化裁剪的版本，SPECint2006 达到 12 分/GHz，相比 C930 能效提升 11%，功耗降低 30%。两款产品构成了达摩院从高性能到高能效的完整旗舰矩阵。

从技术完整性来看，玄铁 C950 在 RISC-V 阵营内已经建立了明显的领先身位。但要说全面追平 X86 和 ARM 的顶级产品，还言之过早——后者在通用性能上积累了数十年，差距不是一款产品能一步抹平的。C950 真正的意义，更在于它证明了 RISC-V 有资格进入高性能计算的讨论，而不是继续被限定在低功耗芯片的定位。

这枚芯片，出现在一个微妙的历史窗口

要理解 C950 的意义，得先理解玄铁走过的路。

2019 年，阿里在上海发布了玄铁第一款产品——C910，彼时号称全球最高性能的 RISC-V CPU。那是一个敢想敢干的年代，达摩院用一款芯片向外界宣告：RISC-V 不只是学术玩具，可以进入真实产业。

此后几年，玄铁陆续推出 10 余款 CPU 产品，覆盖嵌入式到服务器，落地近千款终端产品，触达服务器、机器人、新能源汽车、AI 智能终端、存储控制器等诸多场景。合作伙伴超过 400 家，250 多款芯片正在量产。这是一个逐步扩张的过程，RISC-V 阵营正在从产业边缘向主流迈进。

去年，玄铁迈出了一个更重要的步子：发布了首款 RISC-V 服务器芯片 IP C930，正式向高性能计算领域进军。那是一个信号弹，宣告 RISC-V 准备打高端市场。今年的 C950，是这个方向的全力冲刺。

这个时间节点的选择，有着极强的产业逻辑。

第一，AI Agent 的崛起，正在重写对 CPU 的需求定义。

过去几年，算力竞争的焦点是 GPU 和大模型训练。但随着 Agent AI 进入主流视野，一个微妙的变化正在发生：越来越多的推理任务和复杂调度开始重新回流到 CPU 上。推理、多任务并行、上下文管理……这些都是 CPU 的主场。这一轮需求爆发，给了高性能 CPU 一个重新证明自己的机会窗口。

第二，物理 AI 的爆发，给 RISC-V 带来了差异化生态位。

人形机器人、工业机器人、具身智能——这些物理 AI 场景对芯片的要求跟云端截然不同：需要低延时、低功耗、高可靠，还需要高度定制化。这些恰恰是 RISC-V 架构作为后来者最具优势的地方。RISC-V 的可扩展性允许芯片厂商在标准架构基础上灵活增减指令集，针对特定物理场景深度定制，而不是被迫使用一个为别的场景优化的通用方案。

达摩院的数据印证了这个趋势：过去一年，玄铁分析了 35 家客户提出的 38 项定制改动需求，其中 50% 是客户基于应用场景提出的定制化优化——这说明市场对"定制化高性能 RISC-V"的真实需求正在加速释放。

最后 RISC-V 的全球格局也在改变。发布会上引用的一个数据颇为震撼：2026 年 1 月，RISC-V 已正式占据全球处理器市场的 20%，标志着 X86 和 ARM 长期把持的双寡头格局正式出现裂缝。中国在 RISC-V 赛道上押注颇早，产业政策层面的持续加码正在加速生态成型。

当然，玄铁面对的挑战同样真实。高性能 CPU 领域，X86 的主频优势、ARM 的单位性能效率，都是经过几十年沉淀的护城河。软件生态的碎片化是 RISC-V 始终绕不开的痛点——达摩院自己也承认，在 Java 等关键应用栈上，相比主流生态还有 50% 的性能差距需要弥补。这条路，还有很长要走。

但 C950 给出的信号足够清晰：玄铁不满足于在嵌入式和低功耗市场做"够用就好"的方案，它在主动向上攀爬，去争夺云计算、高性能 AI 推理和物理 AI 控制器这些真正意义重大的战场。

这次发布会还透露了一个关键动作：达摩院与北京开源芯片研究院（开芯院）和中国科学院软件研究所签署了战略合作协议，三方联手推进 RISC-V 高性能技术与产业生态。香山开源 CPU 核 + 玄铁商业 IP + 中科院软件所如意社区操作系统，这个组合的野心，是在 AI 时代复刻一套 RISC-V 版本的"芯片 + 操作系统"基础底座。

包云岗在发布会上打了个比方：香山之于 RISC-V，就像 Linux 之于操作系统；玄铁就像 RedHat，是商业化的发行版。这套开源+商业双轮驱动的生态路线，和过去互联网操作系统生态的演化路径高度相似。

在 AI 重构一切的时代，芯片架构的竞争从来不只是性能跑分的游戏。玄铁 C950 刷新全球纪录是一个起点，真正的考验是：这个数字能不能转化为云端推理的订单、机器人控制器的出货量、以及一个能吸引更多开发者生态落地的基础平台。

答案，还在路上。

玄铁 C950 是什么？它到底有多强

这枚芯片，出现在一个微妙的历史窗口

最新文章