
3月24日,达摩院发布了玄铁C950,这枚芯片首次在单颗CPU上跑通了 DeepSeek V3 671B全量大模型推理
3 月 24 日,达摩院在上海发布了玄铁 C950,单核 SPECint2006 突破 70 分,刷新全球 RISC-V CPU 性能纪录。
相比性能参数,更值得关注的是,这枚芯片首次在单颗 CPU 上跑通了 DeepSeek V3 671B 全量大模型推理,Qwen3 30B 可达 80 tokens/秒——这是 RISC-V 阵营第一次真正意义上进入顶级 AI 算力的朋友圈。
玄铁从 2019 年第一款产品 C910 至今走了整整 7 年,从嵌入式边缘一路打到高性能服务器级。而对于 RISC-V 而言,今天正在处于难得的发展窗口期——Agent AI 让推理需求重新回流到 CPU,物理 AI 让定制化芯片成为刚需,而这两件事恰好是 RISC-V 架构最擅长的部分。
但跑分只是起点。玄铁要真正立住,还有不少挑战需要面对。
玄铁 C950 是什么?它到底有多强
玄铁 C950 是达摩院基于 RISC-V 开源架构打造的新一代旗舰 CPU,历时两年研发。从架构参数看,这是一款颇具野心的产品:16 级流水线,指令窗口超过 1000 个,5 纳米工艺下主频 3.25GHz,单位性能 22 分/GHz。
数字说起来抽象,对照系一下:在 SPECint2006 这个 CPU 界公认的基准测试里,玄铁 C950 单核突破 70 分,不仅是当前全球性能最强的 RISC-V CPU,与业界现有主流高性能 CPU 产品相比也已处于同一量级。相比上一代玄铁 C930,整体性能提升了 3 倍。

但 C950 真正让人眼前一亮的地方,不只是通用算力,而是它和 AI 的深度融合方式。
达摩院这次在 RISC-V 架构上拓展了两个自研 AI 加速引擎——Vector 引擎和 Matrix 引擎,关键是采用了统一寻址设计。这和传统 NPU 最大的区别在于:计算过程中不需要频繁的内存拷贝,能大幅提升整体效率。Matrix 引擎兼容 FP8、FP4 在内的 11 种新型数据类型,理论算力利用率可达 90%——这个数字在 AI 加速领域相当难得。
实测推理能力同样惊艳:Qwen3 30B 模型可跑到 80 tokens/秒;Qwen2.5 235B 可跑到 34 tokens/秒;更重磅的是 DeepSeek V3 671B 全量大模型,在单芯片上跑到了 18 tokens/秒——这是 DeepSeek 671B 全量模型首次在单芯片上完成推理的案例。换句话说,C950 实现了在一颗 CPU 上原生运行千亿参数大模型,这在 RISC-V 阵营此前从未有过。
与 C950 同台发布的还有 C925——这是针对玄铁 C930 优化裁剪的版本,SPECint2006 达到 12 分/GHz,相比 C930 能效提升 11%,功耗降低 30%。两款产品构成了达摩院从高性能到高能效的完整旗舰矩阵。
从技术完整性来看,玄铁 C950 在 RISC-V 阵营内已经建立了明显的领先身位。但要说全面追平 X86 和 ARM 的顶级产品,还言之过早——后者在通用性能上积累了数十年,差距不是一款产品能一步抹平的。C950 真正的意义,更在于它证明了 RISC-V 有资格进入高性能计算的讨论,而不是继续被限定在低功耗芯片的定位。
这枚芯片,出现在一个微妙的历史窗口
要理解 C950 的意义,得先理解玄铁走过的路。
2019 年,阿里在上海发布了玄铁第一款产品——C910,彼时号称全球最高性能的 RISC-V CPU。那是一个敢想敢干的年代,达摩院用一款芯片向外界宣告:RISC-V 不只是学术玩具,可以进入真实产业。
此后几年,玄铁陆续推出 10 余款 CPU 产品,覆盖嵌入式到服务器,落地近千款终端产品,触达服务器、机器人、新能源汽车、AI 智能终端、存储控制器等诸多场景。合作伙伴超过 400 家,250 多款芯片正在量产。这是一个逐步扩张的过程,RISC-V 阵营正在从产业边缘向主流迈进。
去年,玄铁迈出了一个更重要的步子:发布了首款 RISC-V 服务器芯片 IP C930,正式向高性能计算领域进军。那是一个信号弹,宣告 RISC-V 准备打高端市场。今年的 C950,是这个方向的全力冲刺。
这个时间节点的选择,有着极强的产业逻辑。
第一,AI Agent 的崛起,正在重写对 CPU 的需求定义。
过去几年,算力竞争的焦点是 GPU 和大模型训练。但随着 Agent AI 进入主流视野,一个微妙的变化正在发生:越来越多的推理任务和复杂调度开始重新回流到 CPU 上。推理、多任务并行、上下文管理……这些都是 CPU 的主场。这一轮需求爆发,给了高性能 CPU 一个重新证明自己的机会窗口。
第二,物理 AI 的爆发,给 RISC-V 带来了差异化生态位。
人形机器人、工业机器人、具身智能——这些物理 AI 场景对芯片的要求跟云端截然不同:需要低延时、低功耗、高可靠,还需要高度定制化。这些恰恰是 RISC-V 架构作为后来者最具优势的地方。RISC-V 的可扩展性允许芯片厂商在标准架构基础上灵活增减指令集,针对特定物理场景深度定制,而不是被迫使用一个为别的场景优化的通用方案。
达摩院的数据印证了这个趋势:过去一年,玄铁分析了 35 家客户提出的 38 项定制改动需求,其中 50% 是客户基于应用场景提出的定制化优化——这说明市场对"定制化高性能 RISC-V"的真实需求正在加速释放。
最后 RISC-V 的全球格局也在改变。 发布会上引用的一个数据颇为震撼:2026 年 1 月,RISC-V 已正式占据全球处理器市场的 20%,标志着 X86 和 ARM 长期把持的双寡头格局正式出现裂缝。中国在 RISC-V 赛道上押注颇早,产业政策层面的持续加码正在加速生态成型。
当然,玄铁面对的挑战同样真实。高性能 CPU 领域,X86 的主频优势、ARM 的单位性能效率,都是经过几十年沉淀的护城河。软件生态的碎片化是 RISC-V 始终绕不开的痛点——达摩院自己也承认,在 Java 等关键应用栈上,相比主流生态还有 50% 的性能差距需要弥补。这条路,还有很长要走。
但 C950 给出的信号足够清晰:玄铁不满足于在嵌入式和低功耗市场做"够用就好"的方案,它在主动向上攀爬,去争夺云计算、高性能 AI 推理和物理 AI 控制器这些真正意义重大的战场。
这次发布会还透露了一个关键动作:达摩院与北京开源芯片研究院(开芯院)和中国科学院软件研究所签署了战略合作协议,三方联手推进 RISC-V 高性能技术与产业生态。香山开源 CPU 核 + 玄铁商业 IP + 中科院软件所如意社区操作系统,这个组合的野心,是在 AI 时代复刻一套 RISC-V 版本的"芯片 + 操作系统"基础底座。
包云岗在发布会上打了个比方:香山之于 RISC-V,就像 Linux 之于操作系统;玄铁就像 RedHat,是商业化的发行版。这套开源+商业双轮驱动的生态路线,和过去互联网操作系统生态的演化路径高度相似。
在 AI 重构一切的时代,芯片架构的竞争从来不只是性能跑分的游戏。玄铁 C950 刷新全球纪录是一个起点,真正的考验是:这个数字能不能转化为云端推理的订单、机器人控制器的出货量、以及一个能吸引更多开发者生态落地的基础平台。
答案,还在路上。



