高达 256GB/s 带宽+160 TFLOPS 算力,安谋科技「周易」X3 NPU IP R2 升级

摘要

​近日,在安谋科技 Tech Talk AI 技术开放麦第二期活动中,NPU 高级产品经理 Benjamin Ye 围绕「周易」X3 NPU IP R2 版本升级进行了主题分享。

​近日,在安谋科技 Tech Talk AI 技术开放麦第二期活动中,NPU 高级产品经理 Benjamin Ye 围绕「周易」X3 NPU IP R2 版本升级进行了主题分享,详细介绍了 R2 版本在算力与算力密度方面的显著提升,并结合「周易」X3 智能座舱、AI 推理加速芯片及新兴市场等多个领域的落地案例,系统展示了「周易」X3 系列 NPU 的最新进展与广泛应用。

1、最高算力翻倍、算力密度提升超 70%

据 Benjamin Ye 介绍,「周易」X3 R2 版本相较 R1 最高算力翻倍,针对 W4A8、W4A16 主流大模型量化精度进行性能优化,单 Cluster 算力从 8-80 TFLOPS 提升至 8-160 TFLOPS,部署更流畅、响应延迟更低。算力密度方面,提升超 70%,相同面积下有效算力更强,或同等算力下芯片面积更小,帮助 SoC 厂商降低成本、提升产品竞争力。

2、多场景成功落地

据 Benjamin Ye 介绍,「周易」X3 R1/R2 系列 NPU IP 已在多领域落地。

在智能座舱领域,支持个性化智能助手、多模态感知、DMS/OMS 及自动泊车等,提供低延迟、高流畅的驾乘体验。

在 AI 推理加速芯片领域,赋能本地及轻量服务器端 Agent 应用,支持多模态理解与高吞吐推理。

在新兴市场领域,兼顾传统视觉任务与小语言模型,适配智能家庭中枢、个人助手、便携式工作站等终端设备。

3、一键部署、开箱即用支持灵活定制

据 Benjamin Ye 介绍,「周易」X3 R2 延续了 R1 通用、灵活、高效及软硬协同优势,采用 DSP+DSA 架构,兼顾 CNN 与 Transformer 模型。

硬件上,单 Core 带宽 256GB/s,集成 WDC 无损解压引擎、AIFF 专属硬件单元及硬化任务调度器等单元,大幅提升算力效率并降低 CPU 负载。

软件上,「周易」X3 R2 配套的 Compass AI 平台可实现一键部署、开箱即用,原生支持 Hugging Face 及主流框架,深度优化大模型推理,并支持客户定制化,降低部署门槛与成本。

面向未来,在安谋科技「All in AI」战略下,「周易」NPU 将持续升级计算架构、数据格式、开放生态,以技术创新为锚、开放生态为纽带,为边端侧 AI 注入核心动力,携手伙伴共赴智能计算新时代。

来源:互联网

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。