
5 月 21 日消息,三方机构 Artificial Analysis 公布了最新的全球大模型榜单,阿里新发布的旗舰模型 Qwen3.7-Max 得分 56.6 分。
5 月 21 日消息,三方机构 Artificial Analysis 公布了最新的全球大模型榜单,阿里新发布的旗舰模型 Qwen3.7-Max 得分 56.6 分,超过了 Kimi-K2.6、DeepSeek-v4-Pro-Max、GLM5.1 等所有国产模型,性能接近 GPT、Claude、Gemini 的最强模型,位列全球第五、国产第一。据了解,Qwen3.7-Max 即将上线阿里云百炼对外提供 API 服务。

图说:Artificial Analysis 官网截图显示,Qwen3.7-Max 位列全球第五、国产第一
Artificial Analysis 是一个独立的 AI 大模型评测与分析平台,它对全球大模型进行多维度的基准测试和性能评估,形成系统性的大模型智能水平综合排名,因此该榜单也被业内公认为是最具影响力、含金量最高的大模型三方榜单之一。阿里千问大模型曾多次登上 Artificial Analysis 榜单前沿,1 个月前发布的 Qwen3.6-Max-Preview,就曾创下国产模型性能最佳。
如今,这一成绩再度被千问自身超越。在 5 月 20 日晚公布的最新一期 Artificial Analysis 大模型总榜中,Qwen3.7-Max 得分 56.6,较上代旗舰模型进步 4.8 分,逼近 GPT-5.4(xhigh)、Gemini3.1 Pro Preview、Claude-Opus4.7(max),在总榜的所有模型中排名第五,稳居国产模型第一。
据了解,Qwen3.7-Max 为 Agent 智能体而创新设计,实现了编程、智能体、推理等核心能力的大幅突破。千问 3.7 可与 Claude Code、OpenClaw、Hermes Agent、Qwen Code 等各类 Agent 框架完美协同,通过自主编程和 Agent 工具调用,可独立完成 35 小时、超 1000 次工具调用的复杂长程任务,交付令人惊艳的生产级成果,可完美胜任企业级的复杂任务。



