权威大模型榜单：阿里千问3.7全球第五、国产第一

5 月 21 日消息，三方机构 Artificial Analysis 公布了最新的全球大模型榜单，阿里新发布的旗舰模型 Qwen3.7-Max 得分 56.6 分，超过了 Kimi-K2.6、DeepSeek-v4-Pro-Max、GLM5.1 等所有国产模型，性能接近 GPT、Claude、Gemini 的最强模型，位列全球第五、国产第一。据了解，Qwen3.7-Max 即将上线阿里云百炼对外提供 API 服务。

图说：Artificial Analysis 官网截图显示，Qwen3.7-Max 位列全球第五、国产第一

Artificial Analysis 是一个独立的 AI 大模型评测与分析平台，它对全球大模型进行多维度的基准测试和性能评估，形成系统性的大模型智能水平综合排名，因此该榜单也被业内公认为是最具影响力、含金量最高的大模型三方榜单之一。阿里千问大模型曾多次登上 Artificial Analysis 榜单前沿，1 个月前发布的 Qwen3.6-Max-Preview，就曾创下国产模型性能最佳。

如今，这一成绩再度被千问自身超越。在 5 月 20 日晚公布的最新一期 Artificial Analysis 大模型总榜中，Qwen3.7-Max 得分 56.6，较上代旗舰模型进步 4.8 分，逼近 GPT-5.4（xhigh）、Gemini3.1 Pro Preview、Claude-Opus4.7（max），在总榜的所有模型中排名第五，稳居国产模型第一。

据了解，Qwen3.7-Max 为 Agent 智能体而创新设计，实现了编程、智能体、推理等核心能力的大幅突破。千问 3.7 可与 Claude Code、OpenClaw、Hermes Agent、Qwen Code 等各类 Agent 框架完美协同，通过自主编程和 Agent 工具调用，可独立完成 35 小时、超 1000 次工具调用的复杂长程任务，交付令人惊艳的生产级成果，可完美胜任企业级的复杂任务。

最新文章