
Kimi发布并开源 K2.5 模型,带来全新视觉理解、代码和 Agent 集群能力
1月27日,国内人工智能初创公司月之暗面Kimi正式发布了新一代开源模型 Kimi K2.5 。作为Kimi目前最智能的模型,K2.5 在HLE(人类最后的考试)、BrowseComp、 DeepSearchQA等多项agent评测中均取得全球开源模型的最佳成绩 。

作为一个全能型模型,Kimi K2.5基于原生多模态架构设计,支持视觉与文本输入,将视觉理解与推理、编程、Agent等能力全部集成到一个模型当中。Kimi创始人、CEO杨植麟表示 “我们重构了强化学习的基建,并专门优化了训练算法,以确保它能达到极致的效率和性能。”
设计与审美驱动,AI编程进入视觉复现新阶段
在最能体现模型底层实力的代码编程领域,Kimi K2.5 实现了从“生成功能性代码”到“兼具设计审美”的飞跃 ,能够交付具备专业设计师级别的网页作品 ,进一步提升了开源模型的代码水平。尤其是在前端开发领域,K2.5 模型支持从简单的自然语言对话生成完整的前端界面,并能有效处理交互式布局及滚动触发等动态效果。
当用户想要调整界面时,只需在一张截图上圈出需要修改的地方,就像平时用鼠标指点一样简单。即便是不懂复杂工程提示词的普通用户,也能通过简单的指令完成从创意到产品的跨越,改变了以往AI编程模块化、同质化的局限 。
从单体到集群,Agent协作进化重塑任务上限
半年前,Kimi发布首个万亿参数开源模型Kimi K2,随后推出的 Kimi K2 Thinking,通过增加思考时间,具备了独立完成长达300步操作的长程任务能力。
但处理真实世界的复杂难题不能只靠单打独斗,还需要更多团队协作。在本次 Kimi K2.5的更新中,Kimi研发团队重构了强化学习基建,通过优化训练算法进行全新探索,推出Agent集群,让Agent从单兵突破进化成集群式作战。
在执行复杂任务时,K2.5不再是单一的“全能专家”,而是化身为一支即时组建的专业团队。它能根据任务需求,现场调度多达100个不同专业背景的“分身”,并行处理1500 个步骤,所有的角色分配与任务拆解无需预设,全由K2.5即时决策。
借助Agent集群,用户可以让一群“分析师”分头完成100家公司的市场调研,动员“语言专家团”翻译300 页文档,还能派出不同的“研究员”综述5篇跨专业的论文,让效率提升十倍以上。
全新Agent能力,解锁办公场景中的智能协作
Kimi K2.5 的 Agent 能力也全面扩展至办公场景 。多年来,用户一直在被迫学习办公软件的语言,背诵函数公式、学习如何做数据透视表、怎么做精美的PPT排版。而现在,Kimi K2.5通过对Word、Excel、PPT、PDF等常用办公软件的深度学习,熟练掌握了office软件的全部技能,用户只需通过自然语言下达简单指令,即可成为快速精通办公软件的专业用户,并实现不同格式间的自由转换。
不管是搭建复杂的财务模型,还是处理专业的PDF排版,或者制作一份咨询公司级别的PPT,以前需要好几天才能完成的任务,交给Kimi K2.5就可以在十几分钟内轻松完成。比如把数十个表格进行筛选合并,把3万字的论文变成一份精准的PPT,对一份PDF进行重新编辑排版,Kimi K2.5都能直接交付准专业水平的办公文档,大幅提升工作效率。
赋能开发者与企业,Kimi Code助力应用与创新
为进一步推动技术应用,Kimi K2.5还推出新的编程产品Kimi Code。Kimi Code不仅能够直接在终端运行,还能与VSCode、Cursor、Zed等主流编辑器无缝集成。借助K2.5的多模态优势,开发者可以直接输入图片和视频进行编程辅助,简化了编程流程,大大降低了技术门槛。
此外,Kimi还为企业和开发者提供开放平台,通过API接口调用K2.5模型的强大功能,助力各行各业提升工作效率和生产力。
以1%资源换取极致效率
就在K2.5模型发布的前几天,Kimi总裁张予彤在瑞士达沃斯举行的2026年世界经济论坛上,分享了Kimi在全球AI竞争格局中的技术突围之路。张予彤表示:“从创业第一天起公司就清醒地意识到,我们没有随意堆砌算力的条件,这迫使我们必须通过大量的基础研究创新来换取极致的效率。”
Kimi仅用美国顶尖实验室1%的资源,研发出全球领先的开源模型,甚至在部分性能上超越美国的顶尖闭源模型,这也是投入大量精力将工程化思维引入研究环节的结果,以确保所有算法创新都能在生产系统中大规模稳定运行。张予彤介绍,“Kimi是全球首个在大型语言模型训练中跑通Muon优化器的公司,自研的线性注意力机制(Kimi Linear)在处理速度上已显著超越传统的全注意力系统,实现效率的跨越式提升。”



