
近日,全灵人工智能团队在其官网以及海外社交媒体等渠道发布了首个多模态游戏大模型 SEELE LMM——用户不需要借助复杂的建模工具或脚本语言,仅需通过一句话的简单指令,即可生成可交互的 3D 游戏内容,包含角色、场景、动作、声音、玩法。
近日,全灵人工智能团队在其官网以及海外社交媒体等渠道发布了首个多模态游戏大模型 SEELE LMM——用户不需要借助复杂的建模工具或脚本语言,仅需通过一句话的简单指令,即可生成可交互的 3D 游戏内容,包含角色、场景、动作、声音、玩法。
模型上线后,迅速在海外社媒与开发社区中引发广泛讨论。相关视频获得大量转发与评论,包括游戏开发者、内容创作者在内的许多用户,都对 SEELE LMM 产生了极大的兴趣。无数用户在评论区咨询生成能力与使用方式,「围绕 AI 生成游戏内容」等话题展开讨论。
|
|
区别于传统的「沙盒游戏」与 AI 领域中「世界模型」,SEELE 不依赖预定义的资源、规则与输入信号,支持通过自然语言驱动直接生成 3D 游戏内容。在创作与游戏过程中,用户可持续输入指令与系统实时交互,实现「边玩边创作」的游戏体验。
SEELE LMM 整合了多模态模块,搭建了统一的游戏多模态模型架构,能够根据文本、图片、dynamic 3D scenes 等多种输入模态,生成语音、模型、交互、gameplay 等多种模态响应。全面覆盖游戏场景中的理解、生成、工具调用等核心任务,实现一体化、从零生成。
SEELE LMM 具备连续多模态上下文处理的能力,支持创作与游戏过程中持续的 remix 交互,用户可动态编辑与调整游戏内容。这重新定义了游戏的创作方式,打破了创作与消费的边界——用户既是玩家,也是内容创作者。
SEELE 构建了包含 10M+多模态 instruction-response pairs 的交互式数据集,并将 GRPO 范式成功迁移到多模态领域,提升了模型的推理能力。
目前市面上的 AI 游戏模型多聚焦于角色、对话等局部生成,或概念视频的展示,没有实现真正可玩的 AI 游戏大模型。而 SEELE 是首个实现从自然语言 prompt 到可交互 3D 内容的游戏大模型,将用户的想象力编译为游戏内容。
未来除了传统的高成本大作,像《黑神话》《博德之门》这样的作品依旧存在,更多碎片化、轻量级的游戏将不断涌现。普通人的想象力,正在被持续释放。
来源:互联网