
From 锦秋基金

锦秋基金观点:
下一代智能系统,不再只是回答问题的模型,而是能在目标设定后自主完成感知、决策、执行全链条的系统。
锦秋看到的四层“系统级机会”
-
下一代算力:决定智能的上限和成本 -
智能硬件:AI进入物理世界的第一个接触点 -
具身智能:让机器真正"做"的关键 -
AI应用:在真实场景里形成商业闭环

我们想知道【👀在你眼里,锦秋是什么样子?】
邀请你花3分钟,扫码填写问卷,用6个直觉回答,帮助我们更好的认识大家眼中的锦秋,也帮助我们找到继续成长与进化的方向。

2026年围绕AI的总投入规模已经超过1万亿美元
时间进入到2026年,从主要云厂商的资本开支、各国AI专项投入、以及企业侧基础设施升级来看,围绕AI的总投入规模已经超过1万亿美元。
Gartner预测2026年全球包含硬件、软件、IT运维等在内的AI支出总额将达到2.52万亿美元,同比增长44%。

讨论这1万亿美元的账单为什么重要?

-
1万亿美元≈ 全球第 17名国家的GDP -
1万亿美元 ≈ 2.4 × Apple(年营收) ≈ 2.5 × Alphabet ≈ 7.3 × Alibaba ≈ 15 × Xiaomi ≈ 19 × Meituan -
1万亿 = 互联网泡沫时期全球电信投资的两倍(约5000亿) -
1万亿 ÷ 全球知识工作者10亿人 = 每人1000美元 -
1万亿 ≈ 全球教育总支出的17% ≈ 美国单独一个国家的教育支出




1万亿美元账单,目前市场有三种叙事
-
叙事一(乐观派):在买未来的生产力飞跃,就像当年的电网建设,先亏后赚。 -
叙事二(悲观派):在买一场泡沫。 -
叙事三(结构派):在买一场财富转移,从劳动力转移到资本,从中小企业转移到超大平台。

锦秋基金观点
-
这1万亿美元,本质上是在买一场"智力的工业化"。我们看好“下一代智能系统”。 -
历史上每一次生产要素的工业化,都重写了经济的分配规则。“下一代智能系统”代表着巨大的资本机会。 -
当下,一切都在变化中,都未定型。因此,投资“下一代智能系统”是最好的时间点。


什么叫"工业化"
历史上每一次工业化,都有三个共同特征。
-
第一,把原来稀缺的东西变成充裕的东西。 -
第二,把原来依赖个人技艺的东西,变成可以标准化复制的流程。 -
第三,工业化会创造一个新的生产要素瓶颈。

为什么是“智力工业化”
-
“认知劳动”被工业化 -
稀缺的东西正在变得充裕:专家级的认知能力 -
依赖个人技艺的东西正在被标准化:专家智力 -
新的生产要素瓶颈正在形成:算力、电力、高质量数据等


下一代智能系统
它分两个阶段:第一阶段是让机器会'想'——这已经发生了,这是过去两年的故事。第二阶段是让机器会'做'——这正在发生,这是接下来五年的故事。
-
上一代AI:智力在云端,结果在屏幕。 -
下一代智能系统:智力在系统里,行动在现实中。


为什么"下一代智能系统"在2026年变得关键





这1万亿美元的落地,价值对象主要在中美
-
美国:全球服务业最大的生产国(27%) -
中国:全球最大的制造场景(占全球28%)、最复杂的供应链网络(占全球出口16%)、增长最快的消费市场(贡献全球消费增长的四分之一)





中美:同一场智力工业化,两条不同的智能系统
-
美国的"智力工业化",路从服务业出发,向上集中,少数几个超大平台(OpenAI、微软、谷歌)控制模型和接口,企业通过API调用智能,价值向顶端聚集。 -
中国的"智力工业化",从"模型突破"向"系统落地"的关键转折点,大量真正有产业价值的公司还没有被充分定价。



新的拐点
-
需求结构的变化,正在重写算力市场的竞争格局。 -
过去三年,算力投资的逻辑只有一条主线:训练更大的模型,买更多的GPU。 -
但2026年之后,AI正式进入"系统落地阶段"。推理开始成为算力消耗的主要场景。




截至2025年底,中国企业合计拥有近年来售出的领先AI芯片累计算力的5%多一点——低于任何一家美国顶级超大规模数据中心运营商,而且这一份额还在逐年下降。

新的机会

现有GPU架构,是为大规模并行训练设计的。但在推理主导的新时代,它正在遇到两堵结构性的墙
-
第一堵是存储墙 -
第二堵是功耗墙
在推理密集、功耗敏感、延迟苛刻的场景里,新的计算架构已经拥有了真实的替代空间。
-
近存计算把计算单元移到存储旁边,从根本上缩短数据搬运的距离; -
存算一体在同一块硅片上融合存储与计算,有助于消除搬运损耗; -
光计算用光子代替电子,理论功耗比电子计算低一到两个数量级。
美国出口管制客观上为中国本土替代架构的成熟创造了受保护的窗口期




Nvidia 数据中心/AI产品线单卡功耗已从300W上升至1000W

Nvidia 机柜功耗已上升至120KW

全球数据中心耗电量已占到全球用电量的 1.5%

PUE 已接近极限,真正约束开始转向可获得电力、冷却与站点时间窗口

-
近存计算把计算单元移到存储旁边,从根本上缩短数据搬运的距离; -
存算一体在同一块硅片上融合存储与计算,彻底消除搬运损耗; -
光计算用光子代替电子,理论功耗比电子计算低一到两个数量级。
这些不是GPU的改良版,是对底层计算范式的重新定义。








锦秋的布局
-
解决核心瓶颈——高端存储 -
新计算架构——针对存储墙问题的根本性解法,近存计算、存算一体方向、光计算方向 -
系统互联与先进封装——针对功耗墙和集群效率问题的关键支撑。


新的拐点
-
端侧AI芯片性能在过去两年实现跃升,主流旗舰SoC的NPU算力已具备本地运行十亿参数级模型的能力,"云端推理"向"端侧推理"的迁移拐点正在形成 -
Apple、Meta、三星等头部厂商相继将AI能力作为硬件产品的核心卖点,AI眼镜、AI耳机、AI手机的出货量在2024年开始出现结构性增长,新品类的市场教育成本显著下降; -
国内消费电子供应链在模组集成、快速量产、成本控制上的系统性优势,正在为新品类公司提供前所未有的低摩擦创业窗口。


AI正在从消费电子的可选功能变成出货量的主驱动力。
根据IDC数据,GenAI智能手机的全球出货量从2024年的2.34亿部(市场占比18-19%)增长至2025年的3.7亿部(占比30%),预计2028年将达到9.12亿部(占比超过70%)。

注:本表的“AI手机”采用IDC公开GenAI smartphone定义(端侧GenAI、NPU≥30 TOPS)
AI PC的渗透速度同样显著。Gartner数据显示,AI PC在整体PC市场中的份额从2024年的16%上升至2025年的31%,预计2026年将达到55%,出货量1.43亿台。

在全新品类上,Meta AI眼镜2025年售出超过700万副,是2023年与2024年合计销量的三倍以上,2025年下半年全球智能眼镜出货量同比增长139%(Counterpoint)。



AI不再是消费电子的附加卖点,而是正在成为用户换机的核心理由。


新的机会
-
旧范式的根本局限,在于传统消费电子以"交互"为终点。手机、耳机、穿戴设备本质上是信息的搬运工具,而非理解与决策的载体; -
AI的介入使硬件第一次具备了"感知—理解—响应"的完整闭环能力,人机交互的范式正在从"触控指令"转向"意图理解"; -
消费电子全球换机周期叠加AI能力升级,将在2025—2027年间催生一轮结构性替换需求;新品类(AI伴侣设备、空间计算入口、主动感知穿戴)的形态尚未收敛,先发团队仍有定义品类的窗口。


过去的消费电子硬件只能"接收指令→执行指令",是一个单向工具。
AI的介入让硬件第一次能够自己感知环境、理解意图、主动响应。
过去做不到闭环,主要是因为:第一,没有通用的语义理解能力。通用语义理解的能力是大语言模型和多模态模型带来的。第二,模型无法在端侧运行。 第三,缺乏感知层的硬件基础。
当端侧算力足以驱动理解,模型足够小到嵌入设备,硬件就第一次具备了完整的"感知环境—理解意图—主动响应"的闭环能力。

过去四十年消费电子的交互范式是:用户通过明确的物理操作——点击、触控、滑动——逐步告诉设备"怎么做"。每一步都是一个显式指令。设备忠实执行,但不理解你的目的。交互的负担始终在人这一侧。
这个范式之所以延续了四十年,不是因为没有人想改变它,而是因为技术上做不到。"理解意图"要求设备具备自然语言理解、上下文推理和跨应用执行的能力,这三项能力在端侧同时具备,是过去两年才发生的事。
交互的负担正在从人转移到设备。用户不再需要学习每个应用的界面逻辑,只需要表达目的,设备自己规划并执行路径。
作为例证,可以看到每年活跃的带语音功能的手机设备已经超数十亿台。


PC 端的换代周期已经启动。


芯片厂商正在系统性地将AI能力从旗舰下放至中低端产品线。
消费者无需主动"为AI买单"。当他们正常换机时,可选的新机中AI设备的占比正在快速逼近主流。

锦秋的布局
-
在AI消费电子这一层,锦秋关注的不是硬件本身的规格竞争,而是能否以硬件为入口构建可持续的用户关系与数据壁垒。 -
系统级:能否以完整产品形态建立真实的换机理由,软硬件一体交付能力与用户体验的打磨深度是核心评估维度; -
平台级:硬件是否只是起点,能否在设备之上形成内容、服务或数据的持续积累,随用户规模增长而构建生态锁定; -
标准级:在核心传感器、端侧推理模组或人机交互协议上,能否成为新品类供应链的早期锚定节点。 -
AI消费电子不会只有一种胜出形态,但每一个真正被用户接受的新品类,都将诞生一家定义该品类体验标准的公司。

新的拐点:
-
具身智能正在经历一个关键的数据拐点。随着无本体采集方案逐渐成熟,具身数据集规模呈现出显著的增长态势,有望在2026年底突破千小时量级。 -
英伟达、Google DeepMind、1X Technologies等顶级机构相继发布世界模型,从Cosmos Predict到Genie 3,物理世界的预测与生成能力正在被系统性建构。 -
世界模型路线能够更好地融合互联网视频数据与无本体采集数据,有可能加速具身智能拐点的到来,我们可能在2027年看到真正泛化的具身大模型出现。


-
2024年:概念原点——UMI的提出。 -
2025年:工程化加速——从原型走向产品。 -
2025–2026年:无本体采集开始分化为两条互补的技术路线——UMI与Ego双轨并行
-
2026年:社会化采集——从专业设备到全民参与
其中,UMI路线聚焦末端执行器的精确轨迹采集,适合操作类任务(抓取、放置、拧动等)。
Ego路线(第一人称视角采集)则让采集者穿戴头戴相机和惯性传感设备,在真实环境中自然行动和操作,系统记录第一人称视频、身体姿态和手部动作,侧重全身协调动作和场景理解。
UMI提供精确的操作轨迹数据,Ego提供丰富的场景语义和全身动作数据。


世界模型是一种能够"想象"物理世界如何演变的AI系统——给它一个场景和一个动作,它能预测接下来会发生什么。
大语言模型(LLM)预测的是"下一个词",视频生成模型(如早期Sora)预测的是"下一帧像素",而世界模型预测的是"下一个世界状态"。

来源:图片来自流形空间公开分享。
世界模型也成为近期热点。
大语言模型的瓶颈已经显现,LLM的知识来自语言符号的统计规律,世界模型恰好补上了从"语言智能"走向"物理智能"的桥梁。
人形机器人产业集中爆发,世界模型"直接从视频里学一个模拟器"的思路,成了眼下最顺手的解法。
Yann LeCun、李飞飞相继出走创业,融资规模动辄数十亿美元,英伟达、Google DeepMind将其列为核心战略,顶级媒体集体跟进。

拐点3:世界模型路线能够更好地融合互联网视频数据与无本体采集数据
端到端模仿学习依赖"动作-观测"配对数据,这意味着每一条有效训练样本都必须来自真实机器人的在身体采集。传感器、关节角、力矩缺一不可。
世界模型路线的根本差异在于它的学习目标:预测世界状态的转变,而非拟合动作到输出的映射。
这一目标天然与本体解耦。互联网视频可以用来训练物体动力学、接触关系、场景语义;人类操作视频可以通过运动重定向或逆动力学还原为可迁移的行为先验。本体信息只在最后的策略精调阶段才成为必需。
这意味着两条路线面对的是不同量级的可用数据池。端到端路线的数据成本随部署场景线性扩张;世界模型路线则将人类几十年积累的视觉内容转化为有效训练信号,数据飞轮的起点和斜率都不在同一个数量级上。
新的机会
-
足够数量与多样性的真实世界数据,正在推动具身GPT时刻的临近:旧范式的根本局限,是数据与泛化之间的死结;传统工业机器人依赖预编程、强结构化环境,换线换任务成本极高,始终无法突破"专用"的天花板。 -
世界模型为机器人提供了物理常识的先验基础; -
关节模组、核心传感器的国产化进程,则让量产成本曲线第一次出现了陡降的可能。


GPT时刻的本质,是数据规模与模型能力之间的临界相变。
OpenAI训练GPT的核心资产是互联网,人类几十年的语言结晶。具身智能的对应资产,是人类在物理世界中几十年的行为积累。

2020年前后,一台全尺寸人形机器人(如波士顿动力Atlas液压版、本田ASIMO等)的成本通常在100万至250万美元量级。即使是定位较低的研究平台,价格也在数十万美元以上。
而到了2025-2026年,行业出现了根本性的变化:宇树科技(Unitree)G1全功能双足人形机器人的售价已降至1.6万美元,最新的R1型号甚至只要4900-5900美元。
预计到2035年,人形机器人BOM成本将从当前的4-5万美元降至1-2万美元,降幅达60-70%。
成本下降意味着ROI临界点的到来。

根据摩根士丹利对特斯拉Optimus Gen 2的BOM分析,一台人形机器人约5.5万美元的硬件成本中:执行器系统(电机+减速器+编码器)是最大的单项成本,占比约56%(特斯拉数据)。其中减速器约占执行器成本的36%,力矩传感器约30%,电机约13.5%。腿部关节占整机BOM的38.6%,手部占17.2%,两者合计超过一半。传感器与感知系统(LiDAR、深度相机、力传感器等)占15-25%。计算平台占10-15%,结构材料占10-20%。
占比超过70-80%的执行器和传感器领域,恰恰是这两个领域国产替代推进最快、降幅最大。




锦秋的布局
-
在具身智能这一层,锦秋沿产业链做系统性布局,而非押注单一节点。 -
新一代硬件平台:在感知、规划、执行之间构建完整闭环,整机与大脑层的公司必须具备跨任务泛化的自我迭代能力; -
新一代应用平台:数据、算法或部署服务形成跨本体、跨场景的复用壁垒,随交付规模增长而持续自我强化; -
新一代标准:在关节模组接口、传感器协议或训练数据格式上,能否成为行业事实标准的早期锚定者。 -
具身智能不会只有一个赢家,但每一个产业链关键节点都将诞生一家不可绕过的公司


新的拐点
-
Agent模型能力提升,专业技能提升,以SWE-Bench等专业评测为参照,顶级Agent在复杂工程任务上的得分在18个月内提升数倍; -
OpenClaw火爆进一步加速Agent应用 -
全球专业用户、企业用户对AI工具的接受度出现了结构性跃升多模态模型能力提升


在OSWorld基准(真实桌面操作369项任务)上,最佳模型从2024年4月首发时的12.24%提升至2026年初的72.7%,约20个月内提升近6倍,基本追平人类水平的72.36%(来源:arXiv:2404.07972; LLM Stats排行榜)。
在SWE-bench Verified(真实GitHub Bug修复)上,GPT-4o于2024年8月的最优得分为33.2%,到2025年底已有多个模型突破80%,约16个月内提升逾2倍(来源:OpenAI官方博客; CodeSOTA)。
Stanford AI Index 2026报告亦指出,网络安全Agent的无辅助解决率从2024年的15%跃升至93%,提升超6倍。


据公开数据,OpenClaw.ai网站月访问量达3,800万,月活跃用户320万,平均会话时长45分钟(约为ChatGPT的两倍),用户留存率92%。
GitHub显示超过1,454名开发者贡献者,累计产出约145,000行核心代码,ClawHub技能市场已上架44,000+个Agent Skills。
根据OpenRouter路由平台统计,2026年3月3日至4月2日期间,全球OpenClaw实例消耗约19.2万亿个token(约合15万亿个单词,相当于Wikipedia全部文本的150倍)。
Agent的使用门槛大幅下降,"始终在线"的Agent范式催生了全新的应用场景,也催化了企业级效率工具生态的爆发。

从2024年初的不足1亿美元的年化Run Rate,到2026年4月突破300亿美元。Anthropic用两年多完成了Salesforce花约二十年才走完的收入里程碑。
这条近乎垂直的增长曲线背后,是全球企业用户对AI工具接受度的结构性跃升。




新的机会
-
推理成本的断崖式下降与Agent能力的成熟,使得"将专家判断力编码为可持续运行的系统能力"第一次在经济上可行
-
专业场景天然存在可验证的反馈信号, 适合AI的数据飞轮;专业人才的供需矛盾在全球范围内持续加剧
-
交付结果而非工具 -
AI的介入使内容体验第一次具备了"感知偏好—实时生成—动态响应"的完整闭环,用户与内容的关系正在从"选择观看"转向"参与共创"; -
传统文娱内容以"消费"为终点,用户是被动的接收者,内容的生产与分发完全由平台与创作者主导,个体的偏好只能通过算法推荐被动满足; -
AI使内容的边际生产成本趋近于零,叠加个性化分发能力的提升,将催生一批以极低内容生产成本服务超级细分受众的新型内容产品——这是工业化内容生产时代永远无法覆盖的市场空白。







锦秋的布局
-
提供完整的专业能力交付的公司,且能随着客户深度使用持续积累私有的专家反馈数据与领域知识图谱
-
定义AI Native、个性化的新内容格式,以及基于此的内容消费和分发平台 -
围绕新内容格式的兴趣社区或社交平台 -
为Agent打造的 Infra

锦秋基金
每一个技术周期,都会有重新定义时代的创业者。
锦秋基金在不确定中长期支持想要改变世界的创业者,一起创造独一无二的伟大公司。
锦秋基金成立于2022年,专注早期,投资那些推动产业跃迁、拓展人类能力边界的创业公司。
锦秋基金目前已披露参与投资:
宇树科技、Momenta、数美万物、地瓜机器人、乐享科技、生数科技、首形科技、OiiOii、造梦次元、星尘智能、Pokee AI、铭芯启睿、因克斯、独响、Aha AI、清闲智能、微纳核芯、深度原理、光本位、澜昆微、流形空间、灵启万物、灵动佳芯、PongBot庞伯特、Pathfinder巡领科技、诺视科技、未来机器人、FastMoss、Dexmate、atoms.dev、Workmagic、Agile Flight、Talkme、Wanaka、Artarch、Infernet、SandwichLab、Wanderboat、Rezona、幕间、Isoform、Testsprite、Ribbi、NemoVideo、TarsTech、银河驿站、浪漫极客、Echo、Hydrox、SophiaPro、AdsGency、Go Plus Security、Safeheron、Poppark、Imaginix、Capso、fluxvita、猴子说话、奇妙拉比、JetCommerce、文图跃迁、新控智能、昌进生物、疆海科技、大秦数能、Leonis Capital、ZuzuZoos等。
📑 官方资讯与深度内容分享
「AI First Bite」
- 官方网站: www.jinqiucapital.com
- 微信公众号:锦秋集 (ID: jqcapital)
- 小红书 : 锦秋小助手
- 小红书:杨洁
🎬 视频播客|《锦供参考》系列
「2026 Founder Compass」
- 视频号: 锦秋范儿
- 小红书 :锦秋范儿
- 抖音:锦秋范儿
- B站:锦秋范儿



