拥抱“拐点”、迎接新潮：2026英伟达GTC大会的宣示与启示

作者：中心研究室发布时间：2026-03-28 11:13:42 来源：全球人工智能创新治理中心+收藏本文

2026年3月16日至20日，英伟达年度GPU技术大会（GTC2026）在加利福尼亚州圣何塞举行，吸引190多个国家的3万余名开发者参会。本届大会核心议题从此前聚焦的模型训练明确转向人工智能推理与规模化应用。黄仁勋在主题演讲及后续交流中，围绕产业判断、技术路线与生态布局作出系统阐述，在技术界、产业界和治理界激起多层次回响。

中心研究室：姚旭辛艳艳张傲钟奕飞于玥袁露铭王奕博

拥抱“拐点”：黄仁勋的新叙事

历届GTC大会，英伟达CEO黄仁勋的主题演讲都备受瞩目，引发热议与想象。在GTC2026主题演讲中，黄仁勋的演讲内容涵盖路线图发布、基础设施揭秘、新产品面世介绍。通过一如既往地摆出大量图表和抛出大量概念，黄仁勋向公众描绘了人工智能产业的新浪潮叙事：

黄仁勋在GTC2026上做主题演讲

图片来源：英伟达

一是人工智能产业正迎来从训练主导向推理驱动的“拐点”。长期以来，大模型的迭代训练是算力消耗的主战场。但随着生成式人工智能技术路径的成熟与推理模型的大规模普及，算力消耗的锚点已从训练侧转向推理侧。这种从“训”到“用”的重心迁移，不仅是技术落地的必然结果，更标志着新一轮算力需求长波的开端。

二是随着智能体生态驱动全行业推理算力需求激增，Token（词元）已成为重要的生产要素。黄仁勋在演讲中提出“Token经济学”和“AI工厂”概念：在电力和土地等物理限制下，未来的行业竞争将不再局限于模型参数规模，而取决于Token的生产效率与成本优势。以响应速度和处理能力为基础的Token分级定价体系将逐渐形成。传统的数据中心将从存储功能转向生产Token与多样化人工智能服务的“AI工厂”，由传统的成本支出项目转变为直接创造收入的生产系统。

三是推高“万亿美元”话题度，推广全栈架构产品布局。黄仁勋还在大会演讲中披露，到2027年底Blackwell和Vera Rubin两代芯片及配套累计订单将至少达1万亿美元，其中约六成来自大型云厂商，四成来自各国政府、主权AI建设及工业企业。这一预期确认了相关产业在2027年将仍处于高投入周期，释放出基础设施需求远未见顶的信号。

全栈架构产品布局：黄仁勋的“五层蛋糕”

围绕黄仁勋的上述判断，英伟达在大会上的发布内容并非单一的产品性能升级，而是沿硬件架构迭代、软件生态优化的主线展开协同布局，意图提供一套从底层算力到顶层生态、从模型训练到场景落地的全栈式解决方案。

黄仁勋展示新一代Vera Rubin架构

图片来源：英伟达

硬件层面，英伟达宣布新一代Vera Rubin架构进入量产阶段，并将此前收购的Groq公司高性能语言处理单元（LPU）技术方案整合进自身产品体系，与GPU构建异构算力集群，在这一架构中，GPU利用其大容量内存优势负责处理用户输入与长上下文，拥有低延迟优势的LPU则负责解码阶段的Token生成。同时，英伟达还发布了全球首款量产共封装光学（CPO）交换机Spectrum X，明确下一代架构铜缆与光纤并进的战略，并预览了将于2028年发布的下一代Feynman架构原型，展示延伸至本十年末的技术纵深。

软件和生态层面，英伟达推出企业级智能体部署平台NemoClaw，配合OpenShell安全沙盒环境，构建针对自主智能体的内生合规架构。黄仁勋还提出，软件行业将由“软件即服务”（SaaS，Software as a service）向“智能体即服务”（AaaS，Agent as a Service）演进，即从提供工具供人类操作，转向由智能体自主完成任务并交付结果，显示出其对智能体服务的加强押注。

迭代翻新的产品布局，反映出英伟达对于全栈架构的愿景。自2025年底以来，黄仁勋开始频繁提及“五层蛋糕”式的人工智能产业概念，用以阐述英伟达战略布局。该理论将人工智能产业自下而上分解为能源、芯片、基础设施、模型与应用五个层级，试图简化外界对人工智能技术栈复杂性的理解，同时为英伟达的业务扩张提供理论支撑。

“五层蛋糕”式的人工智能产业示意图

图片来源：英伟达

五层架构的底层是能源供给。黄仁勋强调，电力容量已成为人工智能发展的刚性约束，特定区域的可用电力直接决定该地能够部署的算力上限。第二层是芯片，决定单位能耗下可获得的计算能力。第三层是数据中心基础设施，涵盖土地、建筑、供电系统、冷却设备与高速网络。第四层是模型，根据应用场景进行差异化训练与微调。顶层是面向最终用户的应用服务，包括企业软件、智能体、自动驾驶等，这也是人工智能经济价值的最终实现环节。黄仁勋借此框架将英伟达从单纯的芯片制造商重新定位为人工智能全栈基础设施的核心推动者，宣称支持“人类历史上规模最大的基础设施建设”需要对整个计算堆栈进行重构。其战略表述为垂直整合与水平开放相结合——在芯片、系统、软件等核心环节保持纵向控制，同时向开发者与合作伙伴开放接口与生态。这一叙事试图将英伟达嵌入人工智能产业链的每个层级，从能源管理到应用交付全流程覆盖，强化其在全球算力基础设施中的不可替代性。

在愿景与现实之间：资本市场保持预期

从英伟达内部看，其核心技术团队与业务线强调自身现有生态优势，就黄仁勋在大会上的叙事已形成底层共识，但也承认在落地节奏上正面临挑战。CUDA架构的主要推动者、英伟达超大规模和高性能计算业务副总裁伊恩·巴克（Ian Buck）表示，AI编程并未削弱CUDA的技术护城河，代码性能优化对底层平台的依赖反而进一步增强，CUDA架构二十余年的体系积淀与技术优势短期内难以被替代。机器人和边缘AI副总裁迪普·塔拉（Deepu Talla）在接受采访时表示，智能体将为机器人带来重要拐点，但训练数据不足、在复杂场景中安全运行等挑战仍然突出，距离大规模部署仍有相当距离。

伊恩·巴克（Ian Buck）

图片来源：彭博社

从资本市场看，英伟达的长期叙事和短期估值存在不小张力。一方面，伯恩斯坦、摩根大通、高盛集团等头部金融机构仍对英伟达维持正面评级，认可其全栈平台策略与技术整合能力。另一方面，资本市场对英伟达预期持保留态度。截至3月25日，公司股价进入2026年来已累计跌超6%；特别是GTC大会期间，股价短暂冲高又回落，3月20日收盘时单日跌幅超5%。

从行业视角看，部分业内人士对“万亿需求”仍存质疑。AI推理对延迟、能效和部署灵活性要求更高，客观上为多元架构打开了空间。在供给侧上，西门子首席AI战略家、AI Realist咨询公司创始人玛丽亚·苏哈列娃（Maria Sukhareva）和英国《金融时报》均指出，英伟达正面临华为、谷歌等公司在自研芯片与替代生态上的多线竞争压力。在需求侧上，麦肯锡合伙人克里斯·史密斯（Chris Smith）强调，“Token经济学”、智能体等议题虽正加速进入企业决策层视野，但多数仍停留在试点阶段，距离全面转型仍存在投入、兑现与回报等关键瓶颈。

总体来看，产业界并未一味附和黄仁勋的叙事口径，但承认其提出的技术与商业叙事已对行业判断和资本预期产生实质牵引。英伟达凭借全栈平台和生态锁定仍居主导地位，但推理时代的到来正在将此前算力垄断的单一竞争规则转向效率竞争与多元架构并存。

“Token经济学”概念及其外延引发产业界热议

图片来源：FINACIAL TIMES Efi Chalikopoulou

中国企业集中亮相，产业链合作持续深化

在本届GTC全球舞台上，我国人工智能、机器人领域多家企业参与其中，从大模型基础研究、具身智能突破到自动驾驶架构创新，全方位展示中国前沿科技的技术纵深与全球竞争力。

大模型领域，月之暗面创始人杨植麟现场出席并发表主题演讲。作为GTC2026上唯一登台演讲的中国独立大模型公司创始人，发表题为《How We Scaled Kimi K2.5》的演讲，首次完整披露Kimi K2.5背后的技术路线图。在演讲中，杨植麟将Kimi进化逻辑总结为通证效率、长脉与智能体集群三大维度，并向全球开发者深入介绍了包括“注意力残差”在内的下一代模型架构路线，进一步展示中国AI团队在底层技术创新上的硬核实力。此次引发热议的“注意力残差”技术通过赋予模型自主选择关注此前层级信息的能力，显著优化了计算效率。实验数据表明，经过改进后的48B规模模型训练效率提升了1.25倍。除了马斯克的赞赏，前OpenAI研究副总裁Jerry Tworek也评价该技术标志着“深度学习2.0”时代的到来，认为其将对未来AI模型架构的标配产生深远影响。

杨植麟在GTC2026发表主题演讲

图片来源：钛媒体

智能机器人领域，宇树科技 CEO 王兴兴发表线上主题演讲，研判具身智能产业关键跃迁节点，指出行业三大核心瓶颈——模型表达能力不足、真机数据极度稀缺、强化学习缺乏规模化复用机制，同时更看好世界模型与视频生成模型技术路线，强调具身智能是全球合作的共同事业。银河通用机器人 Galbot G1 作为唯一中国设备具身智能真实应用案例，登上黄仁勋主题演讲环节。演讲案例展示 Galbot G1 在美国医疗 AI 公司 PeritasAI 高密药房的真实部署，可自主穿梭、精准识别并牵引手术器械，验证工业级可靠性与全球生态适配能力。

此外，多家独角兽企业展示了前沿产品。自动驾驶领域，文远知行（WRD）展出旗下前装量产旗舰车型Robotaxi GXR；具身智能领域，光轮智能演示多种仿真机器人实例，为具身智能产品提供仿真训练基础设施。

延伸解读：GTC2026的三重趋势

从GTC2026释放出的信息看，当前人工智能领域的关注重点正在发生较为明确的变化。过去几年，行业竞争的核心主要围绕大模型训练能力展开，重点是参数规模、训练算力和基础模型性能；而在GTC2026上，更受重视的内容已经明显转向推理效率、系统部署、场景适配以及与产业流程的结合。英伟达此次发布的重点，不仅包括新一代计算平台，也包括面向大规模推理的系统软件、面向机器人和自动驾驶的“物理AI”数据方案，以及与工业软件、云平台和基础设施企业更紧密的协同布局。人工智能的发展正在从以模型训练为中心的阶段，进一步转向以部署能力和应用转化能力为中心的阶段。

一

技术维度：

推理拐点、物理仿真和现实部署

首先，本届大会较为清楚地表明，推理正在成为人工智能技术体系中的关键环节。越来越多企业在完成大规模训练投入后，正在把重点转向面向海量用户提供实时服务，这使得推理计算成为新的竞争焦点。国际高端算力竞争，正在由过去更强调单卡性能和训练能力的模式，转向更强调异构协同、软件调度和全栈集成的模式，未来技术能力的比较，或将不再只体现为模型是否更大、训练是否更强，而会越来越多地体现为推理速度、系统稳定性、资源利用率和单位成本控制能力。

其次，仿真和数据生成能力在技术体系中的地位明显上升。GTC2026上发布的“物理AI”数据工厂 Blueprint，核心目标是把训练数据生成、增强和评估连接为统一流程，将物理仿真、工程设计和制造流程更紧密地连接起来，以降低机器人、自动驾驶和视觉智能体训练的时间、成本和复杂度。从技术逻辑上看，这一变化反映出人工智能的前沿问题正在从单纯处理文本和代码，逐步扩展到感知、控制和现实环境交互。对于机器人、自动驾驶等场景而言，仅依赖真实世界数据采集不仅成本高，而且难以覆盖长尾和高风险场景，因此仿真环境、合成数据和自动化评估体系的重要性显著提高。GTC2026释放信号表明：下一阶段人工智能的技术突破，不只是模型性能的线性提升，更取决于仿真能力、数据闭环能力以及模型进入现实环境后的可验证性。

英伟达发布开放物理AI 数据工厂Blueprint，表述将加速机器人、视觉 AI 智能体和智能汽车开发

图片来源：英伟达

再次，人工智能研发正在呈现更强的系统化特征。GTC2026并未将芯片、软件、数据和场景分开讨论，而是把它们放在同一技术框架中统筹推进，强化对系统集成能力的关注。从追求单一环节的领先，进一步外溢到先进制造、封装工艺、光通信器件、电力与散热管理等综合工业能力的竞争。对科技界而言，这种变化会进一步推动算法、芯片、网络、仿真、控制和工程应用之间的交叉融合。单一依赖模型训练能力来判断技术优势，已经越来越难以解释当前人工智能竞争格局的变化。

还需要看到，这种技术重心的变化，也意味着竞争结构在发生调整。路透社指出，英伟达虽然在训练侧仍具有显著优势，但在推理市场正面临来自CPU和定制化处理器的更大竞争压力。这说明，随着人工智能从训练走向部署，技术体系本身也会更加多元，未来未必是单一架构主导全部环节，而更可能形成围绕不同场景、成本约束和部署需求展开的异构竞争。就这一点而言，GTC 2026的意义并不只是展示某一家企业的技术优势，更在于说明人工智能的技术竞争已经进入更复杂、更贴近应用实际的新阶段。

二

产业维度：全域产业的上下游协同

GTC2026上，英伟达并没有把重点局限于芯片本身，而是系统展示了其与工业软件企业、云服务商、整机厂商以及下游制造企业之间的协同关系。官方资料显示，Cadence、Dassault Systèmes、PTC、Siemens、Synopsys等工业软件企业正在将英伟达相关能力嵌入设计、验证和制造流程，AWS、Google Cloud、Microsoft Azure和Oracle Cloud Infrastructure则负责在生产规模上提供相应的计算支持，Dell、HPE、Supermicro等企业也被纳入本地化和混合部署体系。人工智能的产业化路径正在从过去较多依赖单点软件应用，转向围绕平台、流程和行业场景展开的系统集成。

GTC2026分论坛上，黄仁勋与Cadence CEO Anirudh Devgan就AI驱动的科学仿真和工程设计等话题展开对谈

图片来源：英伟达

从更宏观的角度看，本届GTC还反映出人工智能产业发展正在向基础设施层延伸。路透社在相关报道中指出，英伟达正在围绕推理和大规模部署形成新的增长预期，并将相关市场机会进一步上调；分析人士认为，这反映出人工智能产业正从早期试验阶段走向更大规模部署阶段。与此相一致，英伟达在GTC期间及会后还提出了与能源企业合作推进灵活AI工厂的设想，试图把数据中心建设、电力协同和算力部署纳入统一框架。这说明，人工智能产业的竞争已经不再只是模型和应用层面的竞争，而是开始向土地、电力、散热、网络、园区和工程建设等更基础的资源条件延伸。换言之，人工智能的发展正在推动基础设施逻辑发生变化，并可能进一步重塑相关产业的投资方向和资源配置方式。

三

治理维度：“主权人工智能”的发展议程

GTC2026上，黄仁勋也从治理维度表达了其一直以来强调的“主权人工智能”（Sovereign AI）概念。早在2024年2月，黄仁勋在阿联酋迪拜出席2024年世界政府峰会时就对此进行过阐释推介，认为每个国家应对应用于本国的人工智能系统掌握控制权，不只是技术和产品层面，也包括从数据到基础设施的整个人工智能生态。此后黄仁勋利用GTC大会、达沃斯论坛和其他国家首脑高层见面等多种渠道宣扬其“主权人工智能”概念，GTC2026也专门设置“主权人工智能开发者大会会议（Sovereign AI Developer Conference Sessions）”，邀请欧洲、中东和非洲等地区政商领导人发言讨论。

“主权人工智能”对应不同发展水平的主权国家，在人工智能浪潮下的普遍焦虑与差异化需求，并试图给所有国家提供可以落地的人工智能发展方案。一方面，对于欧盟等发达经济体而言，“主权人工智能”提供了“监管”与“发展”两难之间的中间道路。在数字发展过程中，欧盟通过严格的GDPR和《人工智能法案》对数据属地化、跨境流动建立了严格的管控要求，但中美人工智能发展的迅猛态势令其产生内在焦虑，担心本土AI产业被美国科技巨头垄断，丧失数字经济的主导权。黄仁勋提出的主权AI 方案恰好精准迎合欧洲需求。2025年4月9日，欧盟委员会发布《人工智能大陆行动计划》（AI Continent Action Plan）以全面提升欧盟在AI领域的竞争力。该计划以建设5座“AI超级工厂”为中心，强调打造欧盟自身的人工智能基础设施。在此背景下英伟达就与HPE等企业合作在法国设立“AI工厂实验室”，以专门打造符合欧盟监管要求的属地化算力环境。

另一方面，对印度、越南等新兴市场国家而言，“主权人工智能”概念抓住这类国家发展AI过程中的“安全”关切。这类国家技术体系仍处于起步或追赶阶段，高端芯片和基础设施自主研发能力较为薄弱，却又迫切希望抓住AI产业浪潮，提升国家数字经济竞争力，同时对本土语言、文化与数据安全有着较高要求。“主权人工智能”方案似为新兴国家建设“安全AI”提供了可快速落地的“捷径”。GTC2026结束后，越南四大运营商之一Viettel就与NVIDIA合作构建越南主权人工智能生态系统，基于英伟达 DGX B200 算力平台与 Nemotron 大模型架构建设人工智能基础设施。

麦肯锡预测到2030年，人工智能支出将受到主权影响，市场规模或达5000亿至6000亿美元

图片来源：麦肯锡

当然，黄仁勋强推“主权人工智能”等治理理念背后有着直接的商业意图做支撑。根据咨询公司麦肯锡测算，到2030年，全球30%到40%的人工智能支出将受到主权要求影响，相关市场规模或达5000亿至6000亿美元。黄仁勋的“主权人工智能”概念径直瞄准中等强国和新兴市场经济体，也意在抢占这些国家的人工智能基础设施建设市场。目前英伟达正通过与亚马逊等企业合作，在全球部署超100万个GPU开展后续“主权人工智能”业务，GTC2026前夕，英伟达也联合美国人工智能公司帕兰提尔（Palantir）发布“主权AI操作系统参考架构（AIOS-RA）”，为政府和企业打造从硬件到应用部署的完整“主权人工智能”解决方案。

然而，“主权人工智能”能否按照英伟达设想般发展也面临诸多不确定性。福布斯等多家媒体评论指出，将软硬件、数据中心、计算网络等都与英伟达技术深度绑定的“主权人工智能”实际与“主权”没有联系。彭博社更以“讽刺（Irony）”表达对英伟达“主权人工智能”的看法。当国家将“主权人工智能建设”简化为算力硬件的本地部署，当人工智能发展被“硬件采购与基础设施”这一维度定义，全球人工智能治理不知不觉中即陷入英伟达精心编织的“商业陷阱”。英伟达的方案看似降低了国家“主权人工智能”的落地门槛，实则让这些国家形成“越采购越依赖”的惯性，其真正的效果仍有待观察。

英伟达GTC2026大会已经成为观察全球人工智能技术路径演进、产业规则发展与治理议程变化的重要视角，展示了黄仁勋等业界前沿对技术发展和业态演进的愿景和布局，也展现了技术雄心和市场野心。

与此同时，本届大会描绘的宏大图景仍需在未来接受多重考验，产业界对英伟达叙事认可与质疑并存，资本市场对其长期增长预期与短期估值存在明显张力，不同国家对“主权人工智能”概念的接受程度也存在区别。总体而言，GTC2026 标志着人工智能竞争已进入效能驱动与系统集成的新阶段。无论是在底层算法上寻求突围的个体企业，还是在治理规则中寻找平衡的主权国家，都预示着未来全球人工智能版图将是技术愿景与现实约束博弈后的复合产物。GTC2026所释放的信号能否转化为持久的产业红利，仍有待国际社会和产业各界的进一步验证。

作者：姚旭、辛艳艳、张傲、钟奕飞、于玥、袁露铭、王奕博