Please ensure Javascript is enabled for purposes of website accessibility Quick View: What investors should know from NVIDIA's GTC 2025 - Janus Henderson Investors - China Investor (ZH)
中国核准合格境内机构投资者专用

投资速览:NVIDIA GTC 2025投资者须知

投资组合经理Richard Clode讨论NVIDIA年度科技大会的重要启示。这个极其重要的会议重点介绍AI高速革新,包括代理式AI所创造的机会。

Richard Clode, CFA

投资组合经理


2025年3月20日
5 分钟阅读

焦点分析

  • 符元(而不是数据)作为「新动能」,推动更高水平的智能及相关的收益和利润。推理模型使代理式AI变成可能,为AI创造崭新、庞大的潜在市场。
  • DeepSeek的意涵一直被市场误解。AI运算需求随着推理模型呈指数级增长,而美国对半导体的限制可能意味着相对于中国的AI能力可能处于相对较高的水平。
  • AI的难题将透过科技创新得到解决,从而创造跨技术堆叠的投资机会。

符元(Token)作为「新动能」

数据一直以「新动能」的形态呈现,而因生成式AI领域可无止境创建合成数据,造就符元成为现今世代的力量来源。为生成式AI带来革命与开创时代的原始创新Transformer模型正正建基于符元化。符元是AI模型在训练和推断过程中处理的数据单元,可以预测、生成和推理。因此符元等于智能,最终将带来更大的收益和利润。

NVIDIA行政总裁黄仁勋长期以来不断提及「AI工厂」。AI数据中心创造符元并因而利用智能设计出更好的产品、更高效经营业务并提高客户服务品质。他设想未来每家公司都会拥有两类工厂:制造和计算。作为先进AI晶片的领导者,NVIDIA目前才开始使用AI加速电子设计自动化(EDA)软件工具来设计未来的晶片。直至近期,该公司将软件优化以用于NVIDIA的CUDA程式语言。该公司还宣布与通用汽车(General Motors)建立全方位合作关系,利用AI帮助通用汽车设计汽车、提高效率并实现自动驾驶。

代理式AI – 下一波AI

我们仍处于生成式AI创新曲线的早期阶段。黄仁勋一直强调的新规模定律是测试时扩展或长时间的思考推理模型,其采用更长的思考过程方法得出更准确的反应,而不是优先考虑速度。这些推理模型最近才推出市场,使代理式AI成为可能。这是具有代办功能的AI,能了解需要解决的问题的背景。其突破之处是能推理和策划行动方案,以多模型方式解决问题。这可能涉及阅读网站文章或观看影片,同时采取几种可能的途径来解决问题,然后检查答案是否一致或将答案重新插入问题中。此举解决了ChatGPT和其他单样本推断模型在回答简单问题时遇到的阻碍,更不用说更复杂的问题了。代理式AI是一种更高级的智能操作,使下一波AI从副驾驶 (Co-pilots) 到AI代理成为可能,以便在无人监督的情况下以高度准确性和一致性完成任务。代理式AI大幅扩展AI的潜在市场,开辟了人类和自动驾驶等新物理AI应用程式,并运用现实世界的重力、摩擦力和「因果关系」等力量。

解构DeepSeek的谬误

黄仁勋竭力指出,市场完全误解今年初DeepSeek推出R1模型的含义。将DeepSeek的反应与Meta的标准非推理模型比较时,DeepSeek的反应更准确,但需要20倍的符元和150倍的运算。DeepSeek并非表明未来运算需求会减少,而是一场推理模型的「真相大会」,为AI运算需求开辟新的扩展方向。

NVIDIA亦制定2027年前的发展路线图,其中的最终产品是下一代AI超级晶片Rubin Ultra,其性能为Hopper的400倍以上。这一点非常重要,由于目前美国半导体出口限制(旨在限制中国获取先进半导体及其生产所需设备)对降低Hopper等级的AI运算设定了绝对上限。在未来几年,中国新的AI模型将受到运算上限的限制,而全球AI模型可能会在性能呈指数级增长的AI基础设施上进行训练。这可能表明,与世界其他国家相比,中国的AI能力可能处于相对较高的水平。

解决AI挑战的全端解决方案

NVIDIA不只是一间半导体公司,其大幅效能提升和节能归功于软件和网络创新。黄仁勋一直强调生成式AI归咎于全端问题,需要全端解决方案。在其GTC活动上,该公司展示共同封装光学元件和虚拟Dynamo软件等创新举措。AI训练丛集的光纤网络是耗电量最大的部分,每个GPU包括6个收发器,每个收发器的耗电量为30瓦,因此随着训练丛集扩大,光耗电量亦随之增加。NVIDIA声称,在开关中封装光学元件,可使用少4倍的激光带来多3.5倍的电能效率。Dynamo是一层虚拟软件,使用虚拟GPU并将工作负载切分和细分来优化推理工作负载,从而将推理效能提高30倍。

我们始终认为,推进和运行AI所需的电能问题可透过创新技术解决。因此,与公用事业和电力基建设施相比,更多关注的投资机会在于整个技术堆叠中。

倘若英文版本与中文版本出现歧异,概以英文版为准。

推理式AI:使用复杂的推理和迭代规划自主解决复杂的多步骤问题。来自多个数据来源和第三方应用程式的大量数据应用于独立分析问题、制定策略和执行任务。

CUDA:由NVIDIA开发,使用图形处理单元(GPU)的程式语言。可进行并行执行运算,同时提供良好的速度。CUDA允许NVIDIA的GPU执行常见的运算任务,例如处理矩阵和其他线性代数运算,而不只执行图形计算。

DeepSeek:一家中国AI初创企业,亦是DeepSeek-V3等开源高级大型语言模型(LLM)的开发商。 DeepSeek-V3价格更便宜,是OpenAI的ChatGPT和Google的Gemini的主要竞争对手。

电子设计自动化(EDA):一类特定硬件、软件、服务和流程,使用电脑辅助设计来开发复杂的电子系统,例如印刷电路板、集成电路和微处理器。将元件密集封装在电路板或微处理器上需要极其复杂的设计。EDA软件使用自动标准流程,推动高速开发,同时在最大程度上减少程式错误、瑕疵和其他设计错误。

全棧解決方案: 指一種全面的軟件開發方法,涵蓋應用程式或項目的所有層次,包括前端及後端組件,以及應用程式完全運行所需的任何其他層次組件。

GPU: 执行图形渲染(graphics rendering)所需的复杂数学和几何计算的图形处理器,亦被用于游戏、内容创作及机器学习。

推理:指AI处理,机器学习和深度学习指训练神经网络,而AI推理是应用经过训练的神经网络模型的知识,从而推断结果。

LLM(大型語言模型): 一類專門的人工智能,利用大量文本進行訓練,以了解現有內容並生成原始內容。

长思考推理:这是一种考虑各种信息和潜在结果的深入的扩展推理过程,即通过分析多种视角、考虑长期影响、审慎权衡各种因素,然后得出结论。

一次性推理/提示:是指通过向模型提供单个示例或提示词来执行任务的方法。这种方法依赖精心设计的单个提示来实现预期的输出结果。

测试时扩展(test time scaling):一种通过增加测试阶段使用的算力资源来提升模型性能的语言建模方法。

词元(token):人工智能标记是大语言模型(LLM)在输入和输出过程中使用的基本构建单元。这些是AI模型在训练和推断过程中处理的数据单元,可以预测、生成和推理。

任何对个别公司的参考,仅供说明用途,并不构成买入或卖出投资建议,法律或税务事项的忠告。