北极星

搜索历史清空

  • 水处理
您的位置:电力电力新闻火电火电产业评论正文

DeepSeek 的突破对AI应用和能源行业意味着什么?

2025-02-11 09:14来源:国际能源小数据作者:E Small Data关键词:能源行业电力企业DeepSeek收藏点赞

投稿

我要投稿

摩根大通网站发表文章,题目是:Is the DeepSeek drama a gamechanger for the AI trade(DeepSeek 的“盛筵”会改变 AI 应用格局吗)?

(来源:国际能源小数据 作者:E Small Data)

从 2022 年 11 月到 2023 年 1 月,1 亿人开始使用 OpenAI 的 ChatGPT。Instagram 达到同样的里程碑用了两年半。自那以后,投资者就被 AI 应用的不同环节所吸引。

•       第一环节——超大规模企业:提供大规模云计算技术的公司。

•       第二环节——数据中心计算和基础设施:生产硬件(芯片)和电气设备等输入产品,使数据中心得以运行的公司。

•       第三环节——电力和传输:供应和传输数据中心所需电力的公司。

•       第四环节——跨行业受益者:将 AI 纳入其中以提高生产力并获得收入好处的公司。

自 ChatGPT 推出以来,投资者一直注重第一到第三环节的公司,因为超大规模企业为了追求 AI 产生的收入,加大了对数据中心基础设施和电力的支出。此时,DeepSeek 登场了,这是一家两年前成立的中国 AI 初创公司。特朗普就职前夕,DeepSeek 推出了其完整的 R1 模型,这是一个开放推理大型语言模型(LLM)。R1 模型在数学、编码和推理任务上的表现与 o1(OpenAI 的前沿推理 LLM)相当。当然行业专家和金融市场中仍然存在关于 DeepSeek 有效性的猜测,但市场认为他们的突破挑战了推动 AI 应用的既有假设。

因此,AI 公司遭受了自 ChatGPT 推出以来最大的单日跌幅。

•       第一个受到挑战的假设是超大规模企业必须在先进 AI 芯片上花费数十亿美元。DeepSeek 声称其模型使用了英伟达的 H800 芯片,这些芯片的内存带宽受到美国芯片出口管制的限制,不如更先进的 H100 芯片。此外,他们声称训练耗时 2788000 个图形处理单元(GPU)小时,成本为每 GPU 小时 2 美元。因此,最终训练运行的总成本仅为 557.6 万美元。Meta 最新的 Llama 模型的最终训练运行成本是其 10 倍。投资者立即质疑英伟达预期的收入和利润率。事实上,其他芯片制造商已经发布博客,指导开发人员如何使用他们自己的芯片运行 DeepSeek 模型。

•       第二个受到挑战的假设是 AI 的未来需要不断增加的电力和能源。DeepSeek 的突破部分依赖于他们设计的“混合专家”(MoE)系统。总体而言,该模型拥有 6710 亿个参数容量,但任何给定时间只有 370 亿个(不到 6%)处于活跃状态。这降低了能源需求以及总体成本。如果 AI 模型在没有相应增加计算基础设施和电力的情况下保持有效性,那么这可能意味着数据中心驱动的电力需求被高估了。因此,许多基于乐观电力需求估计而飙升的公司股价(例如 Constellation、Vistra、Eaton 和 Digital Realty)大幅下跌。

•       第三个受到质疑的假设是美国在 AI 技术方面的领先地位。DeepSeek 展示了通过大量优化可以在较弱的硬件和较低的内存带宽上取得显著成果。与此同时,美国实验室一直在大量投资尖端技术,并建立最先进的芯片库以获得优势。竞争格局比之前假设的更加平衡。然而,DeepSeek 使用了美国模型作为其技术基础(Llama)、美国芯片来运行模型(英伟达)并与美国机构合作发布其发现(麻省理工学院)。

这对 AI 应用意味着什么?

我们相信 DeepSeek 的模型代表了人工智能技术的一大进步。即使这在一定程度上将价值从半导体、数据中心基础设施和电力转移到超大规模企业和收入及生产力受益者身上,这可能对广泛市场和经济都是积极的。这是因为更高效的模型可能会进一步使 AI 商品化,并对资本支出和能源需求施加下行压力。与此同时,更便宜的模型应该会推动家庭和企业的采用和需求。一个关键问题仍然存在:AI增加的应用是否会抵消因成本和能源效率而减少的资本支出?

以下是我们对 AI 应用4个相关环节的评估:

第一环节——超大规模企业:假设超大规模企业因成本和能源效率而削减资本支出计划。在最坏的情况下,超大规模企业的资本支出强度(资本支出/收入)可能会回落到 2015 年至 2019 年的水平。这可能导致这些公司的资本支出减少近 24%。这显然对数据中心计算和基础设施公司的收入是不利的,但对超大规模企业股票可能是积极的。事实上,减少资本支出可以释放现金流以回馈股东,特别是如果假设 AI 创新继续以同样的速度发展。然而,这不是我们的基本情况。最近微软和 Meta 报告了收益,并确认了继续支出的意图,主要集中在为推理而非训练建设数据中心,这与大多数 AI 投资用于推理的观点一致。话虽如此,随着支出转向专用集成电路(ASIC),将超大规模企业的知识产权与设计平台相结合,传统对 GPU 的依赖预计会减少。

第二环节——数据中心计算和基础设施:超大规模企业减少支出可能意味着数据中心参与者收入减少。分析师估计芯片制造商的数据中心收入到 2028 年将增长 27%。我们估计,其中约 375 亿美元的收入受到不断变化的资本支出计划的影响。这可能转化为到 2028 年芯片制造商数据中心收入减少近七个百分点。然而,随着成本的降低,应用场景可能会增加(弹性),继续推动电力需求。事实上,我们的投资银行指出,x86 虚拟化(一种在 2000 年代中期开发的技术,允许多个操作系统在单台物理机器上运行)提高了效率,但也刺激了对半导体芯片和内存的需求。云计算的转变同样提高了效率并推动了对半导体的需求。

第三环节——电力和传输:2023 年,美国的电力需求约为 4200 太瓦时,其中数据中心占约 200 太瓦时。今年早些时候,美国能源部发布了数据中心电力需求的最新预测。预测的高端假设 AI 工作负载将推动未来几年 26% 的复合年增长率(CAGR)。按照这个速度,数据中心的电力需求大约每 2.5 年翻一番。如果 DeepSeek 的效率导致几乎没有增量增长,数据中心的电力需求将恢复到 2014 年至 2023 年期间经历的 13% 的增长率。我们的观点略为乐观,数据中心的电力需求将在该时间范围内以 20% 的复合年增长率增长。此外,AI 并非推动电力需求的唯一因素。事实上,我们相信电动汽车和混合动力汽车、工业化和自动化以及非 AI 数据中心也将推动未来几年整体电力需求以 2.5% 的复合年增长率增长,而不是过去十年中微不足道的 0.7% 的复合年增长率。尽管对电力需求的最高估计似乎不太可能,我们仍然相信电力是一种可投资的趋势。

第四环节——跨行业受益者:最终,DeepSeek 的突破可能对大多数行业中众多潜在的生产力和收入受益者最为正面。我们在价格走势中看到了这一点。近来生产力受益者的表现在平均上超过了第一到第三环节的公司 7%。软件行业是一个显著的赢家,预计这种情况将继续。

原标题:【观点】摩根大通: DeepSeek 的突破对AI应用和能源行业意味着什么?
投稿与新闻线索:陈女士 微信/手机:13693626116 邮箱:chenchen#bjxmail.com(请将#改成@)

特别声明:北极星转载其他网站内容,出于传递更多信息而非盈利之目的,同时并不代表赞成其观点或证实其描述,内容仅供参考。版权归原作者所有,若有侵权,请联系我们删除。

凡来源注明北极星*网的内容为北极星原创,转载需获授权。

能源行业查看更多>电力企业查看更多>DeepSeek查看更多>