登录注册
请使用微信扫一扫
关注公众号完成登录
我要投稿
美国麻省理工学院技术评论(MIT Technology Review)网站发表署名James O'Donnell的文章,题目是:DeepSeek might not be such good news for energy after all(DeepSeek对能源来说可能不是好消息)。
(来源:国际能源小数据 作者:E Small Data)
在名为 DeepSeek 的中国人工智能模型成为家喻户晓的名字的一周内,各种说法层出不穷,准确性参差不齐。最引人注目的说法是,DeepSeek 的新方法更加高效,这意味着人工智能或许不再需要消耗目前如此大量的能源。
这种说法具有误导性。初步数据——基于 DeepSeek 较小模型在少量提示下的表现——表明其在生成回答时可能比 Meta 的同等规模模型更耗能。问题可能在于,它在训练过程中节省的能源被其回答问题时更密集的技术,以及由此产生的长篇回答所抵消。再加上其他科技公司受到 DeepSeek 方法的启发,现在可能开始构建自己的类似低成本推理模型,能源消耗的前景就变得更不那么乐观了。
任何人工智能模型的生命周期都有两个阶段:训练和推理。训练是一个通常持续数月的过程,模型在此过程中从数据中学习。随后模型便准备好进行推理,这发生在世界上任何一个人向它提问时。这两个过程通常都在数据中心进行,需要大量能源来运行芯片和冷却服务器。
在训练方面,DeepSeek 团队改进了 R1 模型的所谓“专家混合”技术,即在训练过程中,模型数十亿参数(模型用来形成更好答案的“旋钮”)中只有一部分处于激活状态。更值得注意的是,他们在强化学习方面取得了进步,模型的输出会被打分,然后用来使其变得更好。这通常是由人工标注员完成的,但 DeepSeek 团队在这方面做得很好,实现了自动化。引入一种使训练更高效的方法,似乎表明人工智能公司将使用更少的能源来将其人工智能模型提升到一定标准。然而,事实并非如此。如果公司能从投入中获得更多回报,他们会觉得值得投入更多,因此也会使用更多能源。这就是所谓的杰文斯悖论的一个例子。
但只要人工智能竞赛还在进行,训练方面的这种情况就一直存在。推理所需的能源才是更值得关注的地方。DeepSeek 被设计为推理模型,这意味着它旨在擅长逻辑、模式识别、数学等任务,而这些通常是典型生成式人工智能模型所难以应对的。推理模型通过所谓的“思维链”来实现这一点。它允许人工智能模型将其任务分解成部分,并按逻辑顺序逐步完成,然后得出结论。
我们可以从 DeepSeek 中看到这一点。当被问及是否可以为了保护某人的感情而撒谎时,该模型首先从功利主义角度处理这个问题,权衡眼前的善与潜在的未来伤害。然后它考虑康德伦理学,该学说主张人们应按照能够成为普遍法则的准则行事。它考虑了这些以及其他细微差别,然后才分享其结论。它认为在善良和防止伤害至关重要的情况下,撒谎“通常是可接受的,但不是永远如此”。
在诸如 MMLU 等某些基准测试中,思维链模型往往表现更好,MMLU 测试了 57 个学科的知识和解决问题的能力。但正如 DeepSeek 所显示的那样,它们在得出答案时也需要消耗更多的能源。我们有一些初步线索,了解到底多了多少。
Scott Chamberlin 在微软工作多年,后来在英特尔工作,致力于构建工具以揭示某些数字活动的环境成本。Chamberlin 进行了一些初步测试,以查看 GPU 在 DeepSeek 得出答案时使用了多少能源。这个实验带有许多注意事项:他只测试了 DeepSeek R-1 的中等规模版本,仅使用少量提示。“DeepSeek 是我们能接触到的第一个比较流行的推理模型,”他说。OpenAI 的 o1 模型是其最接近的竞争对手,但该公司不开放供测试。相反,他将其与 Meta 的一款具有相同参数数量(700 亿)的模型进行了测试。询问是否可以撒谎的提示从 DeepSeek 模型中生成了一篇 1000 字的回答,生成这篇回答消耗了 17800 焦耳的能量——大约相当于播放一个 10 分钟的 YouTube 视频所需的能量。这比 Meta 模型回答该提示所使用的能量多了约 41%。总体而言,在 40 个提示的测试中,DeepSeek 被发现与 Meta 模型具有类似的能源效率,但 DeepSeek 倾向于生成更长的回答,因此被发现使用了多 87% 的能源。这与使用常规传统生成式人工智能而非思维链推理的模型相比如何呢?密歇根大学的一个团队在 10 月份的测试发现,Meta 的 Llama 3.1 的 700 亿参数版本平均每回答消耗 512 焦耳。
我们再次强调:还存在许多不确定性。这些是不同用途的不同模型,尚未进行科学合理的研究来比较 DeepSeek 相对于竞争对手的能源使用情况。但仅根据模型的架构就可以清楚地看出,思维链模型在得出更合理的答案时会消耗大量能源。
Hugging Face 的人工智能研究员兼气候主管 Sasha Luccioni 担心,围绕 DeepSeek 的兴奋可能会导致人们急于将这种方法应用到所有地方,即使在不需要的地方也是如此。“如果我们开始广泛采用这种范式,推理能源使用量将急剧上升,”她说。“如果所有发布的模型都更计算密集型,并且采用思维链,那么这将完全抵消任何效率提升。”
特别声明:北极星转载其他网站内容,出于传递更多信息而非盈利之目的,同时并不代表赞成其观点或证实其描述,内容仅供参考。版权归原作者所有,若有侵权,请联系我们删除。
凡来源注明北极星*网的内容为北极星原创,转载需获授权。
4月29日,内蒙古自治区工业和信息化厅发布2025年度绿色制造示范单位推荐工作通知。通知指出,本年度绿色制造示范单位推荐包括绿色工厂、绿色工业园区、绿色供应链管理企业,满足申报条件的单位按照企业主体、政府引导、标准引领和全面覆盖的原则,采取自评价或委托具备评价能力的第三方服务机构开展评
据CNBC报道,科技和能源行业在俄克拉荷马城的哈姆美国能源研究所聚集,讨论美国如何满足人工智能数据中心日益增长的能源需求。亚马逊和英伟达在会议上向石油和天然气高管们表示,为人工智能提供动力的所有选项都在考虑之中,包括像天然气这样的化石燃料。(来源:国际能源小数据作者:ESmallData)大型
2025年4月,交通运输部联合国家发展改革委等十部门发布的《关于推动交通运输与能源融合发展的指导意见》(以下简称《指导意见》),不仅是一份政策文件,更是中国在“双碳”目标下的一场系统性变革的宣言。这份文件以交通与能源的深度融合为核心,试图打破行业壁垒,重塑产业链条,为中国乃至全球的绿
国家电网有限公司2025年第二季度重点工作研讨班强调,全面抓好公司贯彻全国两会精神22项重点工作任务落实。公司各单位围绕“加快发展绿色低碳经济”“积极稳妥推进碳达峰碳中和”,大力推进能源绿色低碳转型,深化碳业务体系建设,服务碳排放双控,助力加快经济社会发展全面绿色转型。能效服务促进企业
您了解“双碳吗”?,关于“双碳”名词有很多很多,看看您见过的还有哪些,欢迎评论留言,共同探讨新名词。一、政策与目标类1.双碳碳达峰指国家或地区在某一年度二氧化碳排放量达到历史最高值后逐步下降,标志着经济增长与碳排放脱钩。中国承诺在2030年前实现碳达峰。碳中和指通过植树造林、碳捕集等技
近日,上海正泰电源系统有限公司获得有国际权威认证机构TÜV南德意志大中华区集团(TÜVSÜD)(以下简称"TUV南德")颁发的iso14067产品碳足迹证书。这一成果标志着正泰电源在低碳领域的卓越成就,为其产品的绿色发展之路再添璀璨光芒。此次认证的产品是可充电锂离子电池(以下简称“集装箱”),依据I
近日,江增重工完全自主研发的单台三级离心式高温热泵压缩机组,圆满完成联调联试,正式投入运行。该机组的诞生,刷新了从研发到交付的新纪录,展现出江增重工卓越的项目执行能力与对市场需求的敏锐捕捉。据测算,该机组每年能为客户创造近千万元的经济效益,并每年减少14000吨碳排放,成为行业绿色低
4月16日,中国极地研究中心极地清洁能源首席科学家、太原理工大学校长孙宏斌表示,随着中国南极秦岭站首个规模化新能源系统启用、《南极清洁能源利用技术十二年发展纲要》发布等,中国技术和理念正推动南极考察快速进入绿色能源时代。“如何在南极实现清洁能源转型是全球科学界的重要议题。”孙宏斌在
日前,山西晋中市政府印发《晋中市碳达峰实施意见》。《意见》提出,到2030年,非化石能源消费比重达到18%,新能源和清洁能源装机占比达到63%以上,森林覆盖率和森林蓄积量稳步增长。单位地区生产总值能源消耗和二氧化碳排放持续下降,在保障能源安全的前提下二氧化碳排放量力争达到峰值。详情如下:晋
北极星电力网获悉,近日,晋中市人民政府印发晋中市碳达峰实施意见的通知。通知提出,实施煤电行业碳达峰行动。充分发挥煤炭“压舱石”和煤电基础性调节作用,统筹煤电发展和保供调峰,继续加强煤炭保供任务日常监测和调度管理,强化电煤中长期合同签约履约监管。夯实煤电机组保供基础,协调督促发电供
创新引领科学有序协同推进新一代煤电高质量发展中国电力企业联合会规划发展部主任张琳长期以来,我国煤电产业在保障能源安全、服务能源电力绿色转型和经济稳定发展中发挥了重要支撑作用。面对加快构建新型电力系统新要求,我国煤电还需在清洁降碳、高效调节等方面系统发力。近日,国家发展改革委、国家
【导语】2025年4月15日,江苏国信滨海港2×1000MW高效清洁燃煤发电项目(以下简称“江苏滨海港项目”)4号机组圆满完成168小时满负荷试运行,标志着这一江苏省“十四五”期间规划建设的重点能源项目(即2024年江苏省能源电力保供“头号工程”)全面实现“双投”目标,是今年江苏省内首台竣工投产的百万
《电力辅助服务市场基本规则》出台全国统一电力市场落下“关键一子”作为全国统一电力市场“1+N”规则体系的关键“一子”,《电力辅助服务市场基本规则》(以下简称《规则》)日前出台,标志电力中长期、现货、辅助服务三大主要交易品种的规则顶层设计基本建立,也标志着我国电力市场改革迈出系统性突
随着国家“双碳”战略目标深入推进,新能源占比持续攀高。截至3月底,浙江光伏装机突破5000万千瓦,同比增长41%,占电源总装机近三分之一。这为绿色发展提供了基础,也让电网调度运行面临新压力。国网浙江电力调控中心值长詹文达介绍,海量新能源接入主要带来三大难题:一是“用不完”,尤其是节假日期
北极星售电网获悉,4月30日,陕西电力交易中心发布2025年3月省间交易结算情况、市场化发电企业预结算情况、用户侧交易结算情况。详情如下:省间交易结算情况2025年3月,主网外送交易结算电量51.13亿千瓦时,同比增加29.31%;主网外购交易结算电量26.48亿千瓦时,同比增加220.97%。2025年截至3月底,主
北极星售电网获悉,4月29日,内蒙古电力交易中心发布市场信息简报。文件显示,截至2025年03月底,内蒙古电力多边交易市场主体数量达到3453家,其中发电企业575家,电力用户2758家,售电公司120家。发电企业中,火电企业69家,风电企业221家,光伏企业259家,一体化项目2家,独立储能10家,六类市场化项
4月29日上午,中国电建集团湖北工程有限公司(以下简称湖北工程公司)智慧能源公司正式揭牌,湖北工程公司党委书记、董事长张涛,副总经理张秋明出席揭牌大会。会上,智慧能源公司负责人从当前组建情况、科技创新工作以及后期工作思路和规划等方面进行了工作汇报。张涛代表湖北工程公司党委对智慧能源
北极星电力网获悉,4月30日,淮河能源公告,淮河能源(集团)股份有限公司(以下简称“公司”)于2025年4月29日召开第八届董事会第十三次会议,审议通过了《关于潘三电厂1、2号机组关停的议案》。潘三电厂为公司下属分公司,现有火电装机容量27万千瓦,包括两台13.5万千瓦级燃煤发电机组(即#1、#2机组
4月28日,汉缆股份发布2024年年报。公司在全年实现营业收入925,973.53万元,同比下降4.12%,归属于上市公司股东的净利润65,512.97万元,同比下降13.81%。报告期末,公司实现资产总额114.45亿元,较上年末增加9.88%;实现归属于上市公司所有者权益81.25亿元,较上年末增加5.83%;报告期末公司资产负债率
北极星电力网整理了2025年4月27日至2025年4月30日一周火电项目,涉及项目的核准、开工、投运等。华润镇雄2×350MW项目三大主机中标公示日前,华润镇雄2×350MW项目三大主机中标公示,镇雄低热值煤炭综合利用项目位于云南省昭通市镇雄县泼机镇庙山村,项目规模为2×350MW。详情点击大唐七台河发电3、4号
北极星电力网整理了2025年4月27日至2025年4月30日一周电力项目:涉及火电、水电、核电项目的核准、开工、并网等。火电项目华润镇雄2×350MW项目三大主机中标公示日前,华润镇雄2×350MW项目三大主机中标公示,镇雄低热值煤炭综合利用项目位于云南省昭通市镇雄县泼机镇庙山村,项目规模为2×350MW。详情
4月23日,由中国能建湖南火电承建的中煤永城2×1000MW高效超超临界机组工程2号机组锅炉钢架第一根立柱吊装就位,标志着2号机组安装工作全面开始。该项目位于河南省商丘市永城市产业集聚区,是“十四五”期间河南省首批重点煤电项目之一,规划建设2台1000兆瓦超超临界深度调峰燃煤发电机组,并同步配套
请使用微信扫一扫
关注公众号完成登录
姓名: | |
性别: | |
出生日期: | |
邮箱: | |
所在地区: | |
行业类别: | |
工作经验: | |
学历: | |
公司名称: | |
任职岗位: |
我们将会第一时间为您推送相关内容!