登录注册
请使用微信扫一扫
关注公众号完成登录
我要投稿
美国麻省理工学院技术评论(MIT Technology Review)网站发表署名James O'Donnell的文章,题目是:DeepSeek might not be such good news for energy after all(DeepSeek对能源来说可能不是好消息)。
(来源:国际能源小数据 作者:E Small Data)
在名为 DeepSeek 的中国人工智能模型成为家喻户晓的名字的一周内,各种说法层出不穷,准确性参差不齐。最引人注目的说法是,DeepSeek 的新方法更加高效,这意味着人工智能或许不再需要消耗目前如此大量的能源。
这种说法具有误导性。初步数据——基于 DeepSeek 较小模型在少量提示下的表现——表明其在生成回答时可能比 Meta 的同等规模模型更耗能。问题可能在于,它在训练过程中节省的能源被其回答问题时更密集的技术,以及由此产生的长篇回答所抵消。再加上其他科技公司受到 DeepSeek 方法的启发,现在可能开始构建自己的类似低成本推理模型,能源消耗的前景就变得更不那么乐观了。
任何人工智能模型的生命周期都有两个阶段:训练和推理。训练是一个通常持续数月的过程,模型在此过程中从数据中学习。随后模型便准备好进行推理,这发生在世界上任何一个人向它提问时。这两个过程通常都在数据中心进行,需要大量能源来运行芯片和冷却服务器。
在训练方面,DeepSeek 团队改进了 R1 模型的所谓“专家混合”技术,即在训练过程中,模型数十亿参数(模型用来形成更好答案的“旋钮”)中只有一部分处于激活状态。更值得注意的是,他们在强化学习方面取得了进步,模型的输出会被打分,然后用来使其变得更好。这通常是由人工标注员完成的,但 DeepSeek 团队在这方面做得很好,实现了自动化。引入一种使训练更高效的方法,似乎表明人工智能公司将使用更少的能源来将其人工智能模型提升到一定标准。然而,事实并非如此。如果公司能从投入中获得更多回报,他们会觉得值得投入更多,因此也会使用更多能源。这就是所谓的杰文斯悖论的一个例子。
但只要人工智能竞赛还在进行,训练方面的这种情况就一直存在。推理所需的能源才是更值得关注的地方。DeepSeek 被设计为推理模型,这意味着它旨在擅长逻辑、模式识别、数学等任务,而这些通常是典型生成式人工智能模型所难以应对的。推理模型通过所谓的“思维链”来实现这一点。它允许人工智能模型将其任务分解成部分,并按逻辑顺序逐步完成,然后得出结论。
我们可以从 DeepSeek 中看到这一点。当被问及是否可以为了保护某人的感情而撒谎时,该模型首先从功利主义角度处理这个问题,权衡眼前的善与潜在的未来伤害。然后它考虑康德伦理学,该学说主张人们应按照能够成为普遍法则的准则行事。它考虑了这些以及其他细微差别,然后才分享其结论。它认为在善良和防止伤害至关重要的情况下,撒谎“通常是可接受的,但不是永远如此”。
在诸如 MMLU 等某些基准测试中,思维链模型往往表现更好,MMLU 测试了 57 个学科的知识和解决问题的能力。但正如 DeepSeek 所显示的那样,它们在得出答案时也需要消耗更多的能源。我们有一些初步线索,了解到底多了多少。
Scott Chamberlin 在微软工作多年,后来在英特尔工作,致力于构建工具以揭示某些数字活动的环境成本。Chamberlin 进行了一些初步测试,以查看 GPU 在 DeepSeek 得出答案时使用了多少能源。这个实验带有许多注意事项:他只测试了 DeepSeek R-1 的中等规模版本,仅使用少量提示。“DeepSeek 是我们能接触到的第一个比较流行的推理模型,”他说。OpenAI 的 o1 模型是其最接近的竞争对手,但该公司不开放供测试。相反,他将其与 Meta 的一款具有相同参数数量(700 亿)的模型进行了测试。询问是否可以撒谎的提示从 DeepSeek 模型中生成了一篇 1000 字的回答,生成这篇回答消耗了 17800 焦耳的能量——大约相当于播放一个 10 分钟的 YouTube 视频所需的能量。这比 Meta 模型回答该提示所使用的能量多了约 41%。总体而言,在 40 个提示的测试中,DeepSeek 被发现与 Meta 模型具有类似的能源效率,但 DeepSeek 倾向于生成更长的回答,因此被发现使用了多 87% 的能源。这与使用常规传统生成式人工智能而非思维链推理的模型相比如何呢?密歇根大学的一个团队在 10 月份的测试发现,Meta 的 Llama 3.1 的 700 亿参数版本平均每回答消耗 512 焦耳。
我们再次强调:还存在许多不确定性。这些是不同用途的不同模型,尚未进行科学合理的研究来比较 DeepSeek 相对于竞争对手的能源使用情况。但仅根据模型的架构就可以清楚地看出,思维链模型在得出更合理的答案时会消耗大量能源。
Hugging Face 的人工智能研究员兼气候主管 Sasha Luccioni 担心,围绕 DeepSeek 的兴奋可能会导致人们急于将这种方法应用到所有地方,即使在不需要的地方也是如此。“如果我们开始广泛采用这种范式,推理能源使用量将急剧上升,”她说。“如果所有发布的模型都更计算密集型,并且采用思维链,那么这将完全抵消任何效率提升。”
特别声明:北极星转载其他网站内容,出于传递更多信息而非盈利之目的,同时并不代表赞成其观点或证实其描述,内容仅供参考。版权归原作者所有,若有侵权,请联系我们删除。
凡来源注明北极星*网的内容为北极星原创,转载需获授权。
入夏以来,全国气温攀升,各地陆续进入迎峰度夏能源保供的关键时期。华润集团坚持服务大局,积极研究部署,压紧压实责任,狠抓措施落实,强化安全管控,旗下华润电力、华润燃气等单位坚守保供一线,有力有序落实落细各项措施,全力以赴保障能源安全稳定供应。华润电力周密部署、有序发力,统筹做好机组
文丨三峡小微作者丨雷海超韩强北极星储能网讯:近期,我国多地高温闷热,局部地区温度超过40摄氏度。高温闷热天气导致能源消耗增多,据国家发展改革委初步预计,今年迎峰度夏期间全国最高用电负荷同比增加约1亿千瓦。三峡集团各“风光”场站聚焦提升电力保供能力,以安全生产为抓手,采取了一系列措施
7月8日,国家发展改革委、工业和信息化部、国家能源局发布《关于开展零碳园区建设的通知》,提出支持有条件的地区率先建成一批零碳园区,有计划、分步骤推进各类园区低碳化零碳化改造,助力园区和企业减碳增效,为实现碳达峰碳中和目标提供坚实有力支撑。近年来,南方电网公司大力推进生态强企建设,加
近日,省政府印发《海南低碳岛建设方案》,海南将通过7大方面重点任务的22项具体措施,力争2030年前实现全省碳达峰,2045年前全面完成海南低碳岛建设,将海南打造成为向世界展示中国低碳发展先进理念、技术和实践成果的窗口。按照《海南低碳岛建设方案》相关安排,2025-2027年为先行示范阶段,海口江东
2024年中央经济工作会议提出“建立一批零碳园区”。今年政府工作报告再次作出明确部署。近日,国家发展改革委、工业和信息化部、国家能源局等部门印发《关于开展零碳园区建设的通知》(发改环资〔2025〕910号,以下简称《通知》),启动国家级零碳园区建设工作,为统筹有序开展零碳园区建设提供重要工
继4月交通运输部与国家发改委等十部门联合印发了交能融合指导意见之后,交通运输部再次携手此前十部门中的三部委,出台与交能融合相关细分领域的规划建设文件。7月7日,国家发展改革委办公厅、国家能源局综合司、工业和信息化部办公厅、交通运输部办公厅联合编制的《关于促进大功率充电设施科学规划建
近日,从湖北省科技厅获悉,国网湖北省电力有限公司电力数智化碳监测与协同减控实验室(以下简称“电碳实验室”)通过湖北省重点实验室认定,成为国家电网有限公司在碳业务领域首个获得认定的省部级重点实验室。电碳实验室由国网湖北电力牵头碳排放权登记结算(武汉)有限公司、湖北方源东力电力科学研
日前,山西阳泉市住房和城乡建设局对《阳泉市加快推动建筑领城节能降碳实施方案(征求意见稿)》公开征求意见:加强可再生能源建筑应用。新建建筑应安装太阳能光伏发电系统,新建公共建筑和工业厂房光伏产品应用面积不低于屋顶总面积的50%,新建居住建筑光伏产品应用面积不低于屋顶总面积的30%。新建建筑
在降低工业能耗和提升可持续性要求日益严格的背景下,运营商是否应重新关注泵的能源效率?对此,苏尔寿中国区服务事业部总经理周敏先生进行了深入探讨。在全球范围内,能源密集型工业部门的产量不断增长。受此驱动,全球能源消耗持续攀升,这使得提升能效的紧迫性日益凸显。国际能源署(IEA)指出,通
ABB电气位于芬兰波尔沃的智慧建筑工厂是首批迈向净零排放和更可持续运营的工厂之一。自2021年以来,这座占地71,000平方英尺的工厂通过数据驱动决策和创新能源管理相结合的方式,显著降低了能源消耗和排放。当地团队采取创新措施,利用环境条件创造优势。例如,ABB首个季节性地热储能系统利用改造的空气
北极星储能网获悉,7月8日,湖南省发改委发布对省十四届人大三次会议0799号建议的答复,提到,推广新能源汽车应用。全省纯电动公共汽电车占比97.48%,新增公交车新能源占比100%,新能源公交推广比例全国领先,纯电动巡游出租车占比55.3%。充电基础设施逐步完善。累计建成充电桩33.61万个,高速公路服务
7月18日,国务院新闻办公室举行新闻发布会,介绍2025年上半年工业和信息化发展情况。工业和信息化部总工程师谢少锋,部新闻发言人、运行监测协调局局长陶青,部信息通信发展司司长谢存出席发布会,介绍相关情况并回答记者提问。上半年工业和信息化事业发展态势良好新型工业化加快推进工业和信息化部总
上半年,中国大唐集团有限公司宁夏分公司紧紧围绕“效益”和“发展”两大任务,积极应对市场变化,不断优化生产经营策略,发电量同比增长23.18%,经营利润同比增长21.77%,顺利实现“双过半”任务目标。该公司深入推进安全生产治本攻坚行动,严格落实安全生产责任制,加强设备运维管理,“一盘棋”统筹
配电网连接着电力主网和千家万户,是电力供应的“最后一公里”,是现代经济社会的重要基础设施和新型电力系统的重要组成部分。国家电网有限公司深入贯彻落实党中央、国务院决策部署,围绕新型电力系统建设要求,持续深化配电网建设改造,提高配电网可靠性和承载力,不断满足人民日益增长的美好生活用电
在河北省怀来县,一座大数据产业基地已然成型。科技感十足的园区内,密集部署的服务器为京津冀的互联网、金融、医疗等企业提供了安全高效的数据存储与计算能力保障。“园区供电设备已验收合格,具备送电条件,服务器随时可以启动。”5月23日,在位于怀来县的阿里云计算数据中心110千伏用户变电站内,张
电池的研发与设计创新模式,正在被重构。中国科学院院士欧阳明高曾预测,锂电下一个十年的技术竞争核心在于材料,而人工智能(AI)正在改变材料的研发范式。欧阳明高院士这一预测,正在被一家有着深厚电池基因和AI技术能力的企业变为现实。(文章来源:电池中国)今年4月底,SESAICorporation(简称“S
为深入贯彻国家电网公司人才强企战略,持续提升培训师资队伍专业素养,助力公司“绿色希冀”品牌建设,6月30日,国网冀北电力党校组织开展了“培训师核心素养提升”专题教研活动。本次活动旨在促进国家电网公司2025年师资队伍能力提升培训先进理念推广,党校管培二部全体培训师参会,共同学习前沿理念
作者:陈海生1李泓2徐玉杰1徐德厚3王亮1周学志1陈满4胡东旭1林海波1,2李先锋5胡勇胜2安仲勋6刘语1肖立业7蒋凯8钟国彬9王青松10李臻11康飞宇14王选鹏15尹昭1戴兴建1林曦鹏1朱轶林1张弛1张宇鑫1刘为11岳芬11张长昆5俞振华11党荣彬2邱清泉7陈仕卿1史卓群1张华良1李浩秒8徐成8周栋14司知蠢14宋振11赵新宇16
最近《人民日报》通过专访任正非对外释放了重要信号。其中也讲到了,AI竞争的背后,是要有充足的电力、发达的信息网络,而中国有这样的优势。可以说,AI的尽头是算力,算力的尽头是电力,这已成为科技行业的共识。本期「电网深谈」邀请了阿里云能源行业首席架构师黄振、浙江省电力负荷管理中心孙钢、浙
2025开年以来,国家发改委与能源局连发两道政策“组合拳”,深刻改写储能行业的发展逻辑。2月出台的“136号文”明确不得将储能配置作为新能源项目核准的前置条件,终结了持续8年的“强制配储”模式,4月落地的“394号文”明确要求2025年底前基本实现电力现货市场全覆盖。即将到来的电力市场格局变化,
6月20日,在2025年国家能源互联网大会上,国网杭州供电公司发布全国首个基于人工智能的配网终端。该配网融合终端硬件上采用小尺寸芯片,支持即插即用,每小时功耗仅7瓦,拥有每秒7万亿次的超强算力。终端以“国网光明大模型”和“DeepSeek”为技术底座,融合自然语言识别模型,具备语音自动转换、知识
在2025年上海SNEC展会之前,“永远不争第一,但永远在第一梯队”所塑造的低调和稳健,是这家企业最明显的标签。但展会开启后,晶澳科技集中曝光了TOPCon组件效率纪录、BC专利技术、钙钛矿叠层技术,直接勾勒出一条横跨未来十年,把组件效率从25%推到30%以上的清晰路径,且有理有据,成果详实,进展惊人
7月20日下午3时58分,华电望亭发电厂二期F级燃气-蒸汽联合循环发电工程6号机组通过168小时试运行,宣告实现商运。试运行期间,主辅设备运行稳定,各项经济指标、技术性能指标优良。电站集团为该项目提供燃气轮机、汽轮机、发电机以及凝汽器设备。相较于传统火力发电设备,重型燃机能够在较短时间内启动
2025年1-6月全国发电设备生产完成情况:一、发电设备产量根据机械工业发电设备中心统计,2025年1-6月全国发电设备生产完成15313.3万千瓦,同比增长67.0%。水电机组:795.5万千瓦,同比增长26.4%。其中单机容量10万千瓦及以上机组687.3万千瓦,占水电机组产量的86.4%;单机容量10万千瓦以下机组108.2万
7月2日13时18分、7月19日11时18分,华润电力浙江公司温州电厂二期项目3号机组、深汕公司3号机组分别成功通过168小时满负荷试运行,正式转入商业运营。温州电厂二期温州电厂二期项目是浙江省“十四五”期间重大支撑性煤电工程、省“千项万亿”工程、“绿保稳”工程,承载着保障电力供应、促进绿色转型的
北极星电力网获悉,7月21日,国电电力披露2025年上半年电量情况。2025年上半年,公司合并报表口径完成发电量2060.26亿千瓦时,上网电量1958.01亿千瓦时,较上年同期分别下降3.61%和3.53%,可比口径较上年同期分别下降2.03%和1.96%;参与市场化交易电量占上网电量的91.84%;平均上网电价409.70元/千千瓦
北极星电力网获悉,近日,陕煤集团发布陕煤电力上高有限公司2×1000MW清洁煤电扩建项目二辅设备采购招标公告,共16项设备,整理如下:1.陕煤电力上高有限公司2×1000MW清洁煤电扩建项目二辅设备采购-包3:高加进出口三通阀设备招标编号:0866-25C2SXQY0507项目概况:陕煤电力上高有限公司2×1000MW清洁
7月19日-7月20日,以“光聚绿能储势而行”为主题的2025光热与新型储能高质量发展交流会在新疆维吾尔自治区哈密市举行。会议由哈密市人民政府、中国能建投资集团主办,大唐新疆发电有限公司、新疆能源铁道职业技术大学、新疆华曜新能源有限公司、兰州大成科技股份有限公司、浙江可胜技术股份有限公司、
2025年2月,国家发展改革委、国家能源局发布《关于深化新能源上网电价市场化改革促进新能源高质量发展的通知》(以下简称“136号文”)明确,坚持市场化改革方向,推动新能源上网电量全面进入电力市场、通过市场交易形成价格。在此背景下,我国新能源行业迈入发展新阶段。(来源:中能传媒能源安全新战
三峡蒙能东胜热电近区(色连)4×1000MW扩建项目烟气脱硫系统EPC总承包招标公告(招标编号:T251100110594)项目所在地区:内蒙古自治区鄂尔多斯市1、招标条件本招标项目三峡蒙能东胜热电近区(色连)4×1000MW扩建项目烟气脱硫系统EPC总承包已获批准,项目资金为自有或自筹资金,招标人为内蒙古三峡蒙能能
1、华电签约262.5MW风电项目7月9日,华电淄博热电有限公司与阳谷县人民政府举行阳谷县二期162.5MW暨三期100MW陆上风电项目合作开发协议签约仪式。2、1585MW!5个风电项目获核准7月10日,内蒙古自治区乌兰察布市发改委核准5个项目,风电总装机容量1585MW,分别为:乌兰察布丰镇市铁合金绿色供电项目(一
近期,8家华能系统内公司获得专利授权、著作权。华能江苏公司4项发明专利获得授权近日,华能江苏公司“一种给煤机出口防积煤装置”“一种汽电双驱汽轮机配电柜智能散热装置”“一种采暖、空调、生活热水三联供装置及控制方法”“一种用光强度检测焊缝表面细微裂缝的装置和方法”4项发明专利获得国家知
近日,重庆市发展和改革委员会关于重庆双桥经开区调峰燃气发电项目核准的批复。该项目新建1台50万千瓦级燃气—蒸汽联合循环发电机组,同步建设烟气脱硝装置,并预留“十五五”期间扩建同容量机组条件。项目单位为京能(重庆)能源有限公司。详情如下:重庆市发展和改革委员会关于重庆双桥经开区调峰燃
请使用微信扫一扫
关注公众号完成登录
姓名: | |
性别: | |
出生日期: | |
邮箱: | |
所在地区: | |
行业类别: | |
工作经验: | |
学历: | |
公司名称: | |
任职岗位: |
我们将会第一时间为您推送相关内容!