登录注册
请使用微信扫一扫
关注公众号完成登录
我要投稿
美国麻省理工学院技术评论(MIT Technology Review)网站发表署名James O'Donnell的文章,题目是:DeepSeek might not be such good news for energy after all(DeepSeek对能源来说可能不是好消息)。
(来源:国际能源小数据 作者:E Small Data)
在名为 DeepSeek 的中国人工智能模型成为家喻户晓的名字的一周内,各种说法层出不穷,准确性参差不齐。最引人注目的说法是,DeepSeek 的新方法更加高效,这意味着人工智能或许不再需要消耗目前如此大量的能源。
这种说法具有误导性。初步数据——基于 DeepSeek 较小模型在少量提示下的表现——表明其在生成回答时可能比 Meta 的同等规模模型更耗能。问题可能在于,它在训练过程中节省的能源被其回答问题时更密集的技术,以及由此产生的长篇回答所抵消。再加上其他科技公司受到 DeepSeek 方法的启发,现在可能开始构建自己的类似低成本推理模型,能源消耗的前景就变得更不那么乐观了。
任何人工智能模型的生命周期都有两个阶段:训练和推理。训练是一个通常持续数月的过程,模型在此过程中从数据中学习。随后模型便准备好进行推理,这发生在世界上任何一个人向它提问时。这两个过程通常都在数据中心进行,需要大量能源来运行芯片和冷却服务器。
在训练方面,DeepSeek 团队改进了 R1 模型的所谓“专家混合”技术,即在训练过程中,模型数十亿参数(模型用来形成更好答案的“旋钮”)中只有一部分处于激活状态。更值得注意的是,他们在强化学习方面取得了进步,模型的输出会被打分,然后用来使其变得更好。这通常是由人工标注员完成的,但 DeepSeek 团队在这方面做得很好,实现了自动化。引入一种使训练更高效的方法,似乎表明人工智能公司将使用更少的能源来将其人工智能模型提升到一定标准。然而,事实并非如此。如果公司能从投入中获得更多回报,他们会觉得值得投入更多,因此也会使用更多能源。这就是所谓的杰文斯悖论的一个例子。
但只要人工智能竞赛还在进行,训练方面的这种情况就一直存在。推理所需的能源才是更值得关注的地方。DeepSeek 被设计为推理模型,这意味着它旨在擅长逻辑、模式识别、数学等任务,而这些通常是典型生成式人工智能模型所难以应对的。推理模型通过所谓的“思维链”来实现这一点。它允许人工智能模型将其任务分解成部分,并按逻辑顺序逐步完成,然后得出结论。
我们可以从 DeepSeek 中看到这一点。当被问及是否可以为了保护某人的感情而撒谎时,该模型首先从功利主义角度处理这个问题,权衡眼前的善与潜在的未来伤害。然后它考虑康德伦理学,该学说主张人们应按照能够成为普遍法则的准则行事。它考虑了这些以及其他细微差别,然后才分享其结论。它认为在善良和防止伤害至关重要的情况下,撒谎“通常是可接受的,但不是永远如此”。
在诸如 MMLU 等某些基准测试中,思维链模型往往表现更好,MMLU 测试了 57 个学科的知识和解决问题的能力。但正如 DeepSeek 所显示的那样,它们在得出答案时也需要消耗更多的能源。我们有一些初步线索,了解到底多了多少。
Scott Chamberlin 在微软工作多年,后来在英特尔工作,致力于构建工具以揭示某些数字活动的环境成本。Chamberlin 进行了一些初步测试,以查看 GPU 在 DeepSeek 得出答案时使用了多少能源。这个实验带有许多注意事项:他只测试了 DeepSeek R-1 的中等规模版本,仅使用少量提示。“DeepSeek 是我们能接触到的第一个比较流行的推理模型,”他说。OpenAI 的 o1 模型是其最接近的竞争对手,但该公司不开放供测试。相反,他将其与 Meta 的一款具有相同参数数量(700 亿)的模型进行了测试。询问是否可以撒谎的提示从 DeepSeek 模型中生成了一篇 1000 字的回答,生成这篇回答消耗了 17800 焦耳的能量——大约相当于播放一个 10 分钟的 YouTube 视频所需的能量。这比 Meta 模型回答该提示所使用的能量多了约 41%。总体而言,在 40 个提示的测试中,DeepSeek 被发现与 Meta 模型具有类似的能源效率,但 DeepSeek 倾向于生成更长的回答,因此被发现使用了多 87% 的能源。这与使用常规传统生成式人工智能而非思维链推理的模型相比如何呢?密歇根大学的一个团队在 10 月份的测试发现,Meta 的 Llama 3.1 的 700 亿参数版本平均每回答消耗 512 焦耳。
我们再次强调:还存在许多不确定性。这些是不同用途的不同模型,尚未进行科学合理的研究来比较 DeepSeek 相对于竞争对手的能源使用情况。但仅根据模型的架构就可以清楚地看出,思维链模型在得出更合理的答案时会消耗大量能源。
Hugging Face 的人工智能研究员兼气候主管 Sasha Luccioni 担心,围绕 DeepSeek 的兴奋可能会导致人们急于将这种方法应用到所有地方,即使在不需要的地方也是如此。“如果我们开始广泛采用这种范式,推理能源使用量将急剧上升,”她说。“如果所有发布的模型都更计算密集型,并且采用思维链,那么这将完全抵消任何效率提升。”
特别声明:北极星转载其他网站内容,出于传递更多信息而非盈利之目的,同时并不代表赞成其观点或证实其描述,内容仅供参考。版权归原作者所有,若有侵权,请联系我们删除。
凡来源注明北极星*网的内容为北极星原创,转载需获授权。
作者:陈海生1李泓2徐玉杰1徐德厚3王亮1周学志1陈满4胡东旭1林海波1,2李先锋5胡勇胜2安仲勋6刘语1肖立业7蒋凯8钟国彬9王青松10李臻11康飞宇14王选鹏15尹昭1戴兴建1林曦鹏1朱轶林1张弛1张宇鑫1刘为11岳芬11张长昆5俞振华11党荣彬2邱清泉7陈仕卿1史卓群1张华良1李浩秒8徐成8周栋14司知蠢14宋振11赵新宇16
近日,广东丰顺县印发《丰顺县推进分布式光伏高质量发展实施方案(2025—2030年)》。根据方案,力争到2025年工业园区、新建学校、新建公共机构分布式光伏覆盖率达到50%,交通运输基础设施、农村农房等能装尽装。在2025年至2030年期间,显著提高分布式光伏的覆盖率和应用水平,推动绿色低碳发展,助力
北极星售电网获悉,6月27日,广东梅州丰顺县人民政府发布关于印发《丰顺县推进分布式光伏高质量发展实施方案(2025—2030年)》(以下简称《方案》)的通知。《方案》指出,实政策支持。电价方面,分布式光伏项目上网电价按照国家和省有关规定执行;支持分布式光伏项目参与绿电绿证交易,获得相应收益
近日,山西钢构科工有限公司荣获“Ⅰ型三星”零碳工厂认证证书,继获评“国家级绿色工厂”后,此次通过零碳工厂认证是对公司长期坚持绿色建造、推动低碳发展的高度认可,标志着公司在环境保护和可持续发展方面又迈出了重要一步!零碳工厂是指在温室气体排放核算边界内,通过技术性节能减排、可再生能源
今年6月25日是全国低碳日,主题是“碳路先锋、绿动未来”。近年来,江苏积极践行绿色低碳理念,有效发挥城市、园区、企业等不同主体的主动性和创造性,探索行之有效的经验做法,形成了一批可操作可复制可推广的发展模式和典型经验。现推出江苏绿色低碳发展创新实践企业篇:南京钢铁股份有限公司南钢积
近日,融和元储成功中标湖北国铁轨道交通研究院有限公司(以下简称:湖北国铁研究院)内燃机车新能源改造项目,将为3台DF4内燃机车更换新动力电池系统,每台车搭载4000度电,整车电机额定功率2400kW,牵引重量超4000吨,满载续航里程超160km。这一重要订单的斩获,不仅彰显了公司在绿电交通领域新能源
第三章nbsp;石油行业发展(来源:中能传媒研究院本章作者nbsp;杨永明)(中能传媒能源安全新战略研究院)一、原油供需01原油表观消费量出现同比下降根据中国石油和化学工业联合会的统计数据,2024年,我国原油表观消费量7.64亿吨,同比下降1.0%。2024年,受国内宏观经济结构性调整、替代能源加速发展等
在全球气候变化日益严峻的背景下,国家主席习近平于2020年在联合国大会上宣布了我国的“3060”目标,明确了碳达峰、碳中和(“双碳”)目标的内涵、基本路径和重点任务,“双碳”工作正式上升到国家战略层面。作为实现这一目标的基础性工作,碳排放核算体系的构建和完善尤为重要。碳排放核算是碳管理、
近日,云南电网公司计量中心(以下简称“计量中心”)凭借其近零碳示范园区的创新实践,成功通过南方电网公司验收,并荣获优秀评级,成为南方电网首个获得“碳中和认证”的计量中心。这一成果不仅为云南省绿色低碳转型提供了示范样板,也为南方电网生产类园区的近零碳建设探索出一条可复制、可推广的路径
近日,广西壮族自治区发展和改革委员会、广西壮族自治区工业和信息化厅发布关于2023年度电解铝、水泥、钢铁企业阶梯电价有关事项的通知,详情如下:广西壮族自治区发展和改革委员会广西壮族自治区工业和信息化厅关于2023年度我区电解铝水泥钢铁企业阶梯电价有关事项的通知各市发展改革委、工业和信息化
当前,在可再生能源大量并网的电力系统中,保障电力系统安全稳定经济运行面临着全新挑战。电力系统不仅需要满足每年“迎峰度夏”和“迎峰度冬”期间的高峰用电需求,更需要妥善处理日间净负荷波动对电网的影响。解决这些挑战的一个重要手段是在费率设计和需求侧管理等方面积极探索,制定能够反映电网供
作者:陈海生1李泓2徐玉杰1徐德厚3王亮1周学志1陈满4胡东旭1林海波1,2李先锋5胡勇胜2安仲勋6刘语1肖立业7蒋凯8钟国彬9王青松10李臻11康飞宇14王选鹏15尹昭1戴兴建1林曦鹏1朱轶林1张弛1张宇鑫1刘为11岳芬11张长昆5俞振华11党荣彬2邱清泉7陈仕卿1史卓群1张华良1李浩秒8徐成8周栋14司知蠢14宋振11赵新宇16
最近《人民日报》通过专访任正非对外释放了重要信号。其中也讲到了,AI竞争的背后,是要有充足的电力、发达的信息网络,而中国有这样的优势。可以说,AI的尽头是算力,算力的尽头是电力,这已成为科技行业的共识。本期「电网深谈」邀请了阿里云能源行业首席架构师黄振、浙江省电力负荷管理中心孙钢、浙
2025开年以来,国家发改委与能源局连发两道政策“组合拳”,深刻改写储能行业的发展逻辑。2月出台的“136号文”明确不得将储能配置作为新能源项目核准的前置条件,终结了持续8年的“强制配储”模式,4月落地的“394号文”明确要求2025年底前基本实现电力现货市场全覆盖。即将到来的电力市场格局变化,
6月20日,在2025年国家能源互联网大会上,国网杭州供电公司发布全国首个基于人工智能的配网终端。该配网融合终端硬件上采用小尺寸芯片,支持即插即用,每小时功耗仅7瓦,拥有每秒7万亿次的超强算力。终端以“国网光明大模型”和“DeepSeek”为技术底座,融合自然语言识别模型,具备语音自动转换、知识
在2025年上海SNEC展会之前,“永远不争第一,但永远在第一梯队”所塑造的低调和稳健,是这家企业最明显的标签。但展会开启后,晶澳科技集中曝光了TOPCon组件效率纪录、BC专利技术、钙钛矿叠层技术,直接勾勒出一条横跨未来十年,把组件效率从25%推到30%以上的清晰路径,且有理有据,成果详实,进展惊人
6月20日,国网浙江省电力有限公司杭州供电公司总经理朱炯结合能源电力行业AI实际的应用,在2025国家能源互联网大会上作《人工智能在电网中的探索研究与创新实践》主题报告,报告围绕发展与挑战、创新实践和未来展望三个方面展开。朱炯介绍,从国家层面对人工智能的发展高度重视,尤其是习近平总书记深
北极星储能网获悉,6月23日消息,通辽市人民政府关于印发蒙东(通辽)绿色算力产业发展规划的通知,其中,打造绿色算力中心中提出,鼓励算力中心部署高效IDC设备,推广模块化UPS,支持算力企业探索利用共享储能、储氢、飞轮储能、锂电池等作为多元化储能和备用电源装置。优化算力中心能源、水资源、土
“136号文”出台后,传统的新能源运营模式面临重大挑战:收益波动风险加剧、零电价甚至负电价成为可能;从“多发电”到“巧发电”、“发好电”,商业逻辑的巨变对风机设计和风场运维带来颠覆性挑战;系统消纳能力有限,跨省绿电交易履约难……叠加深远海风电本就面临的造价过高、失效风险大、运维成本
光伏逆变器作为系统的“核心大脑”,不仅承担着“直流变交流”的基础功能,更肩负着电站智能化运行的关键使命。在过去十余年里,行业技术路线主要集中在集中式与组串式之间,微型逆变器一度被忽视。近年来,得益于技术革新与成本优化,微型逆变器的经济性显著提升,叠加全球分布式光伏的迅猛发展,这一
把握人工智能新机遇开启油气智能化发展新篇章中海油研究总院总工程师苏彦春2025年4月25日,中共中央政治局就加强人工智能发展和监管进行了第二十次集体学习。习近平总书记在会上强调,面对新一代人工智能技术快速演进的新形势,要充分发挥新型举国体制优势,坚持自立自强,突出应用导向,推动我国人工
日前,国家发展改革委和国家能源局联合印发《关于深化提升“获得电力”服务水平全面打造现代化用电营商环境的意见》(发改能源规〔2025〕624号),在《关于全面提升“获得电力”服务水平持续优化用电营商环境的意见》(发改能源规〔2020〕1479号)原有“三零”“三省”基础上,进一步强化改革思维、加
中共中央总书记、国家主席、中央军委主席、中央财经委员会主任习近平7月1日上午主持召开中央财经委员会第六次会议,研究纵深推进全国统一大市场建设、海洋经济高质量发展等问题。习近平在会上发表重要讲话强调,建设全国统一大市场是构建新发展格局、推动高质量发展的需要,要认真落实党中央部署,加强
作者:陈海生1李泓2徐玉杰1徐德厚3王亮1周学志1陈满4胡东旭1林海波1,2李先锋5胡勇胜2安仲勋6刘语1肖立业7蒋凯8钟国彬9王青松10李臻11康飞宇14王选鹏15尹昭1戴兴建1林曦鹏1朱轶林1张弛1张宇鑫1刘为11岳芬11张长昆5俞振华11党荣彬2邱清泉7陈仕卿1史卓群1张华良1李浩秒8徐成8周栋14司知蠢14宋振11赵新宇16
6月20日,中国能建建筑集团承建的国电电力大同湖东电厂2×1000兆瓦“上大压小”项目1号机组发电机内定子穿装就位。该工程1号机组发电机定子由定子外机座和内定子组成,外定子已于4月22日就位。本次吊装的内定子外包尺寸长11.5米,宽3.72米,高3.75米,运输重量为341吨,是该工程自开工以来吊装的最重的
华电汕头电厂2×1000MW燃煤发电扩建项目主体施工A标段、主体施工B标段招标公告(招标编号:CHDTDZ041/18-SG-026)一、招标条件中国华电集团有限公司广东公司相关项目华电汕头电厂2×1000MW燃煤发电扩建项目主体施工A标段、主体施工B标段项目已批准,招标人为汕头华电能源有限公司,项目资金为自有资金
山东华电淄博上大压小2×35万千瓦燃煤热电项目主机设备招标公告(招标编号:CHDTDZ005/25-ZJ-001)一、招标条件山东华电淄博上大压小2×35万千瓦燃煤热电项目主机设备项目已批准,招标人为华电淄博热电有限公司,项目资金为自筹。本项目已具备招标条件,现进行公开招标。二、项目规模和招标范围2.1招标
科环集团国能水务蠡县热电2X350MW水岛EPC项目、廊坊热电2×350MW水岛EPC项目电缆打捆采购公开招标中标候选人公示第一中标候选人上海起帆电缆股份有限公司,投标报价436.792100万元;第二中标候选人安徽长城仪表线缆有限公司,投标报价443.653760万元。
北极星电力网获悉,6月27日,华能泰安2×9F级燃气蒸汽联合循环热电联产项目推进会在项目现场举行。华能山东公司总经理、党委副书记黄涛出席仪式并宣布浇筑第一方混凝土。华能泰安燃机项目是山东省重型燃机示范项目、泰安市首个重型燃机项目,是落实华能集团与山东省政府、泰安市政府战略合作协议的重点
国家电力投资集团有限公司二〇二五年度第44批集中招标(中国电力川东北高效清洁煤电综合利用一体化项目2×1000MW新建燃煤机组项目、塔城2×660MW煤电一体化项目第一批辅机)招标公告
2025年6月29日10:28,东莞深燃高埗电厂改扩建项目现场掌声雷动、鞭炮齐鸣。由广州粤能电力科技开发有限公司承担调试的第二套9F级机组(4号机组)成功通过168小时试运行考验,顺利完成商业移交。这一时刻宣告:该项目规划的两套470MW燃气热电联产机组全部实现投产目标!高埗电厂改扩建项目规划总容量为2
大唐哈尔滨第一热电厂1x660MW超超临界热电联产项目全厂桩基检测服务中标候选人公示(招标编号:CWEME-202506LJHYR-F004)第一中标候选人:黑龙江瑞盛建设工程质量检测有限公司,投标报价:896860.00元,工期:满足,质量:良好;第二中标候选人:辽宁水文地质工程地质勘察院有限公司,投标报价:988260
北极星电力网整理了近期火电项目相关的中标公示情况,涉及五大发电、华润集团、三峡集团,详情如下:
请使用微信扫一扫
关注公众号完成登录
姓名: | |
性别: | |
出生日期: | |
邮箱: | |
所在地区: | |
行业类别: | |
工作经验: | |
学历: | |
公司名称: | |
任职岗位: |
我们将会第一时间为您推送相关内容!