登录注册
请使用微信扫一扫
关注公众号完成登录
我要投稿
美国麻省理工学院技术评论(MIT Technology Review)网站发表署名James O'Donnell的文章,题目是:DeepSeek might not be such good news for energy after all(DeepSeek对能源来说可能不是好消息)。
(来源:国际能源小数据 作者:E Small Data)
在名为 DeepSeek 的中国人工智能模型成为家喻户晓的名字的一周内,各种说法层出不穷,准确性参差不齐。最引人注目的说法是,DeepSeek 的新方法更加高效,这意味着人工智能或许不再需要消耗目前如此大量的能源。
这种说法具有误导性。初步数据——基于 DeepSeek 较小模型在少量提示下的表现——表明其在生成回答时可能比 Meta 的同等规模模型更耗能。问题可能在于,它在训练过程中节省的能源被其回答问题时更密集的技术,以及由此产生的长篇回答所抵消。再加上其他科技公司受到 DeepSeek 方法的启发,现在可能开始构建自己的类似低成本推理模型,能源消耗的前景就变得更不那么乐观了。
任何人工智能模型的生命周期都有两个阶段:训练和推理。训练是一个通常持续数月的过程,模型在此过程中从数据中学习。随后模型便准备好进行推理,这发生在世界上任何一个人向它提问时。这两个过程通常都在数据中心进行,需要大量能源来运行芯片和冷却服务器。
在训练方面,DeepSeek 团队改进了 R1 模型的所谓“专家混合”技术,即在训练过程中,模型数十亿参数(模型用来形成更好答案的“旋钮”)中只有一部分处于激活状态。更值得注意的是,他们在强化学习方面取得了进步,模型的输出会被打分,然后用来使其变得更好。这通常是由人工标注员完成的,但 DeepSeek 团队在这方面做得很好,实现了自动化。引入一种使训练更高效的方法,似乎表明人工智能公司将使用更少的能源来将其人工智能模型提升到一定标准。然而,事实并非如此。如果公司能从投入中获得更多回报,他们会觉得值得投入更多,因此也会使用更多能源。这就是所谓的杰文斯悖论的一个例子。
但只要人工智能竞赛还在进行,训练方面的这种情况就一直存在。推理所需的能源才是更值得关注的地方。DeepSeek 被设计为推理模型,这意味着它旨在擅长逻辑、模式识别、数学等任务,而这些通常是典型生成式人工智能模型所难以应对的。推理模型通过所谓的“思维链”来实现这一点。它允许人工智能模型将其任务分解成部分,并按逻辑顺序逐步完成,然后得出结论。
我们可以从 DeepSeek 中看到这一点。当被问及是否可以为了保护某人的感情而撒谎时,该模型首先从功利主义角度处理这个问题,权衡眼前的善与潜在的未来伤害。然后它考虑康德伦理学,该学说主张人们应按照能够成为普遍法则的准则行事。它考虑了这些以及其他细微差别,然后才分享其结论。它认为在善良和防止伤害至关重要的情况下,撒谎“通常是可接受的,但不是永远如此”。
在诸如 MMLU 等某些基准测试中,思维链模型往往表现更好,MMLU 测试了 57 个学科的知识和解决问题的能力。但正如 DeepSeek 所显示的那样,它们在得出答案时也需要消耗更多的能源。我们有一些初步线索,了解到底多了多少。
Scott Chamberlin 在微软工作多年,后来在英特尔工作,致力于构建工具以揭示某些数字活动的环境成本。Chamberlin 进行了一些初步测试,以查看 GPU 在 DeepSeek 得出答案时使用了多少能源。这个实验带有许多注意事项:他只测试了 DeepSeek R-1 的中等规模版本,仅使用少量提示。“DeepSeek 是我们能接触到的第一个比较流行的推理模型,”他说。OpenAI 的 o1 模型是其最接近的竞争对手,但该公司不开放供测试。相反,他将其与 Meta 的一款具有相同参数数量(700 亿)的模型进行了测试。询问是否可以撒谎的提示从 DeepSeek 模型中生成了一篇 1000 字的回答,生成这篇回答消耗了 17800 焦耳的能量——大约相当于播放一个 10 分钟的 YouTube 视频所需的能量。这比 Meta 模型回答该提示所使用的能量多了约 41%。总体而言,在 40 个提示的测试中,DeepSeek 被发现与 Meta 模型具有类似的能源效率,但 DeepSeek 倾向于生成更长的回答,因此被发现使用了多 87% 的能源。这与使用常规传统生成式人工智能而非思维链推理的模型相比如何呢?密歇根大学的一个团队在 10 月份的测试发现,Meta 的 Llama 3.1 的 700 亿参数版本平均每回答消耗 512 焦耳。
我们再次强调:还存在许多不确定性。这些是不同用途的不同模型,尚未进行科学合理的研究来比较 DeepSeek 相对于竞争对手的能源使用情况。但仅根据模型的架构就可以清楚地看出,思维链模型在得出更合理的答案时会消耗大量能源。
Hugging Face 的人工智能研究员兼气候主管 Sasha Luccioni 担心,围绕 DeepSeek 的兴奋可能会导致人们急于将这种方法应用到所有地方,即使在不需要的地方也是如此。“如果我们开始广泛采用这种范式,推理能源使用量将急剧上升,”她说。“如果所有发布的模型都更计算密集型,并且采用思维链,那么这将完全抵消任何效率提升。”
特别声明:北极星转载其他网站内容,出于传递更多信息而非盈利之目的,同时并不代表赞成其观点或证实其描述,内容仅供参考。版权归原作者所有,若有侵权,请联系我们删除。
凡来源注明北极星*网的内容为北极星原创,转载需获授权。
近日,山东环保旗下鲁控数字技术(山东)有限公司(以下简称“鲁控数字”)成功研发“零碳园区能碳管理平台”,以数字化、智能化手段赋能园区及企业,实现能源消耗和碳排放的精准计量、精细管控和智能决策,构建园区全方位的能碳管理体系,助力产业园区绿色低碳转型实现新突破。“零碳园区能碳管理平台
2019年7-8月,中央生态环境保护督察组对福建省开展第二轮生态环境保护督察,指出福州市存在“能耗总量控制指标”问题。福州市采取多种措施认真整改,2025年2月,经省级核查,确认福州市存在的问题已整改完成,同意验收销号。根据上级有关规定,现将整改情况予以公示:一、督察指出问题中央生态环境保护
日前,北京市发改委发布北京市可再生能源开发利用条例,文件指出,市发展改革部门应当会同经济和信息化、规划和自然资源、住房城乡建设、城市管理、农业农村等部门,推进建设下列可再生能源发电项目:(一)分布式光伏发电项目;(二)在具备条件的关停废弃矿区、垃圾填埋场和荒滩、荒坡等未利用地建设
在5-6C超快充技术步入规模化应用阶段的当下,国内电动汽车补能技术的发展却已呈现出向更高功率等级演进的趋势。近期,包括宁德时代、华为、比亚迪在内的行业主要参与者相继发布了“兆瓦级”充电解决方案,宣称功率高达1兆瓦乃至1.5兆瓦,远超当前主流水平。这一动向表明,相关企业正着眼于下一代大功率
为全面贯彻党的二十大和二十届二中、三中全会精神,认真落实党中央、国务院决策部署,推动热泵行业高质量发展,助力重点领域节能降碳,近日,国家发展改革委会同工业和信息化部、生态环境部、住房城乡建设部、交通运输部、国家能源局等部门联合印发《推动热泵行业高质量发展行动方案》(发改环资〔2025
北极星氢能网获悉,近日,北京市十六届人大常委会第十六次会议表决通过了《北京市可再生能源开发利用条例》(以下简称《条例》),自今年5月1日起施行。文件提出:本市科学布局和建设可再生能源制氢、加氢基础设施,拓展氢能在发电、供热、交通等领域的应用。利用可再生能源生产的燃气、热力、氢,符合
来源:《中国电力》2025年第2期引文:许文俊,马刚,姚云婷,等.考虑绿证-碳交易机制与混氢天然气的工业园区多能优化调度[J].中国电力,2025,58(2):154-163.编者按目前,全球变暖和能源短缺问题引起了世界各国的广泛关注,中国为此提出“双碳”目标。工业生产作为碳排放和能源消耗的主要来源,实现工业园区
近日,国家发展改革委等部门发布《关于促进可再生能源绿色电力证书市场高质量发展的意见》,明确对数据中心等实行绿证强制消费要求。数据中心是承载算力、发展人工智能的关键基础设施,具有高能耗的特性。在加快发展新一代人工智能和实现“双碳”目标的双重驱动下,算力和绿色电力的协同发展亟待加强。
北极星售电网获悉,2025年3月26日,北京市第十六届人民代表大会常务委员会第十六次会议通过《北京市可再生能源开发利用条例》。文件明确,市加强与其他地区的能源合作,支持可再生能源基地和可再生能源电力输送通道建设,通过政府间合作协议等方式拓宽可再生能源电力来源;鼓励和支持开展跨区域绿色电
北极星垃圾发电网获悉,北京市人大常委会发布《北京市可再生能源开发利用条例》,本条例适用于本市行政区域内太阳能、地热能、风能、水能、生物质能、空气能等可再生能源的开发利用及相关管理活动。自2025年5月1日起施行。全文如下:北京市可再生能源开发利用条例(2025年3月26日北京市第十六届人民代
北极星氢能网获悉,3月20日,塞浦路斯能源、商业与工业部长乔治斯·帕帕纳斯塔修(GiorgosPapanastasiou)在英国驻塞浦路斯高级专员公署与Ideopsis公司主办的“储能与氢能解决方案大会”上发表演讲。他表示,在全球能源格局加速变化的背景下,各国都在调整能源战略,以确保能源安全、降低成本并推动绿
北极星氢能网获悉,近日,中国石油天然气管道工程有限公司联合管道科学研究院召开《康保输氢管道材料性能确定及评估技术研究》课题阶段讨论会,深入研究钢管及环焊缝氢相容性试验课题。该课题基于国内距离最长、规模最大的输氢管道——康保-曹妃甸输氢管道项目开展,用以支撑该项目建设,助力管道局在
4月7日,工业和信息化部公布了全国168个万兆光网试点入围项目,覆盖“万兆小区”“万兆工厂”“万兆园区”三类试点。国能清远电厂成功入围试点名单,成为广东省5个“万兆工厂”试点之一,也是广东省唯一入围的电厂。全国仅有2家电厂入围。万兆光网是继千兆光纤网络之后的下一代光网络技术的升级演进方
今年全国两会,科技创新是当之无愧的焦点,新质生产力、“人工智能+”等科技创新领域的关键词被持续热议。人工智能正加速与实体经济深度融合,不断赋能传统产业,催生新兴产业和未来产业。万里长风在百米叶片上舞出新韵律,滚滚乌金在斗轮机上迸发新能量,千丈水头在智能闸门前激荡新乐章,万道阳光在
2025年初,“136号文”的发布吹响了新能源全面参与电力市场的号角;Deepseek横空出世引发的AI平权化浪潮,则让信息安全要求严格的能源企业用上了低成本私有大模型,风电的生产运营又一次来到了拐点时刻。在这两大因素的交织影响下,“十五五”期间的风电生产会是什么模样?我们又将如何面对这一行业巨
3月28日-30日,中国电动汽车百人会(2025)论坛在京成功召开。会上,中国电动汽车百人会副理事长、中国科学院院士欧阳明高在百人会理事会暨汽车产业发展形势与政策研讨会上发表总结,主题为《从新能源汽车革命演进过程看汽车产业竞争态势与趋势》,以下是他的发言原文,略有编辑节选。01从2021-2025年
3月31日,陕投电力运营开展“DeepSeek”人工智能应用专题培训,帮助员工掌握AI工具使用技能,切实提升办公效率与创新能力。此次培训重点围绕文本起草、文件审批等日常办公场景,系统讲解DeepSeek智能系统在快速生成文档、智能分析文本等场景的应用方法,现场演示了如何通过优化提问方式,高效完成安全
“之前从现场确定到最终答复,写一份供电方案需耗费供电员工大量时间,现在使用基于光明电力大模型的AI智能体后,供电方案生成时间从数小时压缩至几分钟,还通过标准化输出减少人为误差,提高了工作效率和准确性。”3月31日,国网甘肃白银供电公司城区分公司业扩报装员王奇说。自DeepSeek爆火以来,国
“分析一下2025年春节期间聊城地区电力客户诉求。”3月19日,山东聊城供电公司供电服务指挥中心工作人员贾凯莉在对话框中,询问该公司自主研发的AI数智员工“供指小研”。不到20秒,“供指小研”就用图表和文字的“双模式”输出了服务质量、客户满意程度、热点诉求等关键数据,客观展示了2025年春节期
3月31日,深圳市科技创新局关于征集2025年度深圳市重点产业研发计划备选课题(第一批)的通知。包括新能源专项,重点支持方向包括新型储能技术、新一代核能技术、新能源汽车、能源数字化与智能化、氢能技术、可再生能源高效利用。深圳市重点产业研发计划单个项目资助强度最高不超过3000万元。受科技研
三月底,工商业储能市场价格战硝烟再起。短短十天内,弘正储能报出“0.486元/Wh”、长园能源给出“0.478元/Wh”的价格,两度刷新了今年一月份博时储能打出的“0.499元/Wh”储能系统最低价。要知道,不到一年前,工商储每瓦时价格还维持在0.8元以上。去年六月,明美新能源以0.72元/Wh创下当时业内新低价
算电协同有望成为电力消费新增长点——2025年经济形势与电力发展分析预测会观察在宏观经济长期向好,人工智能迅猛发展推动技术能级不断跃迁下,“AI的尽头是算力,算力的尽头是电力”得到广泛认同。算力、电力协同有望成为电力消费的新增长点。3月26日,在中国电力企业联合会(以下简称“中电联”)举
北极星电力网获悉,近日,双良节能公告称,于近日收到《中标通知书》,中标内蒙古能源集团金山发电厂2×66万千瓦煤电扩建项目、包头地区2×66万千瓦煤电项目主机间接空冷系统采购项目,中标总金额为2.48亿元,预计占公司2023年度经审计营业收入的比重为1.07%。内蒙古能源集团金山发电厂2x66万千瓦煤电
近日,国家能源集团“复杂发电工程数字化设计建造关键技术及应用”项目顺利通过中国机械工业联合会组织的科技成果鉴定,该项目开发出完全自主可控的BIMBase图形引擎,实现了引擎及平台的全国产化,完成了在新能源、水电、火电等典型发电工程的示范应用,整体达到国际领先水平,为能源行业数字化转型注
目前,多个省市已发布2025年重点项目清单,其中甘肃、陕西、宁夏、江西、北京、山东、广东、四川、福建、河南、上海的项目清单中共包含41项超高压项目。甘肃省超高压项目最多,达到11项,分别是甘肃陇东直流配套火电750千伏输变电工程、750千伏陇东换流站接入工程陇南市2025年330千伏及以下电网基建项
近日,湖南省发改委公布2025年省重点建设项目、省重点前期工作项目名单。省重点建设项目289个,省重点前期工作项目51个。其中包含宁夏-湖南直流输电工程(湖南段)、陕煤汨罗2×100万千瓦燃煤发电工程、岳阳岳州2×100万千瓦燃煤发电工程项目、大唐华银株洲2×100万千瓦扩能升级改造项目、陕煤石门2×6
一、市场成员情况2025年3月市场主体信息:截至2025年3月底,内蒙古电力多边市场主体数量达到3453家,其中发电企业575家,电力用户2758家,售电公司120家。发电企业中,火电企业69家,风电企业221家,光伏企业259家,一体化项目2家,10家独立储能,13家六类市场化项目;发电企业参与市场容量:火电4047.5
北极星电力网获悉,4月9日,国投电力公告称,决定对公司第十二届董事会职工董事、第十二届监事会职工监事进行调整,张仔建先生不再担任公司职工董事,赵利君先生不再担任公司职工监事。选举尚中华先生为公司第十二届董事会职工董事,任期自选举通过之日起至本届董事会换届之日止;选举胡江春女士为公司
今年3月6日,全国温室气体自愿减排交易市场首批核证自愿减排量,总计9个项目的948万吨二氧化碳当量完成登记,随后从3月7日起首批CCER启动交易。到4月7日,CCER交易已经“满月”。自愿碳市场目前覆盖了哪些领域?各类主体参与交易将带来什么效果?未来自愿碳市场将如何进一步发挥作用?记者进行了相关采
4月7日,工业和信息化部公布了全国168个万兆光网试点入围项目,覆盖“万兆小区”“万兆工厂”“万兆园区”三类试点。国能清远电厂成功入围试点名单,成为广东省5个“万兆工厂”试点之一,也是广东省唯一入围的电厂。全国仅有2家电厂入围。万兆光网是继千兆光纤网络之后的下一代光网络技术的升级演进方
2025年3月份,全国工业生产者出厂价格同比下降2.5%,环比下降0.4%;工业生产者购进价格同比下降2.4%,环比下降0.2%。一季度,工业生产者出厂价格和购进价格比上年同期均下降2.3%。一、工业生产者价格同比变动情况3月份,工业生产者出厂价格中,生产资料价格下降2.8%,影响工业生产者出厂价格总水平下降
国家电投集团河南公司豫新发电6号机组低负荷供热改造项目招标公告
宁夏电力平罗公司660MW超超临界机组20%负荷灵活性调峰技术研究与应用服务公开招标项目中标候选人公示第一中标候选人:国能沪电(上海)工程技术有限公司,投标报价:2599.000000万元。第二中标候选人:东方电气(成都)工程设计咨询有限公司,投标报价:2631.000000万元。
请使用微信扫一扫
关注公众号完成登录
姓名: | |
性别: | |
出生日期: | |
邮箱: | |
所在地区: | |
行业类别: | |
工作经验: | |
学历: | |
公司名称: | |
任职岗位: |
我们将会第一时间为您推送相关内容!