登录注册
请使用微信扫一扫
关注公众号完成登录
我要投稿
美国麻省理工学院技术评论(MIT Technology Review)网站发表署名James O'Donnell的文章,题目是:DeepSeek might not be such good news for energy after all(DeepSeek对能源来说可能不是好消息)。
(来源:国际能源小数据 作者:E Small Data)
在名为 DeepSeek 的中国人工智能模型成为家喻户晓的名字的一周内,各种说法层出不穷,准确性参差不齐。最引人注目的说法是,DeepSeek 的新方法更加高效,这意味着人工智能或许不再需要消耗目前如此大量的能源。
这种说法具有误导性。初步数据——基于 DeepSeek 较小模型在少量提示下的表现——表明其在生成回答时可能比 Meta 的同等规模模型更耗能。问题可能在于,它在训练过程中节省的能源被其回答问题时更密集的技术,以及由此产生的长篇回答所抵消。再加上其他科技公司受到 DeepSeek 方法的启发,现在可能开始构建自己的类似低成本推理模型,能源消耗的前景就变得更不那么乐观了。
任何人工智能模型的生命周期都有两个阶段:训练和推理。训练是一个通常持续数月的过程,模型在此过程中从数据中学习。随后模型便准备好进行推理,这发生在世界上任何一个人向它提问时。这两个过程通常都在数据中心进行,需要大量能源来运行芯片和冷却服务器。
在训练方面,DeepSeek 团队改进了 R1 模型的所谓“专家混合”技术,即在训练过程中,模型数十亿参数(模型用来形成更好答案的“旋钮”)中只有一部分处于激活状态。更值得注意的是,他们在强化学习方面取得了进步,模型的输出会被打分,然后用来使其变得更好。这通常是由人工标注员完成的,但 DeepSeek 团队在这方面做得很好,实现了自动化。引入一种使训练更高效的方法,似乎表明人工智能公司将使用更少的能源来将其人工智能模型提升到一定标准。然而,事实并非如此。如果公司能从投入中获得更多回报,他们会觉得值得投入更多,因此也会使用更多能源。这就是所谓的杰文斯悖论的一个例子。
但只要人工智能竞赛还在进行,训练方面的这种情况就一直存在。推理所需的能源才是更值得关注的地方。DeepSeek 被设计为推理模型,这意味着它旨在擅长逻辑、模式识别、数学等任务,而这些通常是典型生成式人工智能模型所难以应对的。推理模型通过所谓的“思维链”来实现这一点。它允许人工智能模型将其任务分解成部分,并按逻辑顺序逐步完成,然后得出结论。
我们可以从 DeepSeek 中看到这一点。当被问及是否可以为了保护某人的感情而撒谎时,该模型首先从功利主义角度处理这个问题,权衡眼前的善与潜在的未来伤害。然后它考虑康德伦理学,该学说主张人们应按照能够成为普遍法则的准则行事。它考虑了这些以及其他细微差别,然后才分享其结论。它认为在善良和防止伤害至关重要的情况下,撒谎“通常是可接受的,但不是永远如此”。
在诸如 MMLU 等某些基准测试中,思维链模型往往表现更好,MMLU 测试了 57 个学科的知识和解决问题的能力。但正如 DeepSeek 所显示的那样,它们在得出答案时也需要消耗更多的能源。我们有一些初步线索,了解到底多了多少。
Scott Chamberlin 在微软工作多年,后来在英特尔工作,致力于构建工具以揭示某些数字活动的环境成本。Chamberlin 进行了一些初步测试,以查看 GPU 在 DeepSeek 得出答案时使用了多少能源。这个实验带有许多注意事项:他只测试了 DeepSeek R-1 的中等规模版本,仅使用少量提示。“DeepSeek 是我们能接触到的第一个比较流行的推理模型,”他说。OpenAI 的 o1 模型是其最接近的竞争对手,但该公司不开放供测试。相反,他将其与 Meta 的一款具有相同参数数量(700 亿)的模型进行了测试。询问是否可以撒谎的提示从 DeepSeek 模型中生成了一篇 1000 字的回答,生成这篇回答消耗了 17800 焦耳的能量——大约相当于播放一个 10 分钟的 YouTube 视频所需的能量。这比 Meta 模型回答该提示所使用的能量多了约 41%。总体而言,在 40 个提示的测试中,DeepSeek 被发现与 Meta 模型具有类似的能源效率,但 DeepSeek 倾向于生成更长的回答,因此被发现使用了多 87% 的能源。这与使用常规传统生成式人工智能而非思维链推理的模型相比如何呢?密歇根大学的一个团队在 10 月份的测试发现,Meta 的 Llama 3.1 的 700 亿参数版本平均每回答消耗 512 焦耳。
我们再次强调:还存在许多不确定性。这些是不同用途的不同模型,尚未进行科学合理的研究来比较 DeepSeek 相对于竞争对手的能源使用情况。但仅根据模型的架构就可以清楚地看出,思维链模型在得出更合理的答案时会消耗大量能源。
Hugging Face 的人工智能研究员兼气候主管 Sasha Luccioni 担心,围绕 DeepSeek 的兴奋可能会导致人们急于将这种方法应用到所有地方,即使在不需要的地方也是如此。“如果我们开始广泛采用这种范式,推理能源使用量将急剧上升,”她说。“如果所有发布的模型都更计算密集型,并且采用思维链,那么这将完全抵消任何效率提升。”
特别声明:北极星转载其他网站内容,出于传递更多信息而非盈利之目的,同时并不代表赞成其观点或证实其描述,内容仅供参考。版权归原作者所有,若有侵权,请联系我们删除。
凡来源注明北极星*网的内容为北极星原创,转载需获授权。
日前,《阳泉市能源领域碳达峰实施方案》印发。方案提出,锚定2060年前实现碳中和的远景目标,按照力争2030年前实现碳达峰目标进行安排部署。关于印发《阳泉市能源领域碳达峰实施方案》的通知各县(区)人民政府、高新区管委会,市直有关单位,各有关企业:为全面贯彻落实市委、市政府关于碳达峰、碳中
6月6日,阳泉市能源局关于印发《阳泉市能源领域碳达峰实施方案》的通知,通知指出,大力推进风光新能源建设。充分利用各类国土空间资源,统筹优化布局,梳理全市风光资源现状及开发潜力。坚持集中式与分布式开发并举,全面推进风电、光伏发电大规模开发利用和高质量发展,逐步带动新能源产业链延伸发展
6月5日,宁夏银川市人民政府办公室关于印发《银川高新区高质量发展实施方案(2025—2027年)》的通知。文件指出,积极招引动力电池、风机叶片、光伏组件等“新三样”及算力服务器等拆解回收利用项目,鼓励发展“互联网+回收”模式,强化全链条数字化监管,推进循环经济产业与合规化、标准化服务体系深
年中电商狂欢季点燃了涪陵这座“物流之城”的夜。凌晨时分,涪陵某快递物流基地灯火通明,包裹飞驰穿梭,快递员一手扫码、一手装车,身旁的电动车正在悄然补电,为这场快递大战蓄力续航。而为这园区供电的,正是华昱欣部署的屋顶光伏系统,正把绿色能源嵌入这条昼夜运转的物流动脉。物流枢纽的绿色转型
北极星储能网获悉,6月6日,阳泉市能源局印发《阳泉市能源领域碳达峰实施方案》,提到,鼓励大数据中心、电动汽车充(换)电站、虚拟电厂运营商以及储能运营商作为市场主体参与用户侧储能项目建设。积极构建多层次智能电力系统调度体系,提高电网调度智能化水平。到2025年,全市实现快速灵活的需求侧响
随着环卫作业智能化浪潮逐步深入,宇通环卫始终坚持为客户提供更优质的数字化管理方案。2024年初推出的安睿通管理工具,凭借车辆实时监控、轨迹回放、上装作业分析、维修保养提醒、驾驶评分等实用功能,已成为众多客户日常管车、用车、养车的智能助手。安睿通的推出,承袭了宇通智慧环卫多年来在数字化
近日,国家电投集团一批新能源项目并网,它们如同跃动的音符,在祖国大地的四面八方奏响绿色发展的交响乐,从大漠戈壁到东海之滨、从高原山麓到平原沃野,国家电投集团以奋进为笔、以创新为墨,不断推动绿色能源高质量发展。内蒙古公司兴安盟突泉县445兆瓦风电项目并网5月30日,内蒙古公司兴安盟突泉县
近日,生态环境部发布的2025年绿色低碳典型案例征集活动获选名单中,沈阳市老虎冲循环经济产业园作为园区类代表入选,成为东北地区唯一入选国家绿色低碳典型案例的园区。该园区由沈阳新基静脉产业园有限公司申报,隶属于沈阳城投集团沈阳新基发展有限公司,致力于推动区域绿色低碳发展。老虎冲循环经济
绿色转型是应对气候变化的必由之路,也是经济社会发展的新引擎。近日,国家发展改革委、国家能源局印发《关于有序推动绿电直连发展有关事项的通知》(以下简称《通知》),系统部署绿电直连,开创了新能源就地就近消纳新模式、新路径,这不仅是深入贯彻习近平总书记关于国家能源安全重要论述,推动提高
近日国家电投集团一批新能源项目并网它们如同跃动的音符在祖国大地的四面八方奏响绿色发展的交响乐从大漠戈壁到东海之滨从高原山麓到平原沃野国家电投集团以奋进为笔、以创新为墨不断推动绿色能源高质量发展内蒙古公司兴安盟突泉县445兆瓦风电项目并网5月30日,内蒙古公司兴安盟突泉县445兆瓦风电项目
5月29日,太原市住房和城乡建设局关于印发《太原市城乡建设领域碳达峰实施方案》的通知,通知指出,优化建筑用能结构。积极推动建筑用能低碳化,全市城镇建筑可再生能源替代率力争达到8%。推进建筑光伏一体化应用,新建公共建筑、新建厂房屋顶光伏覆盖率力争达到50%,积极推动在学校、医院、政府机关等
在推进新能源占比不断提升的新型电力系统构建进程中,煤电正经历着历史性的角色嬗变。今年,国家发展改革委、国家能源局联合印发《新一代煤电升级专项行动实施方案(2025#x2014;2027年)》(以下简称《实施方案》),新一代煤电升级专项行动正式启动,旨在推动传统煤电向“清洁降碳、安全可靠、高效调
作为新能源行业年度顶级盛会,2025上海SNEC展会将于6月11日在国家会展中心盛大启幕。这场被誉为行业风向标的年度展会,已吸引全球超3500家企业确认参展,38万#x33A1;展览规模将汇聚全球新能源领域的前沿技术与创新成果,为产业高质量发展注入强劲动能。在这场全球瞩目的行业盛事中,数字能源产品及风光
近日,山东邹平市供电公司成功在本地部署接入DeepSeek大模型智能引擎,在企业数字化转型道路上迈出坚实一步。邹平市供电公司将DeepSeek大模型智能引擎与电网各专业工作深度融合,实现多维度无缝接入。无论是“数字同事”办公场景,还是内网即时通信(IM)工具,均可实现一键调用大模型,操作简便高效。
一场“智”与“能”的双向奔赴回顾历史,整个人类文明进程始终与能源开发利用紧密相关。如今,能源发展进入资源、环境、气候三重约束期,急需沿着清洁低碳方向进行转型。与此同时,人工智能技术正在蓬勃兴起,加速赋智于千行百业,“‘人工智能+’行动”的字眼更是连续两年见诸全国两会政府工作报告,A
从春晚扭秧歌的机器人,到爆火出圈的DeepSeek,从人形机器人马拉松,到人形机器人格斗大赛,2025年的人工智能(AI)层出不穷、亮点纷呈。有观点认为,中国人工智能正加速驶入“奇点时刻”。人工智能的奇点(AIsingularity)是指一个假想的未来时刻,当人工智能的发展达到了一定程度,它将会快速地自我
在“双碳”战略的指引下,我国正加速构建以新能源为主体的新型电力体系。随着可再生能源占比不断增加,其波动特性对电网灵活调节提出更高要求。虚拟电厂凭借聚合分布式资源、快速响应调控的技术优势,成为破解系统调节难题、提升供电可靠性的关键创新载体。136号文明确提出“培育虚拟电厂等新型市场主
在电力现货市场全面铺开、需求侧管理政策密集出台的背景下,虚拟电厂正经历从政府邀约向市场化运营的深刻转型。近年来,各地积极开展虚拟电厂的探索实践,推动其应用场景实现裂变式拓展,在促进能源高效利用、提升电力系统灵活性等方面展现出巨大潜力。(来源:北极星售电网作者:北极星)2025年5月23
有几件事,让我感受到思维模式的碰撞,于是有了今天这篇文章。(来源:微信公众号“鱼眼看电改”作者:俞庆)第一件事:今天的AI界新闻,字节在GitHub上,以MIT许可证的方式,开放了一个基本具备Coze功能的开源智能体中台,flowgram.AI。用户可以自己部署一个。当然这并不稀奇,因为GitHub上同类的智能
国网江苏省电力有限公司信通公司全力投入大模型技术的探索与应用,最近,通过完成人工智能大模型服务接口调用和智能体开发两种模式的平台部署,实现人工智能大模型适配多元需求,为电力行业的智能化发展开拓出一条崭新的航道。在数字化转型的汹涌浪潮中,人工智能大模型已成为推动各行业创新发展的关键
1网友:投资者_1745718333142今年中国核电预计会有新的核电机组投入运行吗?“感谢您对公司的关注。公司控股的漳州核电1号机组已于2025年1月1日正式投入商运,漳州核电2号机组计划于今年下半年具备商运条件,具体时间敬请关注公司公告。2网友:投资者_1710048600000贵司4月8号公告说4月7号贵公司董事长
作为南疆兵团能源国企的标杆,南疆能源(集团)有限责任公司(以下简称“南能集团”)在新时代的浪潮中,以“破题”之勇、“破局”之智、“落实”之力,走出了一条从传统能源企业向现代能源综合服务集团转型升级的示范之路。其改革实践不仅是对国企改革深化提升行动的生动诠释,更是对“惟改革者进,惟
5月30日,国家能源局召开全国可再生能源电力开发建设月度(5月)调度视频会。国家能源局党组成员、副局长万劲松出席会议并讲话。会议总结了2025年1-4月全国可再生能源发展总体情况,听取了上次月度调度会提出的意见建议落实情况、全国可再生能源重大项目建设进展、风电光伏产业链供需及发展情况,分析
2025年6月10日,山东省烟台市中级人民法院一审公开宣判中国南方电网有限责任公司原党组成员、纪检监察组组长龙飞受贿案,对被告人龙飞以受贿罪判处有期徒刑七年,并处罚金人民币五十万元;对龙飞受贿犯罪所得财物及孳息依法予以追缴,上缴国库。经审理查明:2000年至2023年,被告人龙飞利用担任中国航
近日,云南省能源局发布关于云南省政协第十三届三次会议第0240号提案的答复,其中提出,加强“风光水储”基地规划建设。推进澜沧江、金沙江等流域“风光水(储)一体化”基地建设,打造李仙江、普度河等中小流域“风光水(储)一体化”基地,推进曲靖、红河等火电支撑区域“风光火储一体化”基地建设,
6月10日,国家发改委对《能源规划管理办法(修订征求意见稿)》(以下简称“《办法》”)公开征求意见。《办法》指出:能源规划包括全国综合能源规划、全国分领域能源规划、区域能源规划和省、自治区、直辖市能源规划(以下简称省级能源规划)等。设区的市级人民政府、县级人民政府需要编制能源规划的
5月30日,国家能源局召开全国可再生能源电力开发建设月度(5月)调度视频会。国家能源局党组成员、副局长万劲松出席会议并讲话。会议总结了2025年1-4月全国可再生能源发展总体情况,听取了上次月度调度会提出的意见建议落实情况、全国可再生能源重大项目建设进展、风电光伏产业链供需及发展情况,分析
6月5日,云南省能源局发布关于云南省第十四届人大三次会议第0823号代表建议的答复,其中提到,支持曲靖市推动“源网荷储”一体化发展。省能源局正在组织开展“源网荷储”一体化试点工作,支持曲靖市按照申报条件,组织项目申报试点,先行先试,建设一批“源网荷储”一体化项目。加快推进电网网架建设。
6月6日,云南省能源局就云南省政协第十三届三次会议第739号提案进行答复,其中提到,省能源局将以园区为重点优先发展分布式光伏,充分利用《分布式光伏发电开发建设管理办法》(国能发新能规〔2025〕7号)及其《问答(2025年版》)出台的有力契机,适时出台配套措施,推进发展自然人、非自然人、一般工
截至2025年4月底,安徽省全社会电力装机容量约13114万千瓦,其中火电6341万千瓦、风电1017万千瓦、太阳能4823万千瓦。2025年4月,全社会发电量约292亿千瓦时,同比增长约8.0%。全社会用电量272亿千瓦时,同比增长7.7%。
6月10日,包头市工业和信息化局公布包头2025年5月份全市电力运行情况。截至2025年5月底,全市并网装机容量2083.01万千瓦,较上期新增9.77万千瓦(分布式光伏新增9.77万千瓦)。火电装机1106.97万千瓦(占全市装机容量的53.14%),火电中的公用电厂及自备电厂装机分别为691万千瓦和412.37万千瓦,可再生
“十五五”电力规划需打出全要素协同“组合拳”——第三届新型电力系统高质量发展研讨会观察在日前举办的第三届新型电力系统高质量发展研讨会上,记者获取了一组数据:2024年山东省电力现货市场负电价频率达14%;光伏大规模发展导致蒙东地区电力系统存在130万千瓦的爬坡里程缺口;“十五五”期间,预计
6月9日,嘉兴市发展改革委关于印发《嘉兴市2025年碳达峰碳中和工作要点》的通知,通知指出,大力发展非化石能源,新增火电100万千瓦,光伏80万千瓦;到2025年底,可再生能源发电装机占比64%以上。原文如下:市发展改革委关于印发《嘉兴市2025年碳达峰碳中和工作要点》的通知市级有关部门(单位),各县
请使用微信扫一扫
关注公众号完成登录
姓名: | |
性别: | |
出生日期: | |
邮箱: | |
所在地区: | |
行业类别: | |
工作经验: | |
学历: | |
公司名称: | |
任职岗位: |
我们将会第一时间为您推送相关内容!