登录注册
请使用微信扫一扫
关注公众号完成登录
我要投稿
美国麻省理工学院技术评论(MIT Technology Review)网站发表署名James O'Donnell的文章,题目是:DeepSeek might not be such good news for energy after all(DeepSeek对能源来说可能不是好消息)。
(来源:国际能源小数据 作者:E Small Data)
在名为 DeepSeek 的中国人工智能模型成为家喻户晓的名字的一周内,各种说法层出不穷,准确性参差不齐。最引人注目的说法是,DeepSeek 的新方法更加高效,这意味着人工智能或许不再需要消耗目前如此大量的能源。
这种说法具有误导性。初步数据——基于 DeepSeek 较小模型在少量提示下的表现——表明其在生成回答时可能比 Meta 的同等规模模型更耗能。问题可能在于,它在训练过程中节省的能源被其回答问题时更密集的技术,以及由此产生的长篇回答所抵消。再加上其他科技公司受到 DeepSeek 方法的启发,现在可能开始构建自己的类似低成本推理模型,能源消耗的前景就变得更不那么乐观了。
任何人工智能模型的生命周期都有两个阶段:训练和推理。训练是一个通常持续数月的过程,模型在此过程中从数据中学习。随后模型便准备好进行推理,这发生在世界上任何一个人向它提问时。这两个过程通常都在数据中心进行,需要大量能源来运行芯片和冷却服务器。
在训练方面,DeepSeek 团队改进了 R1 模型的所谓“专家混合”技术,即在训练过程中,模型数十亿参数(模型用来形成更好答案的“旋钮”)中只有一部分处于激活状态。更值得注意的是,他们在强化学习方面取得了进步,模型的输出会被打分,然后用来使其变得更好。这通常是由人工标注员完成的,但 DeepSeek 团队在这方面做得很好,实现了自动化。引入一种使训练更高效的方法,似乎表明人工智能公司将使用更少的能源来将其人工智能模型提升到一定标准。然而,事实并非如此。如果公司能从投入中获得更多回报,他们会觉得值得投入更多,因此也会使用更多能源。这就是所谓的杰文斯悖论的一个例子。
但只要人工智能竞赛还在进行,训练方面的这种情况就一直存在。推理所需的能源才是更值得关注的地方。DeepSeek 被设计为推理模型,这意味着它旨在擅长逻辑、模式识别、数学等任务,而这些通常是典型生成式人工智能模型所难以应对的。推理模型通过所谓的“思维链”来实现这一点。它允许人工智能模型将其任务分解成部分,并按逻辑顺序逐步完成,然后得出结论。
我们可以从 DeepSeek 中看到这一点。当被问及是否可以为了保护某人的感情而撒谎时,该模型首先从功利主义角度处理这个问题,权衡眼前的善与潜在的未来伤害。然后它考虑康德伦理学,该学说主张人们应按照能够成为普遍法则的准则行事。它考虑了这些以及其他细微差别,然后才分享其结论。它认为在善良和防止伤害至关重要的情况下,撒谎“通常是可接受的,但不是永远如此”。
在诸如 MMLU 等某些基准测试中,思维链模型往往表现更好,MMLU 测试了 57 个学科的知识和解决问题的能力。但正如 DeepSeek 所显示的那样,它们在得出答案时也需要消耗更多的能源。我们有一些初步线索,了解到底多了多少。
Scott Chamberlin 在微软工作多年,后来在英特尔工作,致力于构建工具以揭示某些数字活动的环境成本。Chamberlin 进行了一些初步测试,以查看 GPU 在 DeepSeek 得出答案时使用了多少能源。这个实验带有许多注意事项:他只测试了 DeepSeek R-1 的中等规模版本,仅使用少量提示。“DeepSeek 是我们能接触到的第一个比较流行的推理模型,”他说。OpenAI 的 o1 模型是其最接近的竞争对手,但该公司不开放供测试。相反,他将其与 Meta 的一款具有相同参数数量(700 亿)的模型进行了测试。询问是否可以撒谎的提示从 DeepSeek 模型中生成了一篇 1000 字的回答,生成这篇回答消耗了 17800 焦耳的能量——大约相当于播放一个 10 分钟的 YouTube 视频所需的能量。这比 Meta 模型回答该提示所使用的能量多了约 41%。总体而言,在 40 个提示的测试中,DeepSeek 被发现与 Meta 模型具有类似的能源效率,但 DeepSeek 倾向于生成更长的回答,因此被发现使用了多 87% 的能源。这与使用常规传统生成式人工智能而非思维链推理的模型相比如何呢?密歇根大学的一个团队在 10 月份的测试发现,Meta 的 Llama 3.1 的 700 亿参数版本平均每回答消耗 512 焦耳。
我们再次强调:还存在许多不确定性。这些是不同用途的不同模型,尚未进行科学合理的研究来比较 DeepSeek 相对于竞争对手的能源使用情况。但仅根据模型的架构就可以清楚地看出,思维链模型在得出更合理的答案时会消耗大量能源。
Hugging Face 的人工智能研究员兼气候主管 Sasha Luccioni 担心,围绕 DeepSeek 的兴奋可能会导致人们急于将这种方法应用到所有地方,即使在不需要的地方也是如此。“如果我们开始广泛采用这种范式,推理能源使用量将急剧上升,”她说。“如果所有发布的模型都更计算密集型,并且采用思维链,那么这将完全抵消任何效率提升。”
特别声明:北极星转载其他网站内容,出于传递更多信息而非盈利之目的,同时并不代表赞成其观点或证实其描述,内容仅供参考。版权归原作者所有,若有侵权,请联系我们删除。
凡来源注明北极星*网的内容为北极星原创,转载需获授权。
日前,福州发布关于征求《福州市石化化工行业碳达峰实施方案(送审稿)》《福州市钢铁行业碳达峰实施方案(送审稿)》《福州市建材行业碳达峰实施方案(送审稿)》意见的通知。详情如下:关于征求《福州市石化化工行业碳达峰实施方案(送审稿)》《福州市钢铁行业碳达峰实施方案(送审稿)》《福州市建材行
对于现代能源体系来说,传统电力系统好比一条条宽阔的“主动脉”,能源单向流动,稳定却稍显笨重。一旦遇到极端天气、设备故障,可能会“牵一发而动全身”,引发大面积停电事故。同时,随着新能源快速发展,大量风光分布式新能源涌入电网,从而导致传统电网“消化不良”,这就促使微电网应运而生,它是
4月30日,正泰新能发布《2024年可持续发展报告》,系统披露其在可持续发展管理、绿色产品创新、绿色低碳转型、绿色供应链共建等可持续发展领域的实践和成绩。报告显示,2024年正泰新能光伏组件累计出货量超130GW,年均可发绿电约1,690亿千瓦时,相当于减少二氧化碳排放1.6亿吨。公司以技术创新为引擎,
北极星售电网获悉,5月20日,上海市黄浦区人民政府发布对黄浦区三届人大六次会议第0124号提案的答复。答复文件提出,黄浦将继续扩大建筑楼宇数据采集范围,覆盖能源消耗等全生命周期碳排放数据,依托黄浦双碳平台数据建立公共建筑“碳效码”信息库,鼓励企业申报“碳效码”赋码,整合区内数据资源,支
“十五五”是我国经济迈向高质量发展的关键阶段,也是全球能源格局深刻调整的重要时期。在当前和今后一段时间,我国能源电力将持续处于清洁低碳、安全高效转型的大趋势大环境中,如何更加有效地发挥电力在国民经济中的基础和先导作用,促进国家重大发展战略和目标的实现,更好地满足人民群众日益增长的
从保定市中心往西北方向驶去,窗外的风景从楼宇逐渐变成连片的果园,桃花、梨花争相盛开,不远处的工地上更是一派生机勃勃的繁忙景象。那里,便是集团保定西北郊热电厂二期项目(以下简称“保定二期项目”)现场。占地15.14公顷的工地上塔吊林立、机械轰鸣、焊花闪耀,总投资30.26亿元的“能源心脏”正
5月8日,安徽省首个“碳信用账户平台”在淮北市上线,22家“绿色”企业与当地金融机构现场达成近10亿元授信,涵盖节能改造、分布式光伏、碳汇开发等项目。发展绿色金融,“数据孤岛”和信息不对称,是最大难题。该平台上线后,碳强度、碳效率等级等数据,不再单纯只是报表里的枯燥数字,而是能变现的绿
日前,山东省政府办公厅印发《关于加快人工智能赋能重点领域高质量发展的推进方案》,明确了13个重点领域,制定了“人工智能+”应用落地场景与目标任务、重点模型。其中就人工智能+出行的应用场景,明确将开展全省域城市末端无人配送、烟台市全场景无人驾驶、济南新旧动能转换起步区和青岛西海岸新区车
北极星售电网获悉,5月12日,山东省人民政府印发《关于加快人工智能赋能重点领域高质量发展的推进方案》(以下简称《方案》)的通知。《方案》指出,围绕石油化工、煤化工、盐化工,推动生产过程全链条智能控制,优化生产工艺、用能参数,加快垂直大模型在新材料研发与应用中的推广,提升生产研发效率
主要观点:从长期趋势看,我国电力弹性系数将逐步降低。长期而言,我国宏观产业结构转型和内部升级将极大重塑用电结构,经济增长对电力的依赖程度持续降低。进入后工业阶段,电力消费增速与GDP增速比值降至1以下。随着产业结构不断优化,工业比重下降、服务业比重上升,以及技术进步和环保意识增强,能
万物逐绿,春风报喜。在南方五省区,绿色低碳技术加快应用,近零碳建筑焕然一新,绿色发展图景欣欣向荣。今年《政府工作报告》提出,“积极稳妥推进碳达峰碳中和”“建立一批零碳园区、零碳工厂”。近年来,南方电网公司持续提升清洁能源消纳水平和能源利用效率,因地制宜打造近零碳示范区,初步形成评
国网江苏省电力有限公司信通公司全力投入大模型技术的探索与应用,最近,通过完成人工智能大模型服务接口调用和智能体开发两种模式的平台部署,实现人工智能大模型适配多元需求,为电力行业的智能化发展开拓出一条崭新的航道。在数字化转型的汹涌浪潮中,人工智能大模型已成为推动各行业创新发展的关键
1网友:投资者_1745718333142今年中国核电预计会有新的核电机组投入运行吗?“感谢您对公司的关注。公司控股的漳州核电1号机组已于2025年1月1日正式投入商运,漳州核电2号机组计划于今年下半年具备商运条件,具体时间敬请关注公司公告。2网友:投资者_1710048600000贵司4月8号公告说4月7号贵公司董事长
作为南疆兵团能源国企的标杆,南疆能源(集团)有限责任公司(以下简称“南能集团”)在新时代的浪潮中,以“破题”之勇、“破局”之智、“落实”之力,走出了一条从传统能源企业向现代能源综合服务集团转型升级的示范之路。其改革实践不仅是对国企改革深化提升行动的生动诠释,更是对“惟改革者进,惟
5月6日,记者从特来电新能源股份有限公司(以下简称“特来电”)获悉,特来电完成DeepSeek、通义千问大模型的本地部署,并将大模型与充电业务深度结合,成功打造并上线行业首个充电运营AI智能体。特来电相关负责人告诉记者,目前,智能体主要服务于特来电充电站共建合伙人,集成至特来电充电运营平台,
一季度,国家能源集团积极应对能源市场变化,主动顺应市场供需再平衡趋势,完成投资359.5亿元,发电量2964亿千瓦时,新能源发电量日均同比增长21%,光伏发电增速保持领先,实现首季“运营稳、对标优、开门红”。今年以来,国家能源集团攻坚克难,真抓实干,推动经营发展取得新成效。一季度自产煤生产连
今年春节期间,AI大模型DeepSeek的横空出世不知不觉搅动了长假归来的上班族的心情。往年这个时候,很多人仍然会在反复咀嚼乡情的余韵悠长,抑或谈论春晚的精彩桥段。(来源:电联新媒作者:管永生)而今年DeepSeek强势“置顶”春节期间的关键词排行榜,成为了名副其实的“社交硬通货”。不仅让刚复工的
5月11日,作为“数智朔黄”数据赋能平台之一的精益管理系统经过一年的试运行正式投运,目前已智能处理数据业务达到7040条,助力朔黄铁路17项运输指标累计刷新纪录19次。同时经营管控系统和按图运营系统进入全面试运行阶段,标志着“两横一纵”数智朔黄新生态体已经在企业管理实践中得到全面运用,有力
你有没有想过,有一天,电网也能像人一样思考?随着DeepSeek等大模型技术的迅猛发展,人工智能正从幕后走向台前,不再只是辅助工具,而是推动高质量发展的“超级引擎”。在国家政策的强力支持下,人工智能已成为新一轮科技革命和产业变革的关键力量。在这股智能化浪潮中,国家电网奋勇争先,于2024年底
在“双碳”目标驱动下,新型储能产业经历了政策红利推动的爆发式增长,但也因政策波动、低价内卷、技术瓶颈等问题陷入阶段性困境。随着2025年“强制配储”政策正式退出历史舞台,储能行业迎来从“政策驱动”向“市场驱动”的深度转型。与此同时,国内价格战白热化叠加海外市场需求及壁垒激增,中国企业
近日,南方电网生产指挥中心联合广西电网生产指挥中心、超高压天生桥局生产指挥中心等省地级生产指挥中心,深度融合自然语言理解、RAG知识增强、DeepSeek大模型等前沿数字技术,构建生产指挥AI助手体系,研发出南方电网首个生产指挥“电力作业AI监督员”,以人工智能技术赋能一线安全生产。“以前,我
当前,人工智能技术浪潮正以前所未有的速度、广度和深度席卷而来。DeepSeek等大模型深刻影响经济社会发展,推动生产关系变革。人工智能浪潮之下,国家电网正积极探索构建“AI#x2B;电力”新生态,推动电网数字化智能化转型发展。然而,面对不断涌现的外部产品,电网如何搭建人工智能与电网需求之间的桥
5月13日,国电电力廊坊热电世界首例耦合烟气熔盐储热锅炉大板梁顺利完成吊装,为“350MW高效灵活燃煤发电机组关键技术研发与工程示范项目”工程建设奠定了坚实基础。该厂二期项目规划建设2台350兆瓦超临界热电联产机组,投产后,供热面积可达2100万平米,工业蒸汽供应能力每小时达100吨,实现热、电、
5月20日,我国首个国产超级耐热钢机组在大唐山东郓城630℃国家电力示范项目建设现场成功吊装,标志着我国自主研制的马氏体耐热钢首次实现工程化应用,项目机组热效率突破50%大关,供电煤耗降至世界最低水平。“大唐山东郓城项目首次将国产马氏体耐热钢全面应用于主蒸汽管道等关键部位,能够更好承担高
用户侧分时电价政策的四要素:执行范围,时段划分,浮动系数和计算基数,我们已经分析完了前两项的现状。(来源:微信公众号“黄师傅说电”)执行范围部分,什么样的用户该执行分时电价,以及被要求执行分时电价的用户该执行何种分时电价,目前各地都有不同的规定,尤其是商业用户是否要强制执行这一点
5月21日河南省统计局发布2025年4月份全省规模以上工业能源生产情况。4月份,全省规模以上工业原煤、电力同比增长,原油加工同比下降。与3月份相比,原煤生产增速放缓、原油加工降幅扩大、电力生产由降转增。一、原煤、原油加工生产情况原煤生产增速放缓。4月份,全省规模以上工业原煤产量899.64万吨,
5月20日,陕西分公司鲁能韩城5万千瓦复合光伏发电项目开工仪式在陕西省韩城市隆重举行。韩城市重大项目推进专班办公室主任高卫东,韩城市发改委煤炭和能源管理科科长杨海鹏,桑树坪镇人民政府人大主席赵国渊,中国绿发陕西分公司负责人刘树国、副总经理(主持工作)李树刚同志出席开工仪式,项目建设、
华电丹东金山热电二期1×660MW热电联产扩建工程A标段主体施工招标公告(招标编号:CHDTDZ059/19-SG-009)一、招标条件华电丹东金山热电二期1×660MW热电联产扩建工程A标段主体施工项目已批准,招标人为丹东金山热电有限公司,项目资金为自筹。本项目已具备招标条件,现进行公开招标。二、项目规模和招
哈尔滨热电有限责任公司8号炉灵活性改造(低负荷稳燃改造和空气预热器防堵改造)EPC总承包招标公告(招标编号:CHDTDZ094/16-ZB-003)一、招标条件哈尔滨热电有限责任公司8号炉灵活性改造(低负荷稳燃改造和空气预热器防堵改造)EPC总承包项目已批准,招标人为哈尔滨热电有限责任公司,项目资金为自筹
5月20日,贵州金元在织金清洁能源公司现场组织召开国家电投贵州金元织金“上大压小”异地改建项目(2×660兆瓦)1号机组启动验收委员会首次会议。会议讨论通过了有关议程和事项,同意1号机组织进入整套启动试运行。启委会主任委员、贵州金元党委副书记、总经理朱仕祥出席会议并讲话,启委会副主任委员
近日,大唐集团发布【大唐国际发电股份有限公司陡河热电分公司2X660MW燃煤热电联产等容量替代项目智慧燃料建设施工】中标候选人公示。第一中标候选人为丰润建筑安装股份有限公司,投标报价4021149.71元;第二中标候选人为唐山城市建筑工程集团有限公司,投标报价4741253.22元。
北极星电力网统计了五大六小旗下22家“旗舰”上市公司一季度发电量情况。2025年一季度,华能国际、华电国际、国电电力等几家上市公司发电量同比下滑;中国电力、大唐发电同比小幅上涨;与此同时,两大水电巨头长江电力、华能水电发电量均有大幅上涨。国电电力表示,受全国电力供需形势整体宽松,新能源
5月19日17时30分,随着压力表数值稳定达标,云河发电公司天然气热电联产项目首台机组锅炉历经9个小时的严苛测试,3295道焊口零渗漏,锅炉水压试验一次成功,标志着锅炉本体安装圆满完成,为后续机组的调试启动创造了坚实条件,向项目投产迈进关键一步。云河发电公司天然气热电联产项目是广东省“十四五
请使用微信扫一扫
关注公众号完成登录
姓名: | |
性别: | |
出生日期: | |
邮箱: | |
所在地区: | |
行业类别: | |
工作经验: | |
学历: | |
公司名称: | |
任职岗位: |
我们将会第一时间为您推送相关内容!