登录注册
请使用微信扫一扫
关注公众号完成登录
何为非结构化数据及数据治理
非结构化数据是数据结构不规则或不完整,没有预定义模型的数据。在企业的整体数据架构中,非结构化数据往往是指不适用于数据库二维关系逻辑表表达的数据,包括所有格式办公文档、工程图纸、图像和音视频文件等。在国家电网有限公司数据资产中,非结构化数据包括由地理信息系统、95598客服系统、项目管理系统、电子商务平台等产生的地理信息数据、客服语音、项目资料、物资采购信息等数据。
数据治理是指在管理数据资产过程中行使权力,包括计划、监控和实施三个步骤。数据治理聚焦如何制订有关数据的决策、人员在数据管理方面的行为方式,确保根据数据管理制度和最佳实践正确地管理数据。
非结构化数据治理统筹和协调非结构化数据各项管理工作有序开展,核心要素体现在组织、制度、文化和考核四个方面,这些是开展非结构化数据管理工作的关键。
电网企业非结构化数据治理的前景和挑战
公司于2019年开展数据中台建设,2022年数据中台迈入深化运营阶段,非结构化数据通过非结构化组件基本实现了集中存储,满足基于文档全周期的存、取、用需求。电网企业的非结构化数据贯穿于发电、输电、变电、配电、用电和调度所有环节,也几乎存在于企业经营管理的所有业务应用当中。随着人工智能等信息处理技术发展,非结构化数据管理的内涵及外延都在发生深刻变化,有必要重新审视当前企业非结构化数据管理现状,规划新时期非结构化数据管理体系及实施路径。电网企业非结构化数据治理工作主要面临着以下挑战:
存在信息孤岛。电网企业在日常经营管理和业务管理过程中使用功能各异的应用系统或信息化管理平台,产生各种非结构化数据。这些非结构化数据具有来源多、格式多、涉及专业多等特点,这一方面是由于信息系统的建设具有阶段性,另一方面是由于各个系统自成体系,导致系统之间的数据呈现孤立状态,数据标准不统一,缺少数据贯通接口。
管控体系不完善。电网企业部分系统之间实现了文件之间的流转,但是非结构化数据管理方法和制度仍然不够完善,如部分文件在各个系统内归档管理、流转主要基于数据导出方式,难以进行统一检索和共享利用。
存在数据黑盒。当前电网企业文档管理制度并非建立在彻底理清数据的基础上。非结构化数据缺少必要的分类和元数据项,缺乏清晰和规范的管理流程和要求,数据量和数据内容难以掌握,影响非结构化数据价值发挥。
电网企业非结构化数据治理工作探索与实践
国网大数据中心遵循公司数据发展战略,以充分发挥数据作用、驱动企业数字化转型为目标,按照“基于中台、统筹推进、统一纳管、安全共享”的工作原则,把核心非结构化数据资源汇聚至数据中台,形成全生命周期和全业务系统端到端非结构化数据治理思路,建立从非结构化元数据体系研究与数据资源目录构建到非结构化数据协同治理的工作模式,推动中台非结构化数据质量提高,为业务工作赋能。
非结构化数据的全生命周期管理包括非结构化数据采集、传输、存储、交换等各个环节的数据集整体管理,以及各个数据项处理方法。
基于数据中台开展非结构化数据统一存储。基于数据中台非结构化组件集中存储和管理所有接入业务应用系统的非结构化数据。将非结构化存储空间划分为存储区和共享区,其中存储区用于接入、存储源业务系统非结构化数据,相关数据满足各专业系统对本系统非结构化数据全生命周期的存、取、用需求。共享区汇聚具有高共享价值的非结构化数据,相关数据经数据盘点、业务部门确认,用于跨专业跨系统数据共享和构建数据服务,并在数据资源目录可视可查。
建立元数据管理体系。将非结构化数据的元数据分为基础元数据和增强元数据,梳理形成非结构化数据元数据体系。其中基础元数据参考国家标准《信息与文献都柏林核心元数据元素集》(GB/T25100-2010),实现对非结构化数据对象的规范定义,如标题、来源、摘要等。增强元数据依据应用业务需求进行设计,包含源端系统业务元数据、管理元数据及操作元数据。采用统分统管原则,基础元数据统一管理,增强元数据按需设计,形成一套完整的元数据管理体系。
打造中台非结构化数据共享区,实现文件流转与共享。新建应用系统基于数据中台建设,存量业务应用系统逐步按需将非结构化数据迁移至数据中台,基于数据中台非结构化组件,统筹不同应用系统的文件在数据中台流转与共享。通过数据中台构建文件智能分析能力,使各使用方可以快速检索并在不同应用系统之间传递所需文件,保证文件的准确性、一致性、及时性、安全性等,支撑非结构化数据在不同专业之间、端到端有序高效地传递和交互。
开展质量管理。依据数据在生命周期各个阶段的特性,建立数据质量控制机制,及时发现非结构化数据质量问题,提升数据可用性。数据使用方在使用过程中提出数据质量需求或数据质量问题,协同数据管理方、数据提供方进行数据质量治理,开展非结构化数据治理流程管控,实现非结构化数据治理闭环管理。
建立常态运营机制,建设多元化应用样板间。完善非结构化数据运营机制,常态开展非结构化数据需求受理、解决方案制订、数据接入、数据溯源、数据共享等工作。专项推进建设多元化应用样板间,聚焦制度标准管理体系开展数字化赋能建设,扩大技术资料、标准制度等公开数据接入范围,满足基层用户查数据、用数据需求;围绕项目中台智能化提升工作,构建非结构化数据提取功能和专题检索服务,辅助项目过程材料智能审查,改变现有线下传递、低效审阅的局面。
(作者单位:国家电网有限公司大数据中心)
特别声明:北极星转载其他网站内容,出于传递更多信息而非盈利之目的,同时并不代表赞成其观点或证实其描述,内容仅供参考。版权归原作者所有,若有侵权,请联系我们删除。
凡来源注明北极星*网的内容为北极星原创,转载需获授权。
北极星售电网获悉,4月15日,浙江电力交易中心发布关于规范分布式新能源发电企业、分布式新能源聚合商规范注册入市的通知。文件明确,原在浙江电力交易平台注册为“发电企业”类型的分布式新能源发电企业应注册为“分布式电源”类型;分布式电源应与电网企业签订负荷确认协议或并网调度协议,根据电压
近日,中共中央办公厅、国务院办公厅发布《关于完善价格治理机制的意见》。《意见》要求,分品种、有节奏推进各类电源上网电价市场化改革,稳妥有序推动电能量价格、容量价格和辅助服务价格由市场形成,探索建立促进改革平稳推进的配套制度。截至2024年底,包括风电、太阳能发电以及生物质发电在内的中
虚拟电厂近年来已成为能源转型的焦点,各类主体围绕顶层设计、市场模式、应用落地方面加快探索。政策方面,国家层面近一年来出台的电力需求侧管理、电力市场、配电网发展、新型主体发展等相关政策中均有条款提及虚拟电厂,涵盖其发展方向、功能作用、参与市场方式等多个方面;山西、宁夏、上海、广东等
北极星售电网获悉,4月15日,山东省人民政府新闻办公室举行新闻发布会,介绍山东深化分时电价改革,促进新能源消纳和惠企利民情况。近年来,通过进一步完善充电桩分时电价政策,山东省加快充电基础设施建设布局,以道路交通网络为依托,以“两区”(居住区、办公区)、“三中心”(商业中心、工业中心
北极星售电网获悉,4月15日,上海市发展和改革委员会发布关于印发《优化我市非电网直供电价格政策的工作指引》(以下简称《指引》)的通知。《指引》指出,非电网直供电终端用户用电价格可按照“基准电价+上浮幅度”确定。具体如下:基准电价为非电网供电主体向电网企业购电的平均购电价,平均购电价按
如今,清洁能源已经遍布世界各个角落,储能也在走入千行万业。但其实在用户端,储能还有更多的潜在市场机遇有待挖掘。ESIE2025第13届储能国际峰会暨展览会期间,欣旺达储能的移动储能车从广东惠州跋涉5000#x2B;公里亮相北京,掀起储能应用的新浪潮。在“移动”的支撑下,储能技术除了发挥以往削峰填谷
4月12日,国家电网旗下上市公司国电南瑞和国网英大分别发布《关于控股股东筹划国有股份无偿划转暨控股股东拟发生变更的进展公告》和《关于国有股份无偿划转的提示性公告》等系列公告。根据公告信息:(1)国网电科院拟将其全资子公司南瑞集团持有的国电南瑞4,135,564,206股股份(占公司总股本的51.49%
为进一步发挥分时电价信号作用,鼓励和引导企业节假日连续生产和错峰用电,缓解电力阶段性供大于求的现象,促进光伏等新能源消纳,降低企业用电成本,省发改委制定了重大节假日工商业深谷电价政策。一、政策出台背景从分时电价体系完整性来看,我省现行分时电价虽然“高峰之上有尖峰”,但是“低谷之下
北极星风力发电网获悉,近期,辽宁省发改委、农业厅、国网辽宁省电力有限公司联合发布《关于开展“千乡万村驭风行动”助力辽宁美丽乡村建设试点工作的通知》。通知指出,要统筹风能资源、接入能力、乡村基础条件,按照“能建则建、试点先行、条件成熟一个就实施一个,不一窝蜂、不一哄而上”的基本原则
PART.01本周市场综述市场供需趋势市场供需趋势,本周网供电量环比上周下降5.39%,水电上网电量环比上周上升2.45%,火电上网电量环比上周下降11.57%,新能源上网电量环比上周下降13.49%,外购电量环比上周下降23.83%,留川电量环比上周下降2.33%,外送电量环比上周下降46.44%。综合来看,本周各项指标的
4月11日,江苏发改委公开征求《关于贯彻落实分布式光伏发电开发建设管理办法的实施意见(征求意见稿)》。(一)采取自发自用余电上网模式的一般工商业分布式光伏发电项目,其自发自用电量比例暂不作要求,适时明确具体比例。(二)确有自发自用、余电上网需求的大型工商业分布式光伏发电项目,以及需
国网江苏电力于2023年7月在国家电网有限公司系统率先建成多维多态“电网一张图”平台,实现分布式光伏、充电桩等设备信息建模。该公司还是公司系统内首批完成企业级数据中台部署的省级电力公司之一。2024年以来,围绕配网运维、供电服务等业务需求,该公司深化“电网一张图”应用,挖掘电力数据价值,
在发展数字经济与实现“双碳”目标的背景下,人工智能技术的爆发式增长正引发算力需求的指数级攀升。工业和信息化部数据显示,截至2024年9月底,我国在用算力中心超过880万标准机架,算力总规模达268EFLOPS(每秒百亿亿次浮点运算次数)。中国信息通信研究院《中国绿色算力发展研究报告(2024年)》显
在“双碳”战略引领下,我国风光新能源装机容量持续攀升,截至2024年底累计突破14亿千瓦。根据《2025年能源工作指导意见》规划路径,2025年全国新增新能源发电装机规模2亿千瓦以上,非化石能源消费比重将不断提高。然而,由于源网荷储协同缺乏系统性、科学性的规划设计,存在部分区域新能源并网消纳困
算力电力协同发展既是国家电力与算力政策的方向指引,也是电力与算力系统建设的大势所趋。从当前算力电力的发展现状来看,构建全国一体化算力网需要坚强的电力支撑,建设新型电力系统也需要灵活算力的多维助力,因此有必要从电力系统与算力系统的规划、建设着手,从设施、运行、市场与商业模式等多个维
近期,DeepSeek开源和开放的特点引发了广泛关注。截至2月3日,DeepSeekV3的Github仓库的Star数已达到69.3k、Fork数已达到10.5k,且其热度还在持续走高,市场份额也在不断扩大。在数字化浪潮席卷全球的当下,开源技术已然成为推动各行业创新发展的关键驱动力。对于电力行业而言,电力开源技术生态体系建
通算规模突破3万节点,智算规模超3000P发布千亿级NLP大模型,上线5个以上垂直领域大模型年内形成基本覆盖公司全业务域的电力知识库打造人工智能综合示范区,分批次完成53个“大瓦特”揭榜挂帅场景建设在电算协同、电鸿物联、人工智能、可信数据空间等方面推进行业、产业上下游交流合作近日,南方电网召
国家电网有限公司大数据中心深入贯彻落实国家电网有限公司第四届职工代表大会第五次会议暨2025年工作会议精神,牢牢把握“强化企业级统筹”“深化数字赋能赋效”“强化人工智能应用”“加强自主运维”四个方面要求,激活数据要素价值,全力支撑健全完善数字化工作体系、构建新型电力系统、发展新质生产
内蒙古新能源公司1月份发电量突破2.74亿千瓦时,1月份结算电价189.56元/兆瓦时,同比增长16.59元/兆瓦时,实现2025年首月电量、电价“开门红”。今年以来,内蒙古新能源公司深入落实集团公司、北京公司2025年工作会议要求,积极应对各类风险挑战,坚守安全生产底线,强化缺陷管理、对标管理、营销管理
1月20日,国网河北经济技术研究院配电网规划人员赵阳通过村级电网运行监测及项目成效评估场景评价2024年度1686个A类村级电网改造项目成效。这是村级电网运行监测及项目成效评估场景首次应用。该场景全面整合了地理信息、用电量、电网运行、设备状态等数据,可从供电能力、供电质量等方面对村级电网改造
日前,冀北电力经研院创新研发的变更签证智慧管理系统建成应用,并在国网冀北电力有限公司全域推广使用,取得显著成效。变更签证指在工程建设中,对原有签证进行更改或调整的行为。该系统基于数据中台,结合大数据分析模型,以工程造价管理业务为核心,采用智联管控手段和端云协同技术,让基建工程各参
12月19日,数字船岸一体化智慧监控系统平台研发完成,国家海洋输电技术品牌“国蛟一号”品牌又添新利器。该平台对内可实现该公司项目全业务在线协同和全流程贯通,对外提供相关数据增值服务,拓展多方数据的智能管控,通过该公司统一物联管理建成统一标准、统一模型的数据中台。
党的二十大报告指出,“要积极稳妥推进碳达峰碳中和”“逐步转向碳排放总量和强度‘双控’制度”。我国碳排放主要来源于能源活动和工业生产过程,其中能源活动占到总碳排放的88%,而电力行业碳排放占能源活动碳排放的41%,做好电力碳排放统计核算工作至关重要。近日,国家发展改革委等部门印发《完善碳
围绕人工智能规模化应用样本需求,国家电网有限公司大数据中心初步建成具备样本清洗、分类、标注、质检等能力的人工智能样本库——近期,国家电网有限公司大数据中心设计中心(人工智能样本中心)技术攻关团队队员正依托公司级人工智能样本库,针对公司总部及各省级电力公司人工智能模型训练需求,开展
国家电网有限公司大数据中心深入学习贯彻习近平总书记关于安全生产重要论述和重要指示批示精神,落实国家电网有限公司2024年“安全生产月”活动部署要求,强化安全责任,全面提升数据安全防护能力,重点防护网络恶意攻击,持续强化数据安全应急体系建设,进一步夯实安全防线,为电网数字化智能化建设提
国家电网有限公司高质量发展工作会议暨2024年第二季度工作会议提出,坚持问题导向和系统观念,推动公司高质量发展和电网高质量发展。数字化智能化是电网高质量发展的支点,要聚焦应用赋能,聚焦新型电力系统建设,聚焦人工智能创新应用,发挥好数据要素价值。国家电网有限公司大数据中心认真贯彻落实会
国网大数据中心2024年度集中采购批次安排
国家电网有限公司四届四次职代会暨2024年工作会议强调扎实做好做强做优做大、保供和转型、科技自立自强、深化改革、党的建设五篇大文章,以数智化坚强电网推动构建新型电力系统。国家电网有限公司大数据中心认真贯彻落实公司“两会”精神,扎实做好五篇大文章,围绕“服务以数智化坚强电网推动构建新型
近日,由工业和信息化部、国务院国有资产监督管理委员会、中华全国工商业联合会和浙江省人民政府共同主办的第五届中国工业互联网大赛全国总决赛在宁波落幕,共评出58个获奖项目。国家电网参评的两项目获奖。其中,国网北京市电力公司“面向绿色低碳发展的智慧能源城市大脑解决方案”项目获领军组三等奖
公司第四届职工代表大会第四次会议暨2024年工作会议提出,打造数智化坚强电网是顺应数字化智能化发展趋势、推动传统电网转型升级和高质量发展的迫切需要,是保障电网安全运行和电力可靠供应的迫切需要,是加快能源电力清洁低碳转型的迫切需要,是“双碳”目标下推动新型电力系统建设的必由之路。公司各
12月19日以来,国网大数据中心落实国网物资部和国网数字化部部署,启动抗击冰冻雨雪和保地震物资供应平台专项保障。该中心围绕物资库存仓储信息等数据,成立物资数据链路和平台资源保障团队;围绕库存仓储类数据链路、巡检离线计算资源使用情况、实时查询和即席分析组件运行及资源使用情况等;开展重点
11月8日获悉,在国网数字化部指导下,国网大数据中心电力看经济大数据应用工作完成电力看新型工业化发展、民营经济等新产品场景研发,并正式向国家有关部门提供服务。新产品场景充分发挥电力数据价值,通过电力大数据研究民营经济用电情况、洞察民营经济发展态势。国网大数据中心打造电力看经济“1+N”
10月18日至20日,由工信部、中国科协、辽宁省政府共同主办的“2023年全球工业互联网大会”在沈阳举行。期间,由国网辽宁省电力有限公司主办的“工业互联网+能源电力行业低碳转型”专题论坛在19日上午举行。国网辽宁省电力有限公司与华为技术有限公司在论坛上进行了《深化电网数字化转型,服务清洁能源
请使用微信扫一扫
关注公众号完成登录
姓名: | |
性别: | |
出生日期: | |
邮箱: | |
所在地区: | |
行业类别: | |
工作经验: | |
学历: | |
公司名称: | |
任职岗位: |
我们将会第一时间为您推送相关内容!