登录注册
请使用微信扫一扫
关注公众号完成登录
2013-05-31 17:40来源:和讯网关键词:Hadoop 2.0大数据存储收藏点赞
我要投稿
以往Hadoop似乎就是大数据的代名词。不过最近随着大数据应用的深入,大家已经越来越倾向于仅仅把它看成是大数据的一个存储工具了。
不过这并不一定就是坏事。把Hadoop当作廉价有效的存储正好是Hadoop下一阶段演进的的完美起点。今年夏天就要亮相的Hadoop 2.0将会令数据仓库中的信息以及非结构化数据池前所未有地容易访问。
Hadoop大桶
自成为大数据工具以来,Hadoop就是一个非常棒的数据存储系统,但是需要开发Java应用来访问数据的MapReduce学习起来却比较困难。
当然,还有别的办法可以从Hadoop中获取信息。Hbase数据是Hadoop的一部分,它可以让用户按照数据库范式来处理数据。Hive数据仓库则可以让你用类SQL的HiveSQL查询语言来创建查询并转化为MapReduce任务。不过Hadoop仍受限于单线程性。MapReduce任务、 Hive查询、Hbase操作,等等,这些都要轮流进行。
这就是许多大数据供应商倾向于仅将Hadoop当作数据容器的原因,为了提高效率,他们在此基础上再开发自己的工具来获取或分析其中的数据。尽管把Hadoop形容为一个大桶很形象,但是Hadoop用户当中已经有人把它看作是数据大湖甚至数据海洋了。不过光是规模大还是不行的,那些限制影响到了Hadoop的卖点。
Hadoop的开发社区也意识到这个问题,随着Hadoop即将迭代到新的版本,上述限制即将在很大程度上被解除。
YARN解决方案
在Hadoop 2.0发布经理Arun Murthy看来,其最重要的变化是MapReduce框架升级为Apache YARN,这将扩展Hadoop中可以应用的软件种类和应用程度。Arun Murthy本人就是YARN项目主管,他指出,Hadoop 1.0和2.0的区别在于,前者所有的事情都是面向批处理的,而后者则允许多个应用同时在内部访问数据。
相对于当前MapReduce系统能处理的事情,把这些功能分开使得Hadoop集群资源的管理更加强大。其主要管理方式类似于操作系统对任务的处理,也就是说不再有一次一项操作的限制了。
有了YARN,开发者就能够直接在Hadoop内部来开发应用,而不是像许多第三方工具所做的那样,在外面把数据筛选出来。
Murthy称,现在已经有供应商对在YARN框架内开发应用表现出兴趣。Murthy估计,Hadoop 2.0的强力beta版有可能会在今年6月或7月推出,正式版则可能在8月发布。
如果YARN的确能履行其承诺的话,开发者将可以在原生的Hadoop平台里方便地接触到许多的数据大湖大海,令搜寻有用信息的任务更加流畅和便捷。届时,大数据会变得更加有用、更加大众化。
特别声明:北极星转载其他网站内容,出于传递更多信息而非盈利之目的,同时并不代表赞成其观点或证实其描述,内容仅供参考。版权归原作者所有,若有侵权,请联系我们删除。
凡来源注明北极星*网的内容为北极星原创,转载需获授权。
4月29日,山西对《山西省数据工作管理办法》(征求意见稿)公开征求意见。其中提到,山西省人民政府工业和信息化、能源等部门应当推进工业、能源数字化,加强工业互联网、能源数字化建设,围绕煤炭、电力、焦化、煤化工、钢铁、装备制造等传统优势产业,加快推动研发设计、生产制造、经营管理、市场服
在数字经济时代,全社会数据总量呈爆发式增长,支撑海量数据存储计算的数据中心和算力网络逐步成为支撑各行业数字化转型的重要新型基础设施。数据中心在创造经济价值的同时,其能耗也逐渐成为全社会关注的焦点。数据中心节能降耗是大势所趋。国网河北省电力有限公司充分发挥电力数据价值,积极探索服务
近日,国家发展改革委办公厅、国家数据局综合司印发《数字经济2024年工作要点》(以下简称《工作要点》),对2024年数字经济重点工作作出部署。为全面贯彻落实党的二十大和二十届二中全会精神,按照中央经济工作会议和全国两会部署,支持数字经济高质量发展,深入实施推进《“十四五”数字经济发展规划
乌兰察布市源荷互动绿色大数据中心示范项目位于察右后旗境内,于2月27日启动,是一座100兆瓦分散式风电项目,该项目可降低电网多次升降压和长距离输送的电能损失,具有良好的社会综合经济效益。截至4月23日,项目20台风机吊装、集电线路放线都已完成,升压站设备基础完成80%。
4月18日,在河北省昌黎县朱各庄镇下庄村的农田里,几十台播种机来回穿梭,将种子埋入土中。种植户们启动水泵,通过滴灌管道浇水。当天,冀北昌黎县供电公司朱各庄镇供电所员工王伟和孙奉江来到下庄村,巡检排灌变压器及10千伏灌溉用电线路。下庄村有农田7300多亩,主要种植玉米、花生、白薯等农作物。
国家电网有限公司高质量发展工作会议暨2024年第二季度工作会议提出,坚持问题导向和系统观念,推动公司高质量发展和电网高质量发展。数字化智能化是电网高质量发展的支点,要聚焦应用赋能,聚焦新型电力系统建设,聚焦人工智能创新应用,发挥好数据要素价值。国家电网有限公司大数据中心认真贯彻落实会
4月7日,陕西省发展和改革委员会印发《陕西省培育千亿级化工材料产业创新集群行动计划》,其中提到,加强源头减碳、过程减碳、终端固碳,创建10个以上示范性绿色化工园区、绿色工厂,开展绿色化工产品认证,推进化工材料产业绿色制造体系不断完善。二是提升产业数字化智能化水平。并且,加快5G、大数据
4月8日,记者从国网浙江电力获悉,该公司打造的“浙江省新能源e平台”上线运行。这一平台全量接入了浙江省风、光、水、生物质能等全品类新能源数据,能够动态监测分析全省新能源装机发电情况,解构全省各品类新能源运行趋势,助力浙江新能源消纳与高质量发展。“浙江省新能源e平台”主要包含一屏总览、
据国网浙江省电力有限公司4月8日消息,当日“浙江省新能源e平台”正式上线运行。该平台全量接入了浙江省风、光、水、生物质能等全品类新能源数据,能够动态监测分析该省新能源装机发电情况,解构各品类新能源运行趋势,助力浙江新能源消纳与高质量发展。据了解,“浙江省新能源e平台”主要包含一屏总览
4月2日,国网天津经研院规划评审中心支撑数字化部完成“基于能源电力大数据的天津碳排放监测及运营服务科技示范工程”工作方案的编制。该工程是国家电网公司首批新型电力系统原创技术策源地科技示范工程,将充分释放电力大数据价值,在多源能源数据汇聚融合、碳监测标准建设、碳核算体系构建、新兴业务
当前,随着新一轮科技革命和产业变革的持续推进,大力培育新兴产业和未来产业已成为引领科技进步、带动产业升级、培育新质生产力的战略选择。电力是经济社会发展的重要支撑。国家电网有限公司持续优化电力营商环境,加快构建新型电力系统,积极促进新能源发展,壮大产业集群,为新兴产业和未来产业发展
编者按近年来,随着智能电网不断建设和发展,大规模广域数据实时采集和历史数据存储的需求快速增长。5G通信技术有望引领新一轮电力技术革命,其应用场景包括:万物互联、精准控制、海量量测、宽带通信和高效计算等。利用5G技术能够提供更完备的配电网差动保护方案,有利于智能电网的建设。5G技术为变电
3月21日,全省新能源高质量发展座谈会在并召开。会议全面学习贯彻习近平总书记在2月29日中共中央政治局第十二次集体学习时重要讲话精神,认真落实3月12日省委常委会上关于推动我省新能源高质量发展的工作要求,系统阐述新能源发展的重大意义,深入分析我省新能源发展形势,研讨交流促进我省新能源高质
2023年以来,314Ah大电芯蔚然成风,与之匹配的20尺5MWh储能系统成为各大企业争相布局的前沿阵地。不过,虽同为20尺5MWh,同样为了达到“高效、降本”目的,不同企业的集成设计方案却各有千秋。阳光电源独辟蹊径,推出“交直流一体”式设计的PowerTitan2.0,将5MWh的电池、2.5MW的PCS一体融入20尺柜中,
尽管电化学储能市场依然火爆,但近期市场利空也不少。院士、专家关于电化学储能“不一样的论断”;欧洲天然气价格回落、户储产品库存增大;媒体附和储能凉凉说。频发利空,虽然让没有核心技术的新玩家进退两难,但并未打乱坚持长期主义的龙头企业的已有节奏。01乱、繁、差:高景气度中的隐忧目前电化学
10月26日,阳光电源新一代大型储能系统PowerTitan2.0在京发布,秉持“三电融合智储一体”理念,是全球首个10MWh全液冷储能系统,革命性首创“交直流一体化”极简结构,电池单元与PCS融于一柜,让系统的效率、性能、安全、智慧水平均得到颠覆性提升!为大型地面电站开启AC存储时代。AC存储,更高效1、交
北极星电力软件网获悉,8月30日,南昌市人民政府发布关于印发《南昌市推动工业互联网创新发展三年行动计划(2023—2025年)》(以下简称《计划》)的通知。《计划》指出,鼓励数据中心与南昌国家级互联网骨干直联点,粤港澳、长三角等地区全国一体化算力网络国家枢纽节点联动。发展液冷、蓄冷、储能、
北极星电力网获悉,8月15日,全国在建规模最大的单体粉煤灰存储综合利用项目——内蒙古金山粉煤灰综合利用项目正式开工。该项目位于内蒙古自治区呼和浩特市土默特左旗台阁牧镇境内,新建两座大型混凝土灰库,其中一座布置在电厂一期贮灰场,一座布置在电厂二期厂区东侧。一期工程每台炉排灰量为每小时3
北极星储能网获悉,8月14日,特斯拉官博透露,特斯拉公司已在中国建立数据中心,以实现数据存储的本地化。所有在中国大陆市场销售车辆所产生的数据,都会存储在中国境内。
8月14日上午,省政府新闻办举行“山西加快转型发展”系列主题新闻发布会的第二场发布会,同时也是“推动能源产业绿色转型”专场发布会。数据显示,山西省新能源和清洁能源发展全面提速,截至6月底,新能源和清洁能源装机占比42.9%、发电量占比26.8%。优化配置电力系统调峰资源,加快抽水蓄能和新型储能
北极星储能网获悉,8月4日,福清核电党委委员、副总经理陈宇肇一行来中科院大连化物所访问交流,就全钒液流储能电池的技术细节进行了深入讨论。大连化物所副所长李先锋表示,大连化物所与福清核电在核电调峰存储方面具有广阔合作空间。福清核电副总经理陈宇肇表示,大连化物所在大容量全钒液流储能电池
6月26日,天津南港乙烯项目立体包装D库网架模块化提升就位,标志着行业首次立体库网架整体模块封顶完成,天津南港乙烯项目世界级规模、绿色智能化立体库建设迈出关键一步。其建成投用后,将成为中国石化存储能力最大的立体仓库。固体产品及包装仓库是天津南港乙烯项目重要的化工产品包装仓库。其中,立
请使用微信扫一扫
关注公众号完成登录
姓名: | |
性别: | |
出生日期: | |
邮箱: | |
所在地区: | |
行业类别: | |
工作经验: | |
学历: | |
公司名称: | |
任职岗位: |
我们将会第一时间为您推送相关内容!