登录注册
请使用微信扫一扫
关注公众号完成登录
我要投稿
在这场数据的淘金中许多公司满载而归,然而“大数据”投资失败的公司也不可谓不多,所以就有了之前的一篇文章“ Why Big Data Projects Fail”。对此,商业智能工具研发总监、esProc、esCalc高级顾问Jim King否认了这个看法,并以google(谷歌)为例给大数据投资者提出了一些警示。
以下为译文:
首先看一下大数据成功典范Google,看看他们是如何玩转大数据的:
1. 收集数据,捕捉每个网站、电子邮件、Cookie内容,并提取关键信息。
2. 为信息创建复合索引。不用说,广告相关索引是必不可少的。
3. 将目录和内容储存在分布式服务器中。
4. 当用户浏览网站以及搜索或访问电子邮件时,Google会对这些请求做复杂的转换处理,同时几个索引项会随之确定。
5. 根据索引在服务器中查询数据,返回搜索结果或者广告。
在这里不难发现,与Hadoop有关的只有3和5,也就是数据储存和查询。而这两项也是最容易实现的两项,比如Hadoop就是个具有良好扩展性及低成本的解决方案。
那么实现3和5就可以像Google一样发玩转大数据了?很显然不行,因为关键选项2和4并没有实现,而2和4就是所谓的业务分析算法。这些算法由业务专家根据数据、业务知识、市场趋势精心打造,是许多企业商业策略制定的重要手段及核心。这才是4V理论中的“Value”。
这也是现下许多大数据投资失败的原因,因为当下的大数据只提供了数据存储和查询的策略,缺乏了提高企业竞争力的业务分析解决方案,而恰恰这才是最重要的。事实上,现在的大数据工具都是为IT专家打造的,他们可以通过C++或者Java实现MapReduce功能,但是却无法提供有价值的商业算法。
因此大数据成功的关键不在于Hadoop是否部署成功,而在于对业务有帮助算法的制定,而在人才严重缺乏的当下,不妨从数据工具入手。降低工具使用的门槛,让业务专家可以参与其中,才能发挥大数据真正的作用,对业务起到立竿见影的改善。
总结
工具的部署谁都可以,关键在于业务算法的制定,让业务专家无缝的参与数据的分析才是成功的开端。
特别声明:北极星转载其他网站内容,出于传递更多信息而非盈利之目的,同时并不代表赞成其观点或证实其描述,内容仅供参考。版权归原作者所有,若有侵权,请联系我们删除。
凡来源注明北极星*网的内容为北极星原创,转载需获授权。
近日,南方能源大数据中心与南方电网大湾区数字产业基地顺利投产,标志着南方电网公司基本建成“3+1+X”架构的绿色节能新型数据基础设施。南方能源大数据中心位于全国一体化算力网络国家枢纽节点贵州(贵安)枢纽,首期规划建成两栋机楼及一栋运检楼,承载约2000架10千瓦机柜,定位南方电网公司双活生
日前,南方能源大数据中心与南方电网大湾区数字产业基地分别在贵州贵阳、广东惠州投产,标志着南方电网公司基本建成“3+1+X”架构的绿色节能新型数据基础设施,有力展示公司主动融入国家“东数西算”工程建设,加快数字化转型和数字电网建设,加快向数字电网运营商、能源产业价值链整合商、能源生态系
问:您常年从事汽车相关教学工作,对新能源汽车行业的发展较为关注。随着新能源汽车越来越普及,我国充电基础设施也在快速发展,您对此有何看法?杨金龙:近年来,我国新能源汽车行业发展迅猛,充电基础设施建设也取得了令人瞩目的成绩。在我所生活的浙江省杭州市桐庐县,无论是旅游景区还是公共停车场
国家电网有限公司大数据中心深入贯彻落实国家电网有限公司第四届职工代表大会第五次会议暨2025年工作会议精神,牢牢把握“强化企业级统筹”“深化数字赋能赋效”“强化人工智能应用”“加强自主运维”四个方面要求,激活数据要素价值,全力支撑健全完善数字化工作体系、构建新型电力系统、发展新质生产
近日,四川能源监管办发布2024年度煤电机组大数据监管情况通报。通报指出,四川燃煤发电持续发挥“关键少数”重要作用,煤电兜底保障基础不断夯实,顶峰保供能力进一步发挥,企业经营情况进一步改善。全年枯水期完成发电量335.03亿千瓦时,提供了四川主网三分之一以上电量。2024年四川燃煤火电机组平均
2月17日,山东淄博供电公司电力气象智慧预警大数据应用平台上线。该平台深度融合电力数据和气象数据,增强了电力气象灾害的主动预警能力,为淄博电网防灾减灾、安全稳定运行提供保障。强风、雷暴等恶劣天气容易影响电网设备安全运行。为此,淄博供电公司与山东省电力气象技术创新中心联合组建攻坚团队
近日,福建龙岩供电公司发布龙岩市开工生产分析报告。此报告基于多维度与海量数据统计分析,详细呈现了各行业的生产经营变化情况,为政府精准制定政策、推动经济稳健复苏提供了数据支撑。该公司广泛收集企业开工生产相关数据,通过设定复工及达产指数,量化评估企业开工水平及达到正常生产用能水平情况
近日,福建龙岩供电公司发布龙岩市开工生产分析报告。此报告基于多维度与海量数据统计分析,详细呈现了各行业的生产经营变化情况,为政府精准制定政策、推动经济稳健复苏提供了数据支撑。该公司广泛收集企业开工生产相关数据,通过设定复工及达产指数,量化评估企业开工水平及达到正常生产用能水平情况
近日,由国网湖南省电力有限公司牵头,中国南方电网有限责任公司、中国长江三峡集团有限公司、华中科技大学、湖南大学和华为技术有限公司等共同编写的水电物联网国际标准IEEEStd2413.3-2024《水电能源物联网导则》正式获批发布。据介绍,在水电能源物联网领域,尤其是在水利水电工程中,数据壁垒易导致
2025年春节,浙江的大街小巷满是烟火与欢笑,当古镇的红灯笼与现代化都市的霓虹一同点亮新春夜空,你是否想过,这背后的用电数据是怎样的经济密码?它们串联起千家万户的团圆,映射出产业发展的新态势。现在,就跟着小e,看看2025年春节浙江用电数据藏着哪些惊喜。刚刚过去的春节(1月28日-2月4日),
正月初九,尽管春节假期已经结束了,但过年的热闹劲儿还未完全消散。2024年12月,中国春节成功列入《人类非物质文化遗产代表作名录》,紧接着,我们迎来了意义非凡的第一个“非遗版”春节。办年货作为春节里必不可少的仪式,承载着我们对新年的期待与祝福。当年轻一代逐渐接过年货采购的接力棒,又是什
CNBC网站发表文章《为什么微软、亚马逊、谷歌和Meta等科技巨头都在大力投资核能》。(来源:国际能源小数据作者:ESmallData)人工智能和云计算数据中心正在推动能源需求和产量达到新的高度。根据美国能源部的数据,到2050年,全球电力使用量可能会上升75%,其中科技行业的人工智能雄心是这一增长的主
谷歌宣布了一项“首创”的合作,将与开发商合作建设由现场可再生能源供电的数据中心。谷歌与能源公司IntersectPower和投资公司TPGRiseClimate合作,计划在本十年内投资200亿美元在美国建设多个“工业园区”,这些园区将配备可再生能源发电设施,以支持数据中心运营。第一个园区预计将在2026年部分投入
根据美国太阳能产业协会(SEIA)公布的最新报告,美国企业对清洁能源的投资热情空前高涨,创下历史新高,其中科技巨头在太阳能应用领域更是起到了带头作用。报告显示,截至2024年第1季度,美国企业已安装近40GW的太阳能发电设施,企业储能规模也突破1.8GWh。(数据来源SEIA报告)具体来看,MetaPlatfor
据CNBC报道,谷歌宣布与小型模块化反应堆开发商KairosPower签署了一项电力购买协议。随着数据中心的能源需求不断增长,美国科技公司越来越多地转向核能作为满足能源需求的一种方式。(来源:国际能源小数据作者:ESmallData)谷歌表示,将从KairosPower制造的一系列小型模块化反应堆(SMRs)中购买电力
根据SwiftCurrentEnergy报告称,已完成了谷歌对其位于伊利诺伊州南部的800MWdc双黑钻石太阳能项目的税收股权投资。该项目位于伊利诺伊州斯普林菲尔德以西30英里处,目前正在建设中,预计将于2025年初实现商业运营。据SwiftCurrentEnergy称,投入运营后,DoubleBlackDiamondSolar预计将成为密西西比河以
北极星储能网获悉,据纽柯钢铁公司官网消息,3月19日谷歌、微软和纽柯钢铁公司宣布,他们将在整个电力生态系统中开展合作,开发新的商业模式,并汇总他们对先进清洁电力技术的需求。这些模式将旨在加速首创和早期商业项目的开发,包括先进核能、下一代地热、清洁氢气、长时储能等。作为第一步,这几家
美国清洁能源协会(ACP)的发布的《清洁能源为美国企业提供动力》(CleanEnergyPowersAmericanBusiness)报告显示,2022年由企业购买的清洁能源比以往任何一年都要多,创下新的纪录。报告介绍了工商业企业如何直接从风能、太阳能和储能电厂购买清洁能源以加速清洁能源的转型。报告指出,2022年电力购买
北极星储能网获悉,据外媒报道,当地时间8月8日中午,三名电工在美国爱荷华州康瑟尔布拉夫斯的谷歌数据中心大楼附近的一个变电站工作时突然发生了电弧闪光(电气爆炸),导致三人严重烧伤。据了解,事故发生后一人被直升机送往内布拉斯加州医疗中心,其余两人被救护车送医治疗。据当地警局称,三个人被
据PV-Tech报道,钙钛矿光伏制造商SauleTechnologies正在加速推进与GoogleCloud及可再生能源公司ColumbusEnergy的合作。其中,波兰钙钛矿光伏制造商SauleTechnologies公司研发了用于物联网应用的钙钛矿太阳能电池,效率达到25.5%,将为物联网设备提供独立电源。GoogleCloud将负责为两家战略合作伙伴提供
据外媒报道,谷歌公司正在投资部署一个电池储能系统作为其一个数据中心的备用电源解决方案。该公司将这个项目描述为数据中心从应对气候变化问题向采用无碳系统关键组件改变的第一步。谷歌公司在比利时圣吉斯兰运营的一个数据中心是该公司的第一个采用太阳能发电设施电力的数据中心设施。该公司在2017年
VisualCapitalist网站汇制作信息图,在地图上形象显示2020年国外电动汽车品牌的续航里程。(来源:国际能源小数据)如图所示,从价格更实惠的Model3到更豪华的ModelS,续航里程最长的前8款电动汽车都是特斯拉汽车品牌。排名第一的是特斯拉车型ModelS(长距离版)的每次充电续航里程647公里,比最好的非
“存储门槛说高也高,说低也低。高端存储是其中的一把尺子,能做,就是存储的第一阵营。”华为IT存储产品线副总裁孟广斌说。他表示,高端存储是皇冠上的明珠。如此衡量,华为会稳居存储第一阵营,是有原因的。因为他们有以分布式多控制器为核心的华为OceanStor 18000系列高端存储。它通过Smart Matrix控制器扩展架构,驱动器规模达到了惊人的3216个,存储容量7PB。无论Scale UP,还是Scale Out,OceanStor 18000都首屈一指。不仅如此,华为还创造性提出了Scale deep和Scale In性
尽管大数据不会成为2013年视频监控的主流概念,但IHSIMSResearch预测,分析技术及大数据视频元数据的使用和整合将继续增加,着眼于利用大数据的企业将越来越多地将视频元数据流纳入其数据集中。“大数据”是指一组数据集非常庞大且复杂,以致于很难利用现有的数据库管理工具进行处理。大数据时代,监控储存市场将会朝怎样的方向发展?让我们拭目以待。大数据推动存储市场发展近日,美国市场研究公司IDC发布报告称,大数据技术和服务的不断升级,拉动全球存储市场将在2011至2016年间实现53%的复合年增长率。在可预见的未来,多数组织产生、处
由于常规能源的有限性以及日益严重的环境污染等问题,可再生能源的开发利用已成为全球性的趋势,合理调整能源结构,大力开发可再生能源和其他新能源,走多元化洁净能源发展道路,是我国社会可持续发展的必由之路,我国已将“分布式供能技术”列入2006~2020年中长期科学和技术发展规划纲要。然而,由于风、光等分布式能源的波动性,使其在并网或独立供电系统应用中遇到较大困难,国内外研究结果表明,充分利用风、光等资源在时间上的互补性,并与储能系统及其他发电系统结合组成的微电网系统是一种非常有效的途径。微网技术已成为未来分布式发电供能系统集成技术的核
与发达国家服务器与磁带机连接高达60%的比例相比,国内用户对备份的投入还存在着巨大的蓝海市场。中科同向提供的软硬一体化容灾解决方案,不仅能适应异构的存储设备,同时也适应异构的服务器平台,极大的保障了用户在实际使用中的适应性。 中科同向是我国信息安全及数据存储备份与容灾行业研发最长、综合实力最强的企业之一。作为数据保护领域领先的产品、方案和提供商,致力于全球同步的数据备份系统的开发和推广,为用户提供数据存储、安全、高可用、数据迁移以及数据容灾等不同层次的一体化存储解决方案和专业而完善的服务,使用户存储、保
请使用微信扫一扫
关注公众号完成登录
姓名: | |
性别: | |
出生日期: | |
邮箱: | |
所在地区: | |
行业类别: | |
工作经验: | |
学历: | |
公司名称: | |
任职岗位: |
我们将会第一时间为您推送相关内容!