北极星

搜索历史清空

  • 水处理
您的位置:电力电力软件安防软件报道正文

阿里“去IOE”战略 开源自主并行——2013电力信息化年会

2013-12-04 09:40来源:北极星电力网关键词:电力信息化年会去IOE电力信息化收藏点赞

投稿

我要投稿

在11月30日-12月1日举行的电力行业信息化年会上,阿里巴巴数据库负责人周宝方做题为《阿里“去IOE”战略》主题演讲,分享了阿里巴巴在去IOE过程中的经验与技术演变。以下为文字实录。

阿里巴巴数据库负责人周宝方

大家好,我先简单介绍一下自己,我在阿里的花名是后羿,在阿里大家知道花名文化,在我们内部通常用花名相互称呼。就像刚才刘总介绍的,我过去十多年主要是数据库方面做一些事情,过去四年主要做一件事帮助阿里实现去IOE,今天重点讲阿里从以前的基础架构,碰到的问题及演变。

首先简单介绍阿里过去几年做预算过程当中一个指导原则,很多人可能不是很清楚,为什么把这个提出来?其实每年年底我们在做完双十一,双十二之后,随机起动一件工作,从集团层面做未来一年预算制定和规划,我们会把预算计划提交我们CTO内部去,其实不是简单对这中间财务做盘点,而是未来一年整个案例技术走向、产品规划中间来做一个系统性盘点,所以其实去IOE也是来自于我们那一年预算盘点。

2010年我在淘宝,当年做预算时候,我和我老板在制定预算初稿过程当中,提那么一句,我说我们现有这种系统架构采用了大量的IOE系统,其实我们可以来尝试一下用非主流方式,比如说PC来逐步替代我们架构,当时只是在预算初稿当中提一句,但我们CTO是希望能够明确写下来,作为我们未来几年预算很重要基点,并且提出来说既然有这么考虑,不妨我们就决心迈更大一点,以后再也不采购小型机,这整个过程作为阿里去IOE发端,一会儿也会讲到。

作为第一年也就是2010年,刚才说预算2009年年底,2010年时候我们制定指导原则主要是解决小型机问题,这里中间提出来,在去小型机过程中我们也提出逐步积累,对于数据库、以及EMC高端存储经验积累。大家看2011年时候,其实从我们整个一个去IOE来讲,去小型机技术已经掌握,2010年时候全面推动,IOE全面技术替换,背后主导思路希望回归互联网根本,以互联网技术解决电子商务性应用场景解决。

2012年时候,我们基本上解决了当时淘系主流核心应用场景的去IOE工作,随着后期我们对支付宝、B2B以及阿里整合过程当中,整个团队上升到集团层面来全面推动,在各个领域来推动战略。

2013年时候大家可以看到我们已经不再提去IOE,我们内部已经基本上把这些问题已经解决了,剩下其实已经只是一些长尾,或者一些小应用,那推动云计算战略,或者更多让内部IT逐步对接到云计算平台上来。

那经历这几个阶段,大家看一下阿里自身技术经历了几个阶段,从最初商用技术,IOE,商用技术,在我们企业发展一个起步阶段,是以金钱来换取时间,随着后期自身技术积累一定程度,我们逐步考虑以自身技术来解决这些问题,从最开始开源入手逐步过度到自主技术,当自主技术逐步成熟时,自主技术逐步往云计算平台走,最终云计算支撑整体庞大业务。后期无论是开源或自主技术也好,云计算平台是我们阿里主流的一个技术基础。

刚才从过去4年我们预算指导原则角度来让大家看到,整个这几年我们技术发展的一个演进主线,现在归到去IOE整个历程,这张图可以看到,网上也有照片发出来,这是一个传统IOE架构,这个架构大家可以看到基本上每个公司大同小异的,在这里我们可以看到,这里前面是,中间一排黑色小型机,中间是网络设备,在下面一层,这是高端存储。这里一台小型机,IBM小型机差不多500万到600万之间,在下面是高端存储,拿IMC来说,一台价格大家也猜一下,也同样差不多价钱。我们这个核心系统,每一台如果正常跑起来,都需要做HA,必须让这个设备再乘以2才能够跑下去,这是常规配置,你还没有提业务发展过程当中你需要对接数据仓库,还没提到软件费用,以及这中间互联过程当中这中间交换机,以及对网络端口占用和带宽,以及IDC额外付出这些费用。

从淘宝应用角度来看,最初淘宝在发展之初所有应用都放在几个集中库当中,随着业务快速发展,这中间有一些商品系统发展非常快,每年是以翻一番速度增长,我们首先在这里碰到瓶颈,怎么解决?最初尝试垂直拆分,我们以应用的纬度来逐步把应用放到各个库当中去,每个库基本上是以IOE价值来支撑,那这中间还有一些体量大的应用,比如说像交易、商品、店铺、用户,他们发展速度非常快,尤其以商品库为主,我们解决垂直拆分发现还没有解决问题,类似于像商品还在每年翻一番速度增长,意味着第一年要一拆二,第二年二拆四,再往后每年再翻一番,这里列出很少一部分,大家可以看每一个点刚才500、600万加500、600万乘以2,再乘以上面很多软件费用,大概是2000多万一个结点,如果大家考虑整体规模到最后几何奇数往上长,如果是这样走下去的话,其实企业发展利润基本上保护费已经交出去了。

那回归到我们去IOE的核心原因,首先是说为什么我们做重大决定?大家可以看到,IOE这种体系他是一个强大单点,这个点他处理能力很强,似乎看起来也具备很强这种稳定性,扩展能力也还可以,但是你可以想到如果说是整个一个淘宝,这么大应用,都依赖于一台机器,一两台机器,网络他会出现波动,我这个电源也有可能被拉闸限电,或者CPU都会出现问题,如果出现这种问题,你要影响到用户稳定,如果以这种体系一个库里面,比如说1亿两亿用户,相当于所有鸡蛋都放在一个篮子里,影响面相当大的,这其实是我们最初,在稳定性方面所面临的一个非常急迫问题,一个点出现任何波动影响面都会非常大。

投稿与新闻线索:陈女士 微信/手机:13693626116 邮箱:chenchen#bjxmail.com(请将#改成@)

特别声明:北极星转载其他网站内容,出于传递更多信息而非盈利之目的,同时并不代表赞成其观点或证实其描述,内容仅供参考。版权归原作者所有,若有侵权,请联系我们删除。

凡来源注明北极星*网的内容为北极星原创,转载需获授权。

电力信息化年会查看更多>去IOE查看更多>电力信息化查看更多>