2015-08-24 张晓东 东方云洞察
点击上面的链接文字,可以快速关注“东方云洞察”公众号
上周四,比利时布鲁塞尔西南郊的St.Ghislaina小镇遭遇了雷电天气。结果,Google位于该镇的数据中心所存储的数据,遭到了“严重”的损失。大约百分之0.000001的数据受到了影响。
看起来这么小比例的数据量丢失媒体有点小题大做,不过谁让谷歌是全球互联网界的宠儿呢,也是云计算领域的先驱。 因为,雷电等原因导致数据中心的数据丢失,对于谷歌号称永不丢失的数据而言实在是一个教训。
Google的数据中心架构工作人员正在着手解决这个问题。目前,大部分的服务器已经使用更换了具备更好抗灾性的存储硬件。另外,Google也重申,Google云服务的弹性计算架构遍布全球各地,用户可以设定在灾难发生时自动切换到备用的弹性架构上。目前,Google Compute Engine在全球共有三个云计算数据中心,分别位于比利时、台湾的彰化和美国的爱荷华州。
闪电击中了数据中心所用的电网,导致主要电力系统供电中断。数据中心随即切换到了两种备用系统:备用供电线路和服务器内置电池。一般来说,两种灾备方案对于数据中心肯定是够了,但谁曾想到,内置的电池这次出现了问题。
根据Google透露的情况,在从上周四到昨天的时间里,由于部分数据中心服务器的电池耗尽时间太长(extended or repeated battery drain),这些涉事服务器存储的I/O出现了零星的存取失败情况:大约百分之0.000001的数据受到了影响。
这些服务器位于Google Compute Engine的北欧区域的europe-west1-b,受影响的服务器在该数据中心比例约为5%。虽然看起来数据损失比例极小,但对于拥有海量数据的Google来说,本次数据损失并不是一件小事……行业人士估计,Google拥有10-15 exabyte(EB)的数据,每exabyte等于100万TB,而每TB等于1000GB。如果把这个数字带入到计算里,百分之0.000001大约等于100多GB的数据。当然,Google虽然没有公布比利时数据中心的数据存储量具体有多少,但我们可以估计,至少有数GB到数十GB的数据,在本次雷暴中丢失。
这一事件之后,谷歌的工程师们对该公司的数据中心技术进行了“广泛的审查”,包括电气分布等发现了一些需要改进的领域。它们包括升级硬件以提高,在断电瞬间高速缓存数据保存能力,”以及“改善系统工程师的响应程序和能力”。
谷歌并不是独自面对这个问题。在2011年亚马逊在爱尔兰数据中心也早到了终端。
谷歌称其可靠性和准备是不可想象的,包括地震、甚至公共健康危机,“假设人和服务不可用长达30天。”(这是一个流行的做法。)
经此一事,说明谷歌还需要在数据中心方案方面有更多的改进,以保证将来做得更好。
扫描二维码关注【东方云洞察】公众号
实时了解深度的公有云市场分析和洞察结果!点击右上角,在弹出的菜单中发送给朋友、分享到朋友圈。请在公众号搜索并关注:DongCloudInsight 或 东方云洞察。需要点对点交流请加微信:jackyzhang523
帮助您了解公有云相关的深度洞察结果。带来极具深度和最新鲜的:云市场分析、云机会洞察分析、云重大事件快评、云杂谈、云论坛资讯,以及公有云领域最高端的CEO面对面深度研讨。
--- 最专注、专业的“公有云洞察”分享;关注全球,聚焦中国。