OVH数据中心服务中断24小时 液冷:怪我咯?
几乎所有的IDC运营者都宣称自己的数据中心最可靠,但每年每月甚至每天我们都能听到许多发生故障的案例。
这次又轮到OVH中招了,不过据说背锅的是液冷。
一、事件回顾(标红的地方下面会进行解读)
(新闻来源自网络)近日,一套外部水冷系统发生冷却液泄漏事故,直接导致OVH公司在巴黎数据中心内的一台戴尔-EMCVNX存储阵列遭受损坏,进而引发超过50000个网站在接下来的24小时内无法正常访问。冷却液泄漏给该公司位于巴黎数据中心内的VNX阵列带来灭顶之灾。
OVH公司为目前全球第三大互联网托管厂商,其在世界17个国家拥有20座数据中心以及多达26万台服务器,其中托管着约1800万款Web应用程序。
此次事故发生于6月29日晚7点左右,直接影响到OVH公司位于巴黎的P19数据中心——这亦是该公司于2003年建立的首座数据中心。不过其规模随后被位于格拉沃利纳的新数据中心所超越,后者为目前欧洲最大数据中心,部署有约40万台服务器。
OVH公司在其P19数据中心之内采用自主研发的水冷解决方案。冷却液经由服务器机架及其它部件通过组件级热交换装置进行循环冷却,且与顶架式水箱热交换装置相对接。在完成一轮循环后,其与地下水进行热交换以实现自身冷却。这套方案能够有效替代以空调系统为核心的风冷机制,从而节约大量电力。
根据事故记录显示,P19数据中心亦在地下室内部署有多台设备,负责通过外界空气实现冷却效果。
OVH公司于2012年从EMC手中购买了数台VNX 5400阵列。此次发生事故的阵列在其三台机架当中装有96块SSD、15套本地磁盘架以及标准的主动-主动控制器对。该公司表示:“这套架构的设计目标在于确保数据的本地可用性以及数据控制器与磁盘的强大容错能力。”
在此之后,该公司又陆续开发出新的解决方案,其被应用于格拉沃利纳数据中心,能够通过非专用商业阵列配合Ceph与ZFS以摆脱对专用设备的依赖。事实上,此次受到影响的阵列原本也已经被纳入清退计划。这两台VNX阵列作为数据库服务器使用,负责为托管网站的动态页面提供数据、用户相关信息以及博客平台中的文章文本与评论内容。
根据事件报告撰文,“6月29日星期四下午6:48,P19数据中心内的3号机房中,由于水冷系统的塑料软管发生破裂,因而导致冷却液泄漏至服务器系统之内。”
“我们两套专用存储托架(机架)中的一套并未使用水冷机制,但由于位置毗邻而受到影响,并直接引发电气故障,最终造成该托架彻底关闭。”
OVH公司承认其将两种采用不同冷却机制的服务器安装在同一机房之内是个错误。“我们做出了错误的判断,我们本应为这些存储设施提供最大程度的保护,正如我们在其它站点中所做的那样。”
水冷网www.shuileng.net报道OVH数据中心服务中断24小时 液冷:怪我咯? -新闻频道-和讯网...
延伸 · 阅读
- 2018-10-232018开放数据中心峰会开幕 技
- 2018-10-23CDCE2018国际数据中心及云计算
- 2018-10-18数据中心冷战:风冷未央 液冷
- 2018-10-13华为助力客户迈向智能云数据中
- 2018-10-11美利云与上海电力牵手 建设大
- 2018-10-02为数据中心加速 英特尔扩充FPG
评论 · 交流
- 全部评论(0)