OVH数据中心服务中断24小时 液冷:怪我咯?(4)

2018-08-02 04:20 水冷编辑 网络整理
ROCCAT 捷致

  “冷却液泄露会怎么样?”几乎所有的液冷产品都会被问到这个问题。其实各厂家一般都会有相应的技术手段来确保不会出现问题。比如防泄漏的结构,比如故障隔离措施等等。所以,各专业IT厂家提供的液冷产品还是有保障的。

 

厂家的防泄漏设计

  3、从文中的描述看,OVH的运维保障流程仍存在缺陷。

  首先是故障隔离机制没有做好,一套机架故障后影响到相邻的机架,“但由于位置毗邻而受到影响,并直接引发电气故障,最终造成该托架彻底关闭。”

  其次是故障告警延迟。音频告警居然延迟了11分钟。“然而由于此前未能成功为该系统添加多语言支持功能,因此其警报时间点相较泄漏事故出现了延迟,并最终造成长达11分钟的时间间隔。”

  按笔者理解,最早的漏液告警很可能没有产生或者运维人员听不懂(法国运维人员听不懂英语?),直到事故进一步扩大,触发了更严重的故障告警(比如宕机,这次或许是法语告警),才被运维人员关注到。而且,难道除了现场的音频警报,就没有其他告警方式(短信)吗?

  最后是应急措施没有启动。“主动灾难恢复计划与测试并未能起到应有的作用”。这方面的原因不好推测。我们只知道运维人员折腾了很久,先是倒腾硬件,重启后发现搞不定,最后寻找新的存储空间,将系统和数据恢复到新的存储阵列里。

  所以,令OVH恐慌和消极的其实是糟糕的运维保障措施,就不要把黑锅让“冷却液泄露”去背了。

  三、好的数据中心,技术选择永远只是其中一种因素

  任何技术的进步都不是一蹴而就的,早期问题和故障的出现往往意味着未来的技术进步,而用户考虑的更多还是市场和技术成熟度的问题。

水冷网www.shuileng.net报道“冷却液泄露会怎么样?”几乎所有的液冷产品都会被问到这个问题。其实各厂家一般都会有相应的技术手段来确保不会出现问题。比如防泄漏的结构,比如故障隔离措施等等。所以,各专业IT厂家提供的液冷产品还是有保障...

Thermaltake 曜越
如果本文侵犯了您的权利, 请联系 goofy543%163.com(请将%换为@) ,本网立即做出处理,谢谢。

延伸 · 阅读

评论 · 交流

说点什么吧,也许可以帮到大家!
  • 全部评论(0
    还没有评论,快来抢沙发吧!