真相揭露:大公司宕机事件不断,多数由人为导致

转载 暴走乌鸦  2017-03-13 20:59  阅读 502 次 评论 0 条
行云管家,新手有礼

“70%的数据中心故障都是人为引起的”

这句话来自Uptime,其判断依据是对历史数据安全事故的统计,意义在于对数据中心运维操作的合规性进行警示。

真相揭露:大公司宕机事件不断,多数由人为导致 行业资讯 第1张

年初,号称最稳定的亚马逊S3大规模宕机,事后披露是由于程序员输错一个字母引发。

没多久微软云服务连续出故障,坑了大批使用Outlook做生意的用户,尽管微软没交待缘由,但许多专业人士认为是人为原因导致。

不久前国内的新浪微博遭遇“黑色一小时”,就在微博还没有从阴影中走出来的时候,饿了么也跟着出现了数据中心宕机事故。

这导致许多小伙伴在饿了么下单后一直没有等到送餐,是的,他们这次是真的饿了,差点就饿晕在了办公室。

微博和饿了么事后声称是由于包括电力在内的诸多原因导致数据中心故障,但是可信度不足。

真相揭露:大公司宕机事件不断,多数由人为导致 行业资讯 第2张

多数业内人士猜测是出现了操作失误或者系统维护程序设计有问题。

类似案例层出不穷,在全世界流行上云的今天,人为导致的数据安全问题愈发突出,那么该如何应对以获取足够的安全感。

这个问题很难回答,涉及的产品面太广,技术点太多,这是云计算时代普遍存在的问题。

当然,对于一般用户而言,亚马逊云会不会出事,阿里云会不会出事,都是掌控不了的,只能被动接受。

大多数用户更加关心的是企业内部的数据资源是否安全,IT运维是否靠谱。

在这一点上,行云管家从运维层面给出了解决方案,那就是部署堡垒机。

例如针对Linux服务器和Windows服务器提供操作审计特性。

技术原理是通过云端录像记录运维人员在做运维时候的全部操作过程。

这些录像可以被Linux服务器和Windows服务器指令检索,也可以直接提取和观看,进而完成操作审计。

真相揭露:大公司宕机事件不断,多数由人为导致 行业资讯 第3张

上图是行云管家中对Linux服务器进行指令检索的界面,其亮点有三:

一是可记录Linux操作过程中出现的所有指令字符;

二是可以对指令集进行全文检索;

三是还支持检索指令实时定位,并进行圈红标注。

使用操作审计特性的好处是运维人员可以及时检查有无操作错误。

运维团队也可以在出现问题的时候通过审计找出原因所在从而补救。

从管理的角度来说团队管理者可以凭借审计结果完成追责,没有犯错的运维人员也就不用担心背黑锅了。

真相揭露:大公司宕机事件不断,多数由人为导致 行业资讯 第4张

数据安全重要性不言而喻,但需要各方努力才能降低风险,尤其是在避免人为因素导致风险问题上需要特别重视。

越早作数据安全部署,提高数据安全意识,越能更好应对充满挑战的未来。

无论是运维人士,还是从业者都应居安思危,未雨绸缪。

本文地址:https://www.cloudbility.com/club/4825.html
关注我们:请关注一下我们的微信公众号:扫描二维码,公众号:cloudbility
版权声明:版权归原作者所有,欢迎分享本文,转载请保留出处!

发表评论


表情