行云管家:企业如何减少人为导致的云安全事故

每日新闻源网

2018-01-26 09:24:13

本月初,包括美国、欧洲和亚洲等地区在内使用谷歌云的用户突然发现他们的虚拟机都无法“连接到后端”,很快谷歌云通告称是由于负载均衡系统出现故障所导致,工程师团队正在抓紧处理,用户也开始了漫长的等待,最终在该负载均衡系统瘫痪长达18个小时后才恢复正常。

从谷歌披露的信息推断,几乎可以确定是由于谷歌自身的更新造成了这场混乱,这是又一起自摆乌龙的事件。笔者查看了历史资料发现,谷歌在之前的2016年6月、2016年8月、2016年8月和2016年9月都曾搞砸过自己的云。作为世界级科技巨头,市值名列全球前三,且拥有最优秀的工程师团队,谷歌仍然无法避免IT系统故障频发的尴尬局面,个中缘由值得从业者探究。

在云技术飞速向前发展的今天,数据安全形势并没有得到明显改观,云安全事故不断发生,这是为何?据行业IDC机构观测的结果,有超过一半的云服务安全故障是由内部人为原因造成的。仅在今年,此类人为原因导致的事故都曝出多起。年初,号称最稳定的亚马逊S3大规模宕机,事后披露是由于程序员输错一个字母引发。没多久微软云服务连续出故障,坑了大批使用Outlook做生意的用户,尽管微软没交待缘由,但许多专业人士认为是人为原因导致。不久前国内的新浪微博遭遇“黑色一小时”,就在微博还没有从阴影中走出来的时候,饿了么也跟着出现了数据中心宕机事故。

行业内不少专业人士也接受这一观点,即在当前阶段云服务主要安全威胁不是来自外部的恶意攻击,而是内部的人为因素。高登峰有多年的云平台运维系统研发经验,目前在行云管家担任产品经理这一重要职位。他透露根据最近一年观测行云管家一万多家企业级云服务用户,对其中出现过IT系统故障的企业进行调研分析可以发现,有两个事故诱因出现的频次最高。一是IT部门内部人员的不当操作导致系统故障;二是在业务快速变化过程中运维人员未能及时、高效跟进维护导致系统宕机。

高登峰建议,上云企业应保持高度警惕,首先应该严格设计标准流程以限制运维人员和IT人员在工作中进行合规操作;其次,可以采用第三方的操作审计工具来合理规范运维团队,出了问题也能及时排查原因,明确责任。高登峰表示市面上已经有不少这样的运维工具开放给用户了。拿行云管家来说,研发团队在操作审计这一块儿下足了功夫,产品中内置的云堡垒机特性可以给IT运维团队进行全程录像审计和多种指令查询,达到操作过程合规、事后明晰责任的目的。一旦出现IT系统故障,IT团队可直接通过录像审计快速找出原因,并准确追责。

据艾瑞咨询数据,2016年中国云服务市场交易规模达520亿元,同比增长31.9%,并预计未来几年仍保持约30%以上的年复合增长率。此外,根据中国信通院预测,国内公有云市场未来将保持强劲增长势头,到2020年规模有望达到603.6亿元。企业上云已是既成事实,中国有数百万的企业正在将他们的数据逐步迁上云端,这也是云服务市场的发展势头如此迅猛的主要原因。但是,无论是云服务商,还是上云企业,在享受云计算带来的价值增长的同时不应该忽略IT系统安全隐患,而是要足够重视对IT系统进行内部和外部的安全防护,尤其是要在内部强化合规操作准则,设计科学的运维审计流程,最大程度降低由人为原因导致的IT系统安全故障的发生率,以保障数据安全,让云计算能真正为企业持续创新提供助力。


每日新闻源网:未经过授权,请勿转载,版权请联系邮箱。 责任编辑:每日新闻小编