近日,创业公司“前沿数控”针对腾讯云的一篇檄文引发了行业关注。前沿数控发文称,公司放在腾讯云服务器上的数据全部丢失且无法恢复。

对于造成用户数据丢失的问题,腾讯云在随后的回应中予以承认并进行了道歉,但让双方形成分歧是赔偿金额。据悉,前沿数控提出了 1100 万余元的索赔,而腾讯云提出的“赔偿+补偿”总金额为 13 万余元,二者相差甚远。

 不过该事件经过多日发酵后,8 月 8 日晚间,前沿数控对外宣称,基于尽快恢复“前沿数控”平台业务运营的共同出发点,经过充分的沟通,“前沿数控”与腾讯云误会已经消除,双方已制定出双方认可的业务解决方案。

但解决方案的具体细节,包括此前引发争议的赔偿金额,双方均未透露。对于腾讯云和前沿数控来说,双方之间达成共识,该事件也可以告一段落。

但实际上,这件事不仅仅是给当事双方造成了影响,也为整个行业敲响了警钟。在云服务已经无处不在的今天,数据的重要性毋庸置疑,但其安全性究竟能否得到保证以及该如何保证,现在似乎又需要画上一个问号。

小概率事件引发大问题

根据腾讯云 8 月 7 日披露的信息显示,该故障起源于因磁盘静默错误导致的单副本数据错误,再加上数据迁移过程中的两次不规范的操作,导致云盘的三副本安全机制失效,并最终导致客户数据完整性受损。

这两次违规操作分别是运维人员为了加速完成搬迁任务,违规关闭了数据校验;以及运维人员为了尽快降低仓库使用率,违规对源仓库进行了数据回收。

在正常情况下,数据搬迁流程会默认开启数据校验,开启之后可以有效发现并规避源端数据异常,从而保障搬迁数据正确性。而数据搬迁完成之后,源仓库数据应保留 24 小时,用于搬迁异常情况下的数据恢复。

一位熟悉该操作流程的业内人士告诉 21 世纪经济报道记者,整个事件的根本原因是极小概率出现的“磁盘静默错误”发生了。若磁盘静默错误没有发生,运维人员的上述操作也不会引发后面这些问题。“一般这种迁移不会出现什么问题,要不他们也不敢这样操作,只不过当小概率事件真的发生以后,原本的保护措施也没了。”

磁盘静默错误究竟是什么?据 21 世纪经济报道记者了解,通常大家遇到一些磁盘异常,比如硬件错误、固件 BUG 等都会得到报错,但静默错误的发生往往没有任何警告,磁盘显示一切正常,只有在进行数据完整性检验时才能发现。

在此次事件中,原本应该进行数据检验的步骤却被运维人员关闭了,所以,人员违规操作不是引发故障的根本原因,但却是扩大故障影响的重要因素。

此外,外界关注的另外一个焦点是这个事件的赔偿问题。据了解,在数据丢失之后,前沿数控向腾讯云提交了一份损失预估文件,内容包含前沿数控技术产品线发展及相关情况、丢失的数据、给前沿数控技术平台带来的影响、平台损失价值评估等。综合这些,前沿数控提出的索赔金额为 11016000 元。

腾讯云制定的“赔偿+补偿”方案,总金额为 136469 元。其中,赔偿部分为 3569 元,是腾讯云依据赔偿条款,按照前沿数控自去年 12 月份开户至今产生的实际消耗予以的赔偿。

二者提出的赔偿金额相差之多,也引发了业界关于“数据值多少钱”的讨论。信息安全专家陆宝华在接受 21 世纪经济报道记者的采访时指出,对于数据价值的判断,现在业内没有统一标准,所以也没有可参考的依据。但是在做损失评估时,应该由第三方机构来做,而不是当事企业。

一位云计算行业资深从业者向记者表示,赔偿问题可以依据服务商与客户之间的协议,看是按照数据的价值,还是按照数据的大小或使用的时长来计费。“但通常因为数据的价值难以衡量(不是一般等价物如黄金等可以折算成钱),所以通用的服务费用是按照时长、规模来计费的,赔偿往往也会照此计算。”

其举例说道,电力公司是按照每度电的价格向家庭收费,不会因为这度电是用来炒股还是开灯而产生不同的收费方式。

所以,按照服务协议条款,腾讯云的赔偿方案并无问题,但涉及到数据的价值,似乎又很难用云服务费去衡量。陆宝华认为,或许在这件事之后,能够促成行业形成一些约定。

从云服务开始出现的时候,不断提升其安全性就是所有服务商持续在做的事情,现在云服务的安全性也已经达到了一定的高度。但不可否认的是,受限于技术能力,当前对数据存储而言没有彻底安全的方式。

一位云计算行业专家向记者表示,凡是在使用的数据都有丢失的风险。首先基础设施就存在局限性,因为没有设备能达到 100% 可靠;其次,人为因素风险难以避免,目前绝大部分的数据丢失其实都是人为操作造成的,比如说中病毒、误操作等等。

对此,陆宝华告诉记者,通过技术手段其实可以规避掉一些人为风险。比如在此事件中,可以设定在没有进行数据校验的情况下,不允许数据搬迁。

但上述行业专家坦言,数据丢失的风险必须主动考虑,数据丢失的可能性永远存在,数据容灾能力是必须具备的。

多位云计算行业从业者向记者表示,很多企业对于云服务存在一定误解,认为将数据放到云平台上就万无一失了。从云计算的本质来看,它为企业提供的是一个低成本的计算资源共享池,它能帮助企业提升效率,减少成本,但这不代表它是一个不会出问题的服务。

目前,云服务商在提供服务时都会明确知会客户,因为当前人类技术水平的限制,服务商能够提供的服务的可用性、可靠性都做不到 100%,大致能做到几个9(如 99.9999%)。

该行业专家表示,为了在此基础上继续提高数据的安全性,一般的解决方案是,同时使用该服务商不同区域的服务器,这样出问题的概率就会更低。此外,对于重要数据,不管是个人用户还是企业用户,都需要定期做好备份。如果使用云服务,快照、灾备、离线备份等多种方式都可实现数据备份。

但需要明确的是,云服务商对于风险的技术解决能力、容灾能力都要远远高于企业个体,在云服务商这边可能出现的问题,企业即便在自己的机房也同样可能会出现,而且维护及处理成本会更高。

原文来自:

本文地址://q13zd.cn/cloud-safe-unsafe.html编辑:吴康宁,审核员:逄增宝

本文原创地址://q13zd.cn/cloud-safe-unsafe.html编辑:吴康宁,审核员:暂无