前面我们讲过 IT 的概念,即信息技术,其中“I”代表信息(或数据),“T”代表技术(或计算),技术是用来处理信息的,所以说 I 是目的,T 是手段,T 是为 I 服务的。
《云计算安全性》教程中关注的是 I,本节我们再来看看 T,与 T 关联的安全主要是“计算可用性”,如果由于 T 的原因,人们无法处理 I,那么这种情况就称为计算不可用。
首先来看下面几个计算不可用的例子:
计算不可用会导致人们无法处理全部或者部分数据,而断电、断网、软/硬件故障、缺少应用软件、忘记账号或密码等都会导致全部或部分计算不可用。
相对于传统 IT 系统而言,云计算的确增加了一个可能产生故障的环节——云端,而且一旦云端崩溃,影响范围会很广,但不能因此而全盘否定云计算,因为世上根本就没有完美无缺的事物。
一个公安局长在否决私有云建设方案时说的一句话:“万一云端出问题,大家都不用办公了?!”从正面回答公安局长的问题,估计效果不大,可以顺着其思路提出如下类似的问题:
类似的问题还有很多,不再一一列出。我的一个好朋友从 1994—2002 年在银行工作,从事计算机技术岗位,见证并参与了银行从完全手工办理业务(算盘、手写存折)到全国数据大集中并实现网上银行的整个发展过程。1996 年以前,人们只能到开户行去存取款;而今天,我们不但能异地跨行存取款,而且坐在家里通过网上银行就能轻松实现支付和转账。总之,银行数据大集中利大于弊。
为了确保银行数据中心的可靠性,每家银行一般会在不同城市(如北京、上海和西安)各建一个中心,平时一个中心工作,另外两个作为灾备中心,三个中心的数据实时同步更新。这样,就算战争、地震等损毁了两个中心,也不会影响银行业务的正常办理。即使三个中心全部遭到破坏,也还有离线备份的数据,数据安全性绝对没有问题。
决策者和云计算工程师们会在计算的重要性和成本之间综合权衡,以建设一个令各方都满意的云端。
例如,一个全国性的关系到每个人利益的公共云,就会考虑在不同的城市建立灾备云端,在另一个国家建立数据备份中心;一个涉及全省的公共云,可能会考虑在其他省的城市建立数据备份中心;一个世界500强企业的私有云,可能会建立一个异地灾备云端;一家中型企业的私有云,可能会引入集群、容错和故障转移技术;即使一家只有十几个人的小型公司的私有办公云,也会采用双机容错技术,只有当两台服务器同时出现故障时才会影响办公,但同时出现故障的概率几乎可以忽略不计,除非发生断电或地震等不可控事件。
就像银行数据中心的演化过程,IT 系统也遵循“手工→单机→私有云→公共云”的发展过程,每一次演化带来的好处要远远大于引入的弊端。
即使没有使用云计算的企业,在其 IT 系统中,也存在不少“单点故障”——一出问题就会影响整个企业的业务办理。比如企业的邮件系统、门户网站、ERP 系统、文件服务器、局域网接入认证系统等,即 C/S 或 B/S 的 S 端(服务器端)就是单点故障点。导致计算不可用的主要原因有停电、断网、硬件故障、软件故障(含病毒感染)。
在传统 IT 系统中,个人计算机的软、硬件故障导致计算不可用的概率接近 95%,其中又以软件故障最为普遍,而因停电、断网导致计算不可用的概率微乎其微,服务器故障导致计算不可用的概率还不到 5%。而当一家企业采用云计算后,云终端是一个纯硬件、低功耗产品,而且 CPU、内存都焊死在主板上,又没有硬盘,所以云终端出故障的概率几乎可以忽略不计。
云端采用多路供电、恒温恒湿系统,引入集群技术、容错技术及负载均衡技术等措施确保计算持续可用,这样由云端、网络、终端组成的云计算系统具备极高的可靠性和安全性,计算可用性非常高。