云服务本质上是远程的,因此你必须能够通过网络连接到它们。存在多个潜在的故障点,包括你的家庭网络、你的互联网服务提供商、云提供商的网络,甚至他们自己的ISP的问题,更不用说电源中断或电脑崩溃等显而易见的情况。如果其中任何一个环节出现故障,你都将无法访问你的数据或应用程序。
网络拥堵也会影响你通过云端上传或下载的速度和便捷性。当你徒劳地试图获取急需的数据来完成那份临时抱佛脚的演示文稿或论文时,极度的缓慢可能和中断一样糟糕。
有时,灾难性的中断会发生在整个数据中心,或数据中心的一部分。服务可能因天气事件或其他自然灾害、停电、设备故障或仅仅是计划外的维修或维护停机而中断。尽管云主机力求100%的正常运行时间,但这是一个崇高的目标。即使是对大公司而言,意外也时有发生。
亚马逊,作为云服务领域的早期先驱,在2011年至2013年间曾发生过几次备受瞩目的停机事件。其中一些导致Reddit、Netflix、Coursera、Foursquare、Instagram、Pinterest、Flipboard、Vine甚至亚马逊自身等知名网站瘫痪或受损。这些事件被归因于雷暴、停电、人为错误,甚至在某个案例中是一个单一网络设备的故障。
微软的Windows Azure服务在2012年2月因一个与闰日相关的软件错误而中断了大约10小时。谷歌在2013年8月发生了一次仅持续几分钟的宕机,导致其所有服务(包括搜索引擎、Gmail和YouTube)中断,据报道给他们造成了约50万美元的损失[来源:彭博社]。根据分析公司GoSquared的数据,此次宕机还使全球网络流量减少了40%[来源:彭博社, Mack]。
对于在家试图在Netflix上看电影的人来说,中断可能只是烦恼。但对于企业而言,即使是短暂的中断也可能对收入产生重大影响。这是一个教训:任何依赖云的人都应尽可能将服务分散到多个数据中心,甚至多个提供商。定期以某种自动化方式备份数据也是一个好主意。冗余是关键。这会带来成本,但如果你需要持续访问你的数据和服务,这可能是值得的。