2014上半年十大云计算宕机事件

云计算和人一样并不是十全十美的,但是人们总是希望云计算能够达到99.999%的可靠性,并且规定其每年的宕机事件要在5.26分钟之内。
但是宕机是不可避免的。以下是2014年上半年最有着名的十大云计算宕机事件。
1月10日,Dropbox
美国东部时间8:30Dropbox开始宕机。

事后,Dropbox表示,在某些机器上升级操作系统的时候,在升级操作系统的时候出现了故障,是共享相册和上传照片的存储数据库,而不是其核心业务文件存储。升级脚本里的一个非常微小的bug在运行的机器上重装了操作系统,这导致了系统宕机。
Dropbox网站返回了服务错误信息,但是桌面应用和移动应用还无法同步。Dropbox在三个小时内恢复了大多部分数据,但是两天后核心应用才开始正常运行。

4月21日,三星

复活节的早晨位于韩国南部果川的数据中心发生火灾,接下来的几个小时,三星智能手机和平板电脑都无法获得自己的数据。数据中心第四层的火灾造成了信用卡服务中断,三星的智能电视和其他使用三星服务的设备都不能运行了。
这些服务器都集中放在了一起,而且没有容灾备份。所以造成了巨大的损失。

5月14日,Adobe Creative Cloud

Adobe的这款最受欢迎的在线应用从5月14日傍晚开始,东海岸的用户就开始无法登录,然后此故障持续了超过24个小时。Adobe表示,此故障是因为系统主机故障。
Adobe Creative Cloud整合了包括Photoshop, Acrobat, InDesign和Premiere Pro在内的16款软件。

5月16日,Internap

纽约市停电以后,位于此处的Internap数据中心的不间断供电系统宕机了。Internap下午三点才开始采取措施让其用户使用另外的数据中心和IP连接服务。
Internap宕机时间达数小时。此次宕机造成了流媒体平台Livestream和StackExchange数据的丢失。

5月27日,Joyent
Joynet东海岸数据中心的故障是在远程容量升级的时候由系统管理员引起的。Joyent表示,此次宕机是由于管理员重启了API系统和用户实例的同时执行远程更新。
最小的宕机时间是20分钟,大部分用户在30分钟以内都恢复服务了,但是由于网卡驱动器的故障,还有一小部分用户两个小时以后才开始恢复服务。

6月23日,Microsoft Lync
Microsoft Lync是IM应用和VoIP服务,它属于基于云计算的企业应用套件Office365的一部分。美国东部时间6月23日中午,北美地区的此服务出现宕机。

微软方面表示,某些用户的网络故障导致了宕机。这种宕机持续了八个小时。网络连接很快恢复了,但是接下来的数据过载使宕机范围扩大。同时,微软的用户还抱怨说,微软并没有及时通知他们宕机的发生。

6月24日,Microsoft Exchange
Exchange的宕机导致用户9个小时无法使用邮件系统,微软表示,此次宕机是由于通讯录的间歇故障导致了通讯录分区无法响应用户指令。

微软曾多次吹嘘其客户支持服务的及时性,但是微软在此次Lync和Exchange的宕机事件中并未表现出相应的快速响应能力,其反应速度让微软的应急响应能力备受诟病。

6月27日,Verizon Wireless
Verizon Wireless的大面积宕机发生在其订单系统,此次事故导致客户无法登录在线账户、无法付账,甚至还升级了客户的手机。

此次宕机持续了大约1天的时间,此次宕机不仅影响了使用My Verizon在线端口的客户,还影响了 Verizon自己的零售商店。

6月30日,No-IP.com恶性宕机
No-IP的此次宕机是人为造成的。微软在检查网络犯罪的时候,造成18,000,000合法的No-IP.com的用户的不可用。

7月1-2日,Autotask

容量问题导致了两方面的故障,数据中心的CRM故障和业务IT提供商AutoTask应用的不可用。
7月1日晚上系统开始宕机,然后工程师在网络层添加了更多虚拟核。但是CPU的问题依然存在,第二天宕机继续。

;