|
6 I* ]! }1 w# ~7 _8 u$ M' @
x2 y2 c$ I4 Y$ p) }说实话。。这个真是我在国内第一次看 SLA 补偿的云服务公司:- |+ X0 H0 @6 k+ r# i
S. m- O5 W& F" [" ]. q
- 尊敬的用户:( M' o+ x- l% y. L+ O) V+ J
- " X7 Y' G" i3 z+ L% i2 u4 t8 w" X
- 因广东1区(GD1)所在IDC遭遇雷暴天气引发电力故障,昨天下午QingCloud广东1区全部硬件设备意外关机重启,造成QingCloud官网及控制台短时无法访问、部署于GD1的用户业务暂时不可用,对此我们深表歉意。现将事故完整过程报告给您:
: k o& \; W( ^5 f7 r( {: N - * g( c5 _5 Y; R# v
- 13:48,我们收到GD1硬件及网络告警,并发现官网及控制台无法访问;工程师马上进行系统状态检查,发现GD1所有硬件设备出现重启;随即我们与GD1所在的IDC运营商沟通询问机房情况,同时排查其他可能导致设备重启的原因,并着手恢复管理服务(KS);其间,我们收到大量用户反映GD1业务中断;& U- i4 R( z3 E' N; ], U) b/ S
# z' T3 q0 H9 N$ A- 14:08,操作切换DNS以恢复官网及控制台;- ~& A" w. W6 }& v7 M5 ?& C
- * U/ Q/ o, V. L! n" S
- 14:23,我们从IDC运营商处获知由于机房所在地区出现雷暴天气,机房因雷击引起UPS异常,机柜瞬时断电再加电,从而导致了青云的全部物理设备异常关机与重启;" w; u2 P, Q C( H
- 2 Q! q) o. C8 z4 q( ~& }; Q3 h( ]
- 14:38,GD1的管理服务恢复,Bots系统恢复,开始恢复用户主机;用户可以访问GD1资源;DNS完全生效,官网及控制台访问恢复;0 o4 T( @" T8 V( M1 V
- - Y. a% ]0 l! c4 B: D
- 15:15,内网DNS Server恢复;系统持续检查环境和帮助用户恢复业务;4 R. S& W8 k v, u8 c; Z
( t3 X w0 ?1 _2 g- 16:19,GD1业务完全恢复,进一步检查后,于16:30分发布恢复公告。0 X- k; ]4 i) h3 S7 E
- . `) @4 W) _- a- T
- 本次严重故障从设备重启到用户业务恢复共耗时2小时31分钟,系统数据和用户的业务数据未出现任何丢失。- e; J \6 E% X) C( H( n1 P3 g' u
- ) l; e5 O, D! g7 |
- 针对本次故障对您的业务造成的影响,我们对受影响的资源按照故障时间的10倍进行赔付,总共是2.5小时 × 10 = 25小时,赔付将以系统赠送的形式给大家进行发放。您可以在 充值记录页 进行查看。
( U! i4 U% f8 J
8 k" h4 w# b# ?6 w( P) X5 d1 W q- 再次,向您表示深深的歉意,也希望在您的支持和帮助下,不断提升我们的服务水平。 您也可以通过下述链接了解关于故障的更多细节。
6 A( |9 m) n5 F9 @) E! n, v; a
5 w* T* q/ o3 K+ ]. d& q- 关于2015年6月6日青云QingCloud广东1区(GD1)机房电力故障的详细说明; p! G) l6 K+ W; T
$ u2 }( Y/ J0 N. u% S- 青云QingCloud
复制代码
" K' H: \9 {/ E; x3 W6 G
4 a$ O+ G0 h- c J( o9 Y认认真真做事。。必定能成功, W8 n: Q: H- F
|
|