|
: Y* [. b" p& m4 y+ w/ ^9 i! v. K, r9 M+ E- s# Y {
说实话。。这个真是我在国内第一次看 SLA 补偿的云服务公司:
- [) E6 G# Y* n4 z) n, y# z
2 c: z3 w" Y, u- 尊敬的用户:5 Y5 c) _; L0 e4 l: e0 x8 n
- 6 V8 b- j( v: L1 {' t* _( n
- 因广东1区(GD1)所在IDC遭遇雷暴天气引发电力故障,昨天下午QingCloud广东1区全部硬件设备意外关机重启,造成QingCloud官网及控制台短时无法访问、部署于GD1的用户业务暂时不可用,对此我们深表歉意。现将事故完整过程报告给您:& {0 {# |, f$ D( q
. h: B9 E% H0 n" m7 G) \) T- 13:48,我们收到GD1硬件及网络告警,并发现官网及控制台无法访问;工程师马上进行系统状态检查,发现GD1所有硬件设备出现重启;随即我们与GD1所在的IDC运营商沟通询问机房情况,同时排查其他可能导致设备重启的原因,并着手恢复管理服务(KS);其间,我们收到大量用户反映GD1业务中断;
. d' |! o( E& a. f* ~' u- } - ; t5 @' ^6 k% g' z) t5 O1 B- x9 u
- 14:08,操作切换DNS以恢复官网及控制台;2 }- v. h3 J" G8 O
- : k/ u( L0 E- {
- 14:23,我们从IDC运营商处获知由于机房所在地区出现雷暴天气,机房因雷击引起UPS异常,机柜瞬时断电再加电,从而导致了青云的全部物理设备异常关机与重启;+ _6 s; q3 @. ^
- : N A7 Z" T& f: t$ Z3 @) N
- 14:38,GD1的管理服务恢复,Bots系统恢复,开始恢复用户主机;用户可以访问GD1资源;DNS完全生效,官网及控制台访问恢复;2 \: J7 i; P& x0 ` }2 d
0 m- P8 @9 v. D$ a- 15:15,内网DNS Server恢复;系统持续检查环境和帮助用户恢复业务;( T3 w6 k5 o7 b% P" M: M
- # w" b1 G, r: K1 J
- 16:19,GD1业务完全恢复,进一步检查后,于16:30分发布恢复公告。
j7 ~$ l! i- ~- ]2 O5 V) j3 r
( F% l" g: X8 @' D3 E) P2 O- 本次严重故障从设备重启到用户业务恢复共耗时2小时31分钟,系统数据和用户的业务数据未出现任何丢失。$ r7 L/ D# s1 H, P- m5 r
1 N! l$ d2 a$ a E/ w0 v. b- 针对本次故障对您的业务造成的影响,我们对受影响的资源按照故障时间的10倍进行赔付,总共是2.5小时 × 10 = 25小时,赔付将以系统赠送的形式给大家进行发放。您可以在 充值记录页 进行查看。( C! f( I5 W5 Q/ P. B4 j2 X! k
8 \/ Z' d, f6 H5 ]0 n' ?- 再次,向您表示深深的歉意,也希望在您的支持和帮助下,不断提升我们的服务水平。 您也可以通过下述链接了解关于故障的更多细节。
. v0 a7 a+ v4 |% l9 s' P5 J- j" I- i' ^
) k& G" ]. O- n* b3 d$ V9 X- 关于2015年6月6日青云QingCloud广东1区(GD1)机房电力故障的详细说明
/ F, W9 q- ^2 P% P
7 U: A& d* s5 u+ t; [/ e5 B- 青云QingCloud
复制代码
$ r* @: ~6 F8 ?3 h8 @$ f2 C3 W1 V& Y A" p& K
认认真真做事。。必定能成功
! d4 ?# n$ U9 s) ]; I# @% _6 ` |
|