|
( ~# K0 C% b& Q; w* A% v
' e% Y7 T( r! Z( G说实话。。这个真是我在国内第一次看 SLA 补偿的云服务公司:: a* F) q; q5 }3 V
! Y9 J% O; ~( d" O
- 尊敬的用户:
1 s. @% m: X8 R9 z
3 U L! ~2 W6 o+ c" C' L' { S9 r/ P- 因广东1区(GD1)所在IDC遭遇雷暴天气引发电力故障,昨天下午QingCloud广东1区全部硬件设备意外关机重启,造成QingCloud官网及控制台短时无法访问、部署于GD1的用户业务暂时不可用,对此我们深表歉意。现将事故完整过程报告给您:
& c$ N& i9 W- P* i1 o; M9 J - 1 k8 P3 Y( h4 R9 X
- 13:48,我们收到GD1硬件及网络告警,并发现官网及控制台无法访问;工程师马上进行系统状态检查,发现GD1所有硬件设备出现重启;随即我们与GD1所在的IDC运营商沟通询问机房情况,同时排查其他可能导致设备重启的原因,并着手恢复管理服务(KS);其间,我们收到大量用户反映GD1业务中断;, d1 M5 O/ ~# d, X% X
& r& v- w2 q2 f3 V- H- 14:08,操作切换DNS以恢复官网及控制台;
1 x: p" E% ?& v. `
# l1 a4 |' \1 c" \ I- 14:23,我们从IDC运营商处获知由于机房所在地区出现雷暴天气,机房因雷击引起UPS异常,机柜瞬时断电再加电,从而导致了青云的全部物理设备异常关机与重启;
; s# L. F. f6 C" |0 E0 } - , _+ }3 ]- H: o d
- 14:38,GD1的管理服务恢复,Bots系统恢复,开始恢复用户主机;用户可以访问GD1资源;DNS完全生效,官网及控制台访问恢复;
7 P% w9 g$ ?; v
# S; e) W( k, `( {$ A" ~- 15:15,内网DNS Server恢复;系统持续检查环境和帮助用户恢复业务;0 U9 p2 x0 p+ U5 i
7 N- v. G* S3 e* l- 16:19,GD1业务完全恢复,进一步检查后,于16:30分发布恢复公告。
; A+ N) H# u( V! ^5 [! t
# |0 S* p( V% U8 G- z- 本次严重故障从设备重启到用户业务恢复共耗时2小时31分钟,系统数据和用户的业务数据未出现任何丢失。
) R! ]/ T! Q2 M! q' d6 l- Y5 {& P
5 c! H* L$ A& q: j$ F- 针对本次故障对您的业务造成的影响,我们对受影响的资源按照故障时间的10倍进行赔付,总共是2.5小时 × 10 = 25小时,赔付将以系统赠送的形式给大家进行发放。您可以在 充值记录页 进行查看。6 T2 @/ ]+ ^8 d- B/ t X
& h6 H0 n7 q9 r3 W- 再次,向您表示深深的歉意,也希望在您的支持和帮助下,不断提升我们的服务水平。 您也可以通过下述链接了解关于故障的更多细节。
" _9 L4 b$ A' i& [ y - 6 |* i3 i) t8 S1 M' U( |: g
- 关于2015年6月6日青云QingCloud广东1区(GD1)机房电力故障的详细说明
# M! m" O+ H1 _& T/ O
* @ B& ^) S7 t- 青云QingCloud
复制代码
' @# L t3 q8 X; N
- w/ ]2 r" E, g, u7 D认认真真做事。。必定能成功0 [( W5 p1 a7 t
|
|