腾讯云公布4月8日大范围故障原因 升级API产生兼容性问题并产生循环依赖 – 蓝点网

4 月 8 日腾讯云出现大范围故障,腾讯此次故障主要影响产品控制台例如用户无法通过 Web 界面对服务器或其他产品进行操作,云公原因当然由于是布月并产 API 问题实际上也无法通过 API 执行各类操作。
此次故障对于服务器等产品本身是日大容性没有影响的,即服务器仍然是范围正常运行的只不过用户无法执行操作,其他产品例如 CDN 和域名解析等也是故障同理。
昨天腾讯云公众号发布 4 月 8 日的升级生兼生循故障复盘及情况说明,简单来说是问题发布新版 API 时出现了兼容性错误:
故障的直接原因是云 API 服务行版本向前兼容性考虑不够和配置数据灰度机制不足的问题。本次 API 升级过程中,环依由于新版本的赖蓝接口协议发生变化,在后台发布新版本之后对于旧版本前端传来的点网数据处理逻辑异常,导致生成了一条错误的腾讯配置数据。
由于灰度机制不足导致异常数据快速扩散到了全网地域,云公原因造成整体 API 使用异常。布月并产
然后还有循环依赖问题:
发生故障后按照标准回滚方案将服务后台和配置数据同时回滚到旧版本并重启 API 后台服务,日大容性但此时因为承载 API 服务的容器平台也依赖 API 服务才能提供调度能力,即发生了循环依赖 (需要安装 WinRAR 时下载网站给你了个 WinRAR.rar)
发生循环依赖的后果就是服务无法自动拉起,最终运维通过手工启动方式才让 API 服务重启,完成了整个故障的恢复。
针对此次问题腾讯云也汲取教训制定了改进措施:
改进措施里就有针对循环依赖问题的解决方案,包括提供优化服务部署架构,通过分层架构、代码审查和监控等手段,避免 API 服务中存在的循环依赖问题。
同时还要提供 API 服务逃生通道,当故障发生后可以提供调用方法快速切换。
针对 Status 页面的透明度问题:
透明度问题目前是国内云计算提供商都存在的问题,即问题发生后状态页面还显示一切正常,这让很多用户看了状态页后以为是自己问题。
腾讯云此次故障状态页同样没有及时更新,原因是状态页也依赖 API,但此时 API 已经寄了,所以腾讯云计划将状态页解除对云 API 等云服务的依赖,确保云服务故障时状态页依然能准确及时传递 故障信息。
相关文章
- 天天辛勤钻研.劳动的你,最大的兴趣不外便是玩.吃。玩的中间有良多,吃的中间也良多,可是好吃的中间却很少。与其自觉找寻,还不如自己入手。下面,我就来给巨匠介绍一下无关橄榄油香煎小黄鱼的做法。1.小黄鱼去2025-04-15
- 今世女生的生涯多姿多彩,可能忙劳动、忙家庭、忙学习......无意分可能会忙碌到用饭不定时,行动量也削减了。久而久之,可能会影响到身段的形态,纵然生涯忙碌,仍是有良多简略的养生方式,适宜小仙女们试试看2025-04-15
- 法头等八轮,摩纳哥坐镇主场迎战蒙彼利埃法头等八轮,摩纳哥坐镇主场迎战蒙彼利埃。上轮联赛,摩纳哥客场4-0横扫里尔,摩纳哥客场4-0大胜里尔,摩纳哥在联赛2连胜后积18分临时追平榜首的巴黎圣日耳曼。此役2025-04-15
- AC米兰周中险胜里耶卡万以及足球,欧罗巴赛场依然高歌猛进;上轮联赛作客输给桑普,AC米兰联赛战罢6轮取患上4胜2负的造诣万以及足球足球吧论坛,其中主场四战全胜,球队主场造诣斐然AC米兰周中险胜里耶卡万2025-04-15
「新破费审核」中国区门店缩短,亚太总裁来救场:汉堡王密集调解是否力挽狂澜
摘要:以前一年,汉堡王中国在华日子难题渡过,“吸血”加盟商、拖欠员工人为等负面声音时有传来,同时,在相助对于手纵容开疆拓土减速门店拓展的历程中,汉堡王中国2024年门店却陷入萎缩。2025-04-15最新足球赛事往事足球竞彩胜平负2024/4/25体育竞彩资讯
上周末曼城联赛客场3-1战败西汉姆联,在争先失球的情景下,新援多库打进联赛首球,B席以及哈兰德也各有一球入账,逆转失败上周末曼城联赛客场3-1战败西汉姆联,在争先失球的情景下,新援多库打进联赛首球,B2025-04-15
最新评论