導讀:11月27日,阿里云部分控制臺訪問出現異常,經過緊急處理,訪問異常問題已恢復,這已經是阿里云本月第二次控制臺服務異常。北京時間11月27日
11月27日,阿里云部分控制臺訪問出現異常,經過緊急處理,訪問異常問題已恢復,這已經是阿里云本月第二次控制臺服務異常。
北京時間11月27日,阿里云部分地域云數據庫控制臺訪問出現異常。據悉,從當日09:16起,阿里云監控發現北京、上海、杭州、深圳、青島、香港以及美東、美西地域的數據庫產品(RDS、PolarDB、Redis等)的控制臺和OpenAPI訪問出現異常,實例運行不受影響。經過工程師緊急處理,訪問異常問題已于當日10:58恢復。
此次受影響產品包括,云原生數據倉庫AnalyticDB PostgreSQL版、圖數據庫、云原生內存數據庫Tair、云數據庫Redis版、云原生關系型數據庫PolarDB、云數據庫專屬集群、云數據庫MySQL版、云原生數據倉庫AnalyticDB MySQL版、云原生分布式數據庫PolarDB-X、云數據庫ClickHouse、云原生多模數據庫Lindorm、云數據庫PostgreSQL版、云數據庫SQL Server版、云數據庫MongoDB版、云數據庫HBase版、數據庫自治服務、數據庫備份。
受影響地域包括,華北2(北京)、華東2(上海)、華東1(杭州)、華南1(深圳)、華北1(青島)、中國香港、美國(硅谷)、美國(弗吉尼亞)。
值得關注的是,這已經是阿里云本月第二次控制臺服務異常,首次異常是在雙 11 結束的一天后(11 月 12 日),涉及到阿里云盤、淘寶、咸魚、釘釘、語雀等產品,持續時長約 3.5 小時。
當時,該消息迅速在網絡發酵,引發外界熱議,相關話題也隨之沖上熱搜。對此,有網友表示,是開屏跳轉整太多帶來的后遺癥,雙11支撐了這么大的業務系統,崩是正常的,不崩是不正常的。
值得注意的是,除C端產品外,公司的B端客戶也受到不小影響。有媒體指出,波及范圍在阿里系歷史上實屬罕見,受影響地域包括中國內地、中國香港,以及印度、美國、英國、韓日等多個國家和地區。天眼查數據顯示,阿里云的企業用戶超過300萬家。這些客戶因為云服務不可用,業務運營可能全面癱瘓。
作為上述產品及企業背后的云服務商,阿里云也在后續發布公告稱,當日(11月12日)17:44起,阿里云監控發現云產品控制臺訪問及API調用出現異常,阿里云工程師正在緊急介入排查。目前,工程師通過分批重啟組件服務,絕大部分地域控制臺服務已恢復訪問。
據阿里方面消息,(11月12日)19:20左右,經工程師緊急處理,阿里旗下淘寶、釘釘、阿里云盤等APP已全面恢復。隨后于21:11,受影響云產品均已恢復,因故障影響部分云產品的數據可能存在延遲推送情況,不影響業務正常運行。
此外,近年來阿里云也曾多次出現服務異常。
2018年6月,阿里云曾出現持續近半小時的重大技術故障,彼時,阿里云官方對外解釋稱:“我們在運維上的一個操作失誤,導致一些客戶訪問阿里云官網控制臺和使用部分產品功能出現問題。”
據新京報,2019年3月3日凌晨,有網友在微博上稱阿里云疑似出現了宕機事故。而這也讓華北不少互聯網公司受到波及,APP和網站全部癱瘓。對此,阿里云方面回應稱,經緊急排查處理后逐步恢復服務。針對本次故障,阿里云將根據SLA協議(服務合同),盡快處理賠償事宜。
2022年12月18日,阿里云再次爆發香港Region可用區C大規模服務中斷事件,導致多個香港及澳門站點受到影響。阿里云官方也對此坦言:“這對很多客戶的業務產生重大影響,也是阿里云運營十多年來持續時間最長的一次大規模故障。”
至此,5年3次大事故,阿里云還未來得及喘息,便又面臨了此次全系閃崩事件,相關業務出事頻率也從5年3次上升至6年5次。