版本升級是存儲集群長期運行中必不可少的動作,通過版本升級可以增加功能、修復漏洞、提升性能,但離線升級方式或串行在線升級,對于金融、通信等對業務連續性和升級時效要求較高的行業來說是難以接受的。對此,浪潮信息在分布式存儲平臺上研發出在線并發升級算法,能夠保證在不影響企業業務的前提下進行快速、可靠的版本迭代,實現整體存儲平臺升級效率提升超10倍。
(相關資料圖)
浪潮信息研發的在線并發升級算法,相對于傳統串行在線升級有兩大優勢:首先,其先進性在于從集群底層數據分布結構出發,對節點進行升級分類,可有效避免上層協議對于并發升級的影響,進而實現了集群全場景并發升級。其次,升級隊列生成器可以根據當前集群實際情況制定出優化的升級策略,而升級控制器保證實際升級過程中能夠綜合各種集群服務狀態,在確保集群業務正常的情況下動態調整各節點的升級順序,進而實現在存儲業務不受影響的前提下快速完成存儲版本的迭代。
例如,在存儲系統由70臺設備組成的情況下,按照傳統串行升級方式,整個存儲集群完成升級耗時在8小時左右。在采用浪潮信息的并發升級技術后,存儲集群升級耗時縮減至42分鐘,整體升級時間縮短90%。
浪潮信息的并發升級技術之所以能有效提升集群整體升級效率,關鍵在于此技術能夠根據存儲系統底層結構將70個節點劃分為5個升級組,單個升級組之間相互獨立,可以進行并發升級。然后根據存儲系統服務分布、存儲池狀態、閾值等信息綜合計算得出單個升級組內可允許并行升級的節點個數,具體分組內容如下表所示:
升級組 | 服務器個數 | 并發個數 |
root_1 | 9 | 2 |
root_2 | 9 | 3 |
root_3 | 12 | 3 |
root_4 | 20 | 4 |
root_5 | 20 | 4 |
在進行分組后集群節點可進行兩輪并發,首先是5個升級組間可以執行并發升級,其次單個升級組內節點按照并發個數進行并發升級。經過兩輪并發升級后集群升級耗時被縮減至42分鐘。
圖2,圖3為某70個節點的存儲集群升級前、升級中以及升級后的IOPS、帶寬性能曲線圖。存儲集群在線升級時間為2022/06/29 01:00 – 02:00執行在線升級,在線升級期間IOPS、帶寬性能與升級前、后保持一致并未有下降,仍維持在正常水平。
圖2 IOPS 性能曲線
圖3 帶寬性能曲線
浪潮信息支持不同版本間的功能互通,即在整個升級期間不同版本間業務可以正常互通,不影響集群原功能的正常使用。
浪潮信息的分布式存儲產品還支持暫停/繼續功能。當在線升級時間窗口不足或節點升級異常時,用戶可主動觸發升級暫停動作,浪潮信息的分布式存儲可以在記錄下當前集群升級狀態后進行集群狀態恢復并退出升級。升級暫停期間浪潮信息支持系統多版本兼容,使得集群即使在各節點系統版本不一致的情況下,也可以維持整個存儲系統的功能、穩定性和性能不受影響,集群仍可正常對外提供服務。此后用戶可通過繼續升級功能來恢復集群升級。暫停和繼續功能不僅增加了升級功能的穩定性和健壯性,同時也解決了大規模集群用戶升級時間窗口選擇難的問題。
浪潮信息的分布式存儲AS13000,基于在線并發升級功能,已經在金融、通信、醫療等行業實現規模部署,在實際升級操作中可快速、安全的實現分布式存儲版本的迭代,有效提升升級效率、降低運維成本。未來,浪潮信息將持續秉承“存儲即平臺”戰略,加速推進存儲系統功能的研發和創新,助力各個行業全面釋放數據價值,加速數字化轉型。
免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。