隨著新興技術(shù)產(chǎn)業(yè)的蓬勃發(fā)展,現(xiàn)代企業(yè)數(shù)據(jù)中心所承載的數(shù)據(jù)類型正發(fā)生顯著變化:從以往以數(shù)據(jù)庫表單等結(jié)構(gòu)化數(shù)據(jù)為主,逐步過渡到以視頻、圖片、文檔等非結(jié)構(gòu)化數(shù)據(jù)為主的新階段。上層業(yè)務(wù)對海量數(shù)據(jù)頻繁的存取需求,對企業(yè)存儲系統(tǒng)的性能與容量提出了更高挑戰(zhàn)。在這一背景下,企業(yè)級分布式存儲應(yīng)運(yùn)而生。構(gòu)建一套穩(wěn)定、高可用的分布式存儲系統(tǒng),不僅需要系統(tǒng)本身具備強(qiáng)大的管理能力,網(wǎng)絡(luò)傳輸性能也尤為關(guān)鍵。如何有效降低存儲節(jié)點間的通信延遲,構(gòu)建高性能、低時延的存儲集群,已成為分布式存儲面臨的核心技術(shù)挑戰(zhàn)之一。
針對上述挑戰(zhàn),目前主流的存儲網(wǎng)絡(luò)技術(shù)路線包括FC光纖通道、IB網(wǎng)絡(luò)與RoCEv2技術(shù),它們致力于為用戶提供可持續(xù)、高帶寬、低時延、高可靠的存儲網(wǎng)絡(luò)解決方案。為便于用戶選擇最適合的方案,我們從成本、擴(kuò)展性、兼容性、運(yùn)維復(fù)雜度等多個維度進(jìn)行了系統(tǒng)對比,具體如下:通過對比可見,RoCEv2技術(shù)在端口帶寬、協(xié)議先進(jìn)性、可擴(kuò)展性、部署成本、運(yùn)維便捷性及兼容性等方面具備顯著優(yōu)勢,更契合現(xiàn)代高性能分布式存儲網(wǎng)絡(luò)的構(gòu)建需求。
關(guān)鍵技術(shù)一:RoCEv2如何保障業(yè)務(wù)低延時傳輸

RoCEv2實現(xiàn)低時延傳輸?shù)暮诵囊蕾囉赗DMA(遠(yuǎn)程直接內(nèi)存訪問)技術(shù)。RDMA允許數(shù)據(jù)在計算機(jī)之間直接傳輸,無需操作系統(tǒng)介入,從而大幅降低通信延遲,特別適用于大規(guī)模并行計算和存儲集群場景。
以下為RDMA應(yīng)用程序的具備的技術(shù):
CPU零拷貝技術(shù)RDMA應(yīng)用程序可直接繞過操作系統(tǒng)內(nèi)核進(jìn)行數(shù)據(jù)傳輸,避免了數(shù)據(jù)在用戶態(tài)與內(nèi)核態(tài)之間的多次拷貝,顯著降低I/O延遲。
內(nèi)核旁路技術(shù)借助RDMA協(xié)議,分布式存儲系統(tǒng)在進(jìn)行數(shù)據(jù)傳輸時可直接繞過內(nèi)核,用戶態(tài)應(yīng)用程序可直接操作網(wǎng)絡(luò)接口,省去系統(tǒng)調(diào)用過程,消除了內(nèi)核態(tài)與用戶態(tài)切換帶來的性能開銷。
CPU卸載技術(shù)支持RoCEv2的智能網(wǎng)卡可將數(shù)據(jù)傳輸任務(wù)完全卸載到網(wǎng)卡處理,整個數(shù)據(jù)拷貝過程幾乎無需CPU參與,有效減少CPU中斷次數(shù)與資源消耗,提升整體存儲系統(tǒng)性能。
關(guān)鍵技術(shù)二:RoCEv2如何保障業(yè)務(wù)無損傳輸
傳統(tǒng)以太網(wǎng)在傳輸過程中容易因網(wǎng)絡(luò)擁塞導(dǎo)致丟包,這在核心業(yè)務(wù)場景中是不可接受的。RoCEv2引入兩項關(guān)鍵技術(shù),確保數(shù)據(jù)傳輸過程中實現(xiàn)零丟包:
技術(shù)一:PFC優(yōu)先級流量控制PFC(IEEE 802.1Qbb)是實現(xiàn)無損網(wǎng)絡(luò)的關(guān)鍵機(jī)制之一。它允許設(shè)備針對特定優(yōu)先級隊列暫停數(shù)據(jù)傳輸,而不影響其他流量。在RoCEv2網(wǎng)絡(luò)中,RDMA流量被分配獨(dú)立優(yōu)先級。當(dāng)接收端緩沖區(qū)達(dá)到閾值時,會向發(fā)送端發(fā)送Pause幀,暫停該優(yōu)先級隊列的傳輸,從而避免緩沖區(qū)溢出導(dǎo)致丟包。當(dāng)緩存隊列超過PFC設(shè)置的門限時候,會向發(fā)送方發(fā)送STOP反壓請求,請求停止發(fā)送數(shù)據(jù)并將數(shù)據(jù)存取在本地緩存中,直到收到接收方的停止反壓報文,可再次重新發(fā)送。
技術(shù)二:ECN顯式擁塞通知為進(jìn)一步優(yōu)化網(wǎng)絡(luò)性能,RoCEv2結(jié)合ECN機(jī)制實現(xiàn)端到端的擁塞控制。當(dāng)網(wǎng)絡(luò)設(shè)備檢測到隊列長度超過ECN設(shè)定閾值時,會在IP頭部標(biāo)記ECN位。接收端收到標(biāo)記數(shù)據(jù)包后,向發(fā)送端反饋擁塞通知包(CNP),發(fā)送端據(jù)此動態(tài)調(diào)整發(fā)送速率,從源頭緩解擁塞。
PFC技術(shù)與ECN技術(shù)協(xié)同運(yùn)作,共同構(gòu)建了一個高吞吐、低延遲、零丟包的RoCEv2網(wǎng)絡(luò)環(huán)
作為深信服股份的全資子公司,信銳致力于為各行業(yè)用戶的數(shù)字化轉(zhuǎn)型提供面向未來的網(wǎng)絡(luò)聯(lián)接產(chǎn)品及解決方案,并與深信服聯(lián)合推出“網(wǎng)存一體化”的高性能分布式存儲無損網(wǎng)絡(luò)解決方案:
信銳RS6800-56CQ-EI-48V交換機(jī)提供48個10G/25G光口及8個40G/100G接口,具備高密25G下行能力,支持大規(guī)模分布式存儲集群組網(wǎng)。上行支持8個40G/100G接口,提供收斂比,可實現(xiàn)從25G到100G的平滑升級。硬件層面,設(shè)備采用可插拔電源與多風(fēng)扇設(shè)計,保障硬件高可靠性;組網(wǎng)層面,支持堆疊、M-LAG及生成樹等高可靠技術(shù),確保網(wǎng)絡(luò)架構(gòu)穩(wěn)定。


客服1