[中國,銀川,2023年8月18日]在第二屆“西部數谷”算力產業(yè)大會期間,主題為“算融星光,網聚銀河”的算網融合分論壇同步舉辦。本論壇匯聚眾多位工程院院士、國內算力領域的頂尖專家、學者,共同探討新形勢下,算力前沿技術未來的發(fā)展趨勢。華為數據通信產品線數據中心網絡領域副總裁張白發(fā)表了主題為《華為星河AI網絡,高運力釋放AI時代高算力》的演講。

華為數據中心領域副總裁張白發(fā)表主題演講
張白表示:“自2020年至今,AI掀起了科技新熱潮,ChatGPT的出現無疑加速了AI發(fā)展的步伐,大模型引領AI進入新的發(fā)展階段。大模型訓練是個復雜的系統工程,網絡基礎設施是長穩(wěn)訓練的關鍵之一。華為提出星河AI網絡,融合運得多、運得快、運得穩(wěn),三大優(yōu)勢,為客戶提供大規(guī)模、高吞吐、高可靠的網絡建設,釋放AI時代高算力!”
運得多:大帶寬,大組網
首先,AI場景中大模型是未來的趨勢,適配萬卡集群是網絡最基本的要求,華為打造端到端200GE/400GE設備構建大帶寬AI無損網絡,4倍于業(yè)界規(guī)模,完美匹配AI場景訴求,支撐網絡運得多。
運得快:高吞吐,性能加速
其次,華為采用算網一體化的方式部署,效率可以提升10倍以上,整個過程自動校驗0配置差錯,大大縮減了時間和人力成本。獨創(chuàng)AI網絡加速器,大大提高網絡吞吐,以圖片處理為例,傳統場景每秒只能處理2330張圖片,而華為網絡每秒可以處理2924張圖片,訓練效率提升了20%,保障網絡運得快。
運得穩(wěn):月級訓練不中斷
最后,AI訓練實際上不會一路暢通,大規(guī)模高性能網絡的運維也是一大難題,華為采用智能化運維保證訓練全程實時可視,分鐘級識別慢主機(丟包、超時延),保障集群持續(xù)穩(wěn)定運行,月級訓練無中斷,護航網絡運得穩(wěn)。
華為星河AI網絡,通過網絡控制器、網絡、計算強強聯手實現算網一體融合,實現算力網絡“運得多,運得快,運得穩(wěn)”的目標,高運力釋放AI時代高算力!論壇上,中國通信院云大所所長何寶宏也對此方案能力表達了深切認可。
目前,華為星河AI網絡已在全球100+企業(yè)部署商用。面向未來,華為將繼續(xù)攜手客戶和伙伴一起推動AI大模型創(chuàng)新變革,通過行業(yè)實踐和驗證加快AI產業(yè)化落地,引領社會發(fā)展的新進程。