在2025年華為全聯(lián)接大會(huì)的現(xiàn)場(chǎng),當(dāng)“昇騰”二字以光影形式躍然于大屏幕之上時(shí),會(huì)場(chǎng)內(nèi)的空氣仿佛凝固了一瞬。沒(méi)有預(yù)想中的歡呼與掌聲,取而代之的是此起彼伏的深呼吸聲與泛紅的眼眶。這一刻,距離2018年昇騰310芯片問(wèn)世、2019年昇騰910芯片發(fā)布,已跨越兩千多個(gè)日夜。這場(chǎng)跨越不僅記錄著技術(shù)迭代的軌跡,更鐫刻著一家企業(yè)在極端壓力下的生存智慧。
時(shí)間回溯至2019年春,美國(guó)制裁令華為供應(yīng)鏈驟然緊繃。彼時(shí)華為輪值董事長(zhǎng)徐直軍在發(fā)布昇騰910商用時(shí)仍保持從容,但暗流早已涌動(dòng)。“當(dāng)時(shí)備貨的昇騰910芯片,我們只敢供給國(guó)計(jì)民生領(lǐng)域客戶,互聯(lián)網(wǎng)企業(yè)都不敢賣(mài)。”他坦言,這場(chǎng)突如其來(lái)的風(fēng)暴將華為從技術(shù)高光時(shí)刻推入孤立境地,芯片之路一度被外界視為“死局”。
真正的突圍始于對(duì)技術(shù)路徑的重新定義。當(dāng)外界聚焦于單芯片性能時(shí),華為已轉(zhuǎn)向系統(tǒng)級(jí)創(chuàng)新。2024年3月推出的Atlas 900超節(jié)點(diǎn),通過(guò)384顆昇騰910C芯片構(gòu)建起300 PFLOPS算力的計(jì)算集群,其CloudMatrix384云服務(wù)實(shí)例更被海外分析機(jī)構(gòu)SemiAnalysis評(píng)價(jià)為“在多項(xiàng)關(guān)鍵指標(biāo)上超越英偉達(dá)GB200 NVL72系統(tǒng)”。這種超越并非源于芯片制程優(yōu)勢(shì),而是源于對(duì)計(jì)算架構(gòu)的顛覆性重構(gòu)。
“英特爾曾允許我們使用CPU互聯(lián)協(xié)議,后來(lái)連這個(gè)都被禁止了。”徐直軍揭示技術(shù)突圍的艱辛歷程。從光器件到互聯(lián)芯片,華為不得不重新定義每個(gè)技術(shù)環(huán)節(jié)。這種全鏈條自主創(chuàng)新催生出獨(dú)特的超節(jié)點(diǎn)架構(gòu)——通過(guò)靈衢互聯(lián)協(xié)議,將數(shù)萬(wàn)顆計(jì)算卡連接成邏輯上的單一計(jì)算體。相較于英偉達(dá)NVlink的封閉生態(tài),華為選擇開(kāi)放靈衢2.0技術(shù)規(guī)范,試圖構(gòu)建更廣闊的產(chǎn)業(yè)生態(tài)。
在芯片規(guī)劃層面,華為展現(xiàn)出激進(jìn)的技術(shù)演進(jìn)路線。至2028年,昇騰系列將形成Ascend 950/960/970三大產(chǎn)品矩陣,算力密度每年翻倍提升。其中970系列支持4TB/s互聯(lián)帶寬,F(xiàn)P4算力達(dá)8 PFLOPS,自研HBM內(nèi)存帶寬較前代翻四番。這些參數(shù)背后,是華為對(duì)AI訓(xùn)練需求爆炸式增長(zhǎng)的精準(zhǔn)預(yù)判。
生態(tài)建設(shè)成為另一場(chǎng)靜默的革命。面對(duì)開(kāi)發(fā)者對(duì)CUDA生態(tài)的路徑依賴,華為堅(jiān)持打造CANN生態(tài)與MindSpore框架。“就像談戀愛(ài),不用怎么知道合不合適?”徐直軍比喻道。這種看似“逆流”的選擇,實(shí)則是為構(gòu)建不受西方技術(shù)體系制約的自主生態(tài)鋪路。當(dāng)被問(wèn)及與英偉達(dá)的競(jìng)爭(zhēng)時(shí),他直言:“除了單芯片算力小一點(diǎn)、功耗大一點(diǎn),其他都是優(yōu)勢(shì)。”
超節(jié)點(diǎn)戰(zhàn)略的深層邏輯在于將技術(shù)短板轉(zhuǎn)化為系統(tǒng)優(yōu)勢(shì)。2022年英偉達(dá)DGX H100 NVL256項(xiàng)目因成本與可靠性問(wèn)題擱淺,而華為最新發(fā)布的Atlas 950/960 SuperPoD超節(jié)點(diǎn)分別支持8192及15488張昇騰卡,算力規(guī)模突破百萬(wàn)卡級(jí)別。這種集群化部署不僅規(guī)避了芯片制程限制,更通過(guò)光通信技術(shù)實(shí)現(xiàn)低損耗、長(zhǎng)距離互聯(lián)——相較于英偉達(dá)的全銅通信方案,華為的光模塊策略使單節(jié)點(diǎn)可連接芯片數(shù)量提升數(shù)個(gè)量級(jí)。
“創(chuàng)新有時(shí)是被逼出來(lái)的。”徐直軍坦陳技術(shù)突圍的無(wú)奈與必然。當(dāng)海思芯片暫時(shí)失去制程優(yōu)勢(shì),華為轉(zhuǎn)而通過(guò)“非摩爾補(bǔ)摩爾”策略,在系統(tǒng)架構(gòu)、數(shù)學(xué)算法等領(lǐng)域構(gòu)建護(hù)城河。這種轉(zhuǎn)型在靈衢互聯(lián)協(xié)議上體現(xiàn)得尤為明顯,其通過(guò)正向負(fù)向全雙工傳輸設(shè)計(jì),解決了大模型訓(xùn)練中前所未有的數(shù)據(jù)洪流挑戰(zhàn)。
在華為的技術(shù)版圖中,超節(jié)點(diǎn)與集群戰(zhàn)略已上升為核心層級(jí)。這種選擇既是對(duì)現(xiàn)實(shí)約束的妥協(xié),更是對(duì)未來(lái)計(jì)算形態(tài)的前瞻布局。當(dāng)業(yè)界仍在討論單芯片性能時(shí),華為已通過(guò)系統(tǒng)級(jí)創(chuàng)新證明:真正的算力革命不在于晶體管密度的競(jìng)賽,而在于如何讓數(shù)萬(wàn)顆芯片協(xié)同演繹出超越物理極限的計(jì)算樂(lè)章。
本文鏈接:http://m.rrqrq.com/showinfo-24-183194-0.html對(duì)話徐直軍:華為AI算力突圍,以“超節(jié)點(diǎn)+集群”走出自主創(chuàng)新路
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com