【ZiDongHua 之“會(huì)展賽培壇”收錄關(guān)鍵詞: 合見工軟 EDA 電子設(shè)計(jì)自動(dòng)化
  
  賦能智算時(shí)代Scale-up互聯(lián),合見工軟網(wǎng)絡(luò)IP作為ETH-X傳輸層協(xié)議方案亮相ODCC春季會(huì)議
  
  日前,2025開放數(shù)據(jù)中心委員會(huì)(以下簡(jiǎn)稱ODCC)春季全會(huì)在揚(yáng)州召開,中國(guó)數(shù)字EDA/IP龍頭企業(yè)上海合見工業(yè)軟件集團(tuán)有限公司(簡(jiǎn)稱“合見工軟”)作為ODCC成員單位亮相大會(huì),合見工軟副總裁楊凱作為ODCC網(wǎng)絡(luò)工作組代表,發(fā)布了合見針對(duì)智算網(wǎng)絡(luò)Scale-up課題ETH-X傳輸層協(xié)議(PAXI)的創(chuàng)新設(shè)計(jì),該協(xié)議設(shè)計(jì)不僅支持內(nèi)存語(yǔ)義,還具備低延遲、高帶寬和高可靠性的特點(diǎn),能夠支持多達(dá)256卡的全互聯(lián),支持使用通用以太網(wǎng)交換機(jī)組網(wǎng)。同時(shí)合見工軟還推出了標(biāo)準(zhǔn)的IP和VIP產(chǎn)品,包括:傳輸層(PAXI IP) 、標(biāo)準(zhǔn)200G/400G/800G MAC/PCS/FEC IP,以及一套完整的組網(wǎng)驗(yàn)證方案,為智算芯片的高效互聯(lián)設(shè)計(jì)提供了強(qiáng)有力的技術(shù)保障。
 
  
  ▲合見工軟副總裁楊凱作為網(wǎng)絡(luò)工作組代表分享
  
  隨著大語(yǔ)言模型規(guī)模的持續(xù)增長(zhǎng)和相關(guān)應(yīng)用的廣泛普及,智算芯片對(duì)算力的需求呈現(xiàn)指數(shù)級(jí)增長(zhǎng),進(jìn)而推動(dòng)了芯片底層互聯(lián)技術(shù)的迅猛發(fā)展。在這一背景下,智算芯片的互聯(lián)技術(shù)在帶寬、延遲和互聯(lián)結(jié)構(gòu)等方面面臨著前所未有的挑戰(zhàn)。從傳統(tǒng)的多卡直連到超節(jié)點(diǎn)組網(wǎng),原有的卡間互聯(lián)協(xié)議已難以應(yīng)對(duì)日益增長(zhǎng)的需求。隨著高速Serdes技術(shù)的成熟,新型互聯(lián)協(xié)議在智算芯片的Scale-Up組網(wǎng)中扮演了至關(guān)重要的角色。
  
  NVIDIA使用NVLINK作為GPU Scale UP互聯(lián)技術(shù),也是其將數(shù)百個(gè)GPU互聯(lián)成超級(jí)GPU的關(guān)鍵技術(shù)。針對(duì)超節(jié)點(diǎn)互聯(lián)協(xié)議,國(guó)內(nèi)外多家企業(yè)和組織提出了多種不同的Scale-Up協(xié)議。
  
  合見工軟ETH-X Scale-Up傳輸層協(xié)議方案
 
  
  功能介紹
  
  基于AXI協(xié)議和以太網(wǎng)協(xié)議的芯片間高速低延遲互聯(lián)接口
  
  支持原生AXI4/APB3協(xié)議接口
  
  提供3個(gè)WRR優(yōu)先級(jí)的虛擬通道
  
  基于信用的端到端流量控制機(jī)制
  
  支持MACL2層重傳,可支持通過以太網(wǎng)交換機(jī)的端到端重傳
  
  基于RS272 FEC數(shù)據(jù)塊的L1層重傳機(jī)制
  
  支持雙向延遲測(cè)量(往返時(shí)延)
  
  可配置的MAC目標(biāo)地址動(dòng)態(tài)映射
  
  支持PFC(優(yōu)先級(jí)流量控制)/Pause幀流量控制
  
  支持超頻工作模式
  
  可配置的AXI OST數(shù)量
  
  通過Scale up提升算力和性能的關(guān)鍵困難之一就是延遲問題,通過ETH-X Scale-Up傳輸層協(xié)議方案可以從三個(gè)方面減少互聯(lián)延遲,進(jìn)行優(yōu)化:
  
  減少訪存次數(shù)——降低搬運(yùn)內(nèi)存數(shù)據(jù)的總延遲,減少NOC的壓力。
  
  降低鏈路延遲——使用低延遲的FEC(RS272),簡(jiǎn)化MAC的功能。
  
  簡(jiǎn)化軟件操作——使用內(nèi)存語(yǔ)義的操作,多卡做統(tǒng)一編址可當(dāng)作一卡管理。
  
  Scale-Up協(xié)議的可靠性、完整性、可實(shí)現(xiàn)性、生態(tài)適配,都需要有效的研發(fā)手段和開發(fā)方式,相關(guān)IP需要在提供給芯片廠商使用的時(shí)候就能達(dá)到最好的狀態(tài)。合見工軟現(xiàn)可為ETH-X Scale-Up協(xié)議提供商業(yè)化標(biāo)準(zhǔn)IP,包括:標(biāo)準(zhǔn)傳輸層IP+標(biāo)準(zhǔn)以太網(wǎng)MAC/PCS/FEC,IP級(jí)別的仿真驗(yàn)證環(huán)境(VIP),及完整的技術(shù)文檔。
  
  同時(shí),Scale-Up傳輸協(xié)議復(fù)雜度較高,針對(duì)芯片設(shè)計(jì)階段,協(xié)議的可實(shí)現(xiàn)性、性能測(cè)試方案、組網(wǎng)的功能測(cè)試方案等,芯片廠商短時(shí)間內(nèi)很難具備上述能力,阻礙芯片設(shè)計(jì)企業(yè)使用新的Scale-Up傳輸層。合見工軟特此為芯片設(shè)計(jì)企業(yè)提供了成熟的ETH-X Scale-Up協(xié)議的組網(wǎng)驗(yàn)證原型平臺(tái),使用全速的400G接口對(duì)接51.2T交換機(jī),實(shí)現(xiàn)多節(jié)點(diǎn)ETH-X 傳輸協(xié)議的組網(wǎng)驗(yàn)證。提供開放和易用的框架,快速結(jié)合客戶的邏輯進(jìn)行驗(yàn)證,同時(shí)提供可擴(kuò)展的驗(yàn)證規(guī)模,支持8節(jié)點(diǎn)、16節(jié)點(diǎn)、最大到128節(jié)點(diǎn)驗(yàn)證規(guī)模。幫助GPU/AI芯片廠商快速完成協(xié)議的評(píng)估和相關(guān)IP的集成,解決新協(xié)議驗(yàn)證帶來挑戰(zhàn),縮短芯片廠商研發(fā)時(shí)間,同時(shí)提供有效的軟硬件協(xié)同開發(fā)平臺(tái),加速軟件開發(fā)。
  
  ▲合見工軟ETH-X Scale-Up組網(wǎng)驗(yàn)證平臺(tái)
  
  以太網(wǎng)超節(jié)點(diǎn)互聯(lián)項(xiàng)目是ODCC網(wǎng)絡(luò)工作組的關(guān)鍵課題之一。該項(xiàng)目由中國(guó)信通院、騰訊聯(lián)合GPU/CPU芯片、服務(wù)器、交換機(jī)企業(yè)等多家合作伙伴,秉承開放創(chuàng)新原則,加速推進(jìn)各項(xiàng)先進(jìn)網(wǎng)絡(luò)技術(shù)在算力中心領(lǐng)域的創(chuàng)新實(shí)踐與應(yīng)用落地。
  
  
  關(guān)于合見工軟
  
  上海合見工業(yè)軟件集團(tuán)有限公司(簡(jiǎn)稱“合見工軟”)作為自主創(chuàng)新的高性能工業(yè)軟件及解決方案提供商,以EDA(電子設(shè)計(jì)自動(dòng)化,Electronic Design Automation)領(lǐng)域?yàn)槭紫韧黄品较?,致力于幫助半?dǎo)體芯片企業(yè)解決在創(chuàng)新與發(fā)展過程中所面臨的嚴(yán)峻挑戰(zhàn)和關(guān)鍵問題,并成為他們值得信賴的合作伙伴。