阿里創(chuàng)新神經(jīng)網(wǎng)絡(luò)硬件架構(gòu),論文入選國(guó)際頂會(huì)ISCA 2022
6月23日,國(guó)際體系結(jié)構(gòu)領(lǐng)域頂會(huì)ISCA 2022剛剛落下帷幕,阿里達(dá)摩院在圖神經(jīng)網(wǎng)絡(luò)計(jì)算領(lǐng)域的論文被大會(huì)收錄,文章開創(chuàng)性地提出了一種全新的硬件架構(gòu),可大幅提升圖神經(jīng)網(wǎng)絡(luò)處理效率,降低一半硬件成本。
ISCA、MICRO、HPCA并稱為體系結(jié)構(gòu)領(lǐng)域三大頂級(jí)會(huì)議,ISCA創(chuàng)辦于1973年,見證了諸多突破性成果的首次亮相,包括谷歌、英特爾、英偉達(dá)等企業(yè)在半導(dǎo)體領(lǐng)域的多項(xiàng)技術(shù)創(chuàng)新。官方信息顯示,ISCA論文錄取率常年低于20%。近兩年,阿里巴巴已有多個(gè)成果在該會(huì)議亮相,是ISCA歷史上論文入選最多的中國(guó)企業(yè)。
本次入選的達(dá)摩院論文,致力于解決圖神經(jīng)網(wǎng)絡(luò)硬件的問題。圖神經(jīng)網(wǎng)絡(luò)是人工智能領(lǐng)域的熱門技術(shù)之一,可應(yīng)用于蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)、分子制藥、推薦系統(tǒng)、金融風(fēng)控等領(lǐng)域。大規(guī)模圖神經(jīng)網(wǎng)絡(luò)的處理,對(duì)存儲(chǔ)規(guī)模、通信時(shí)延的要求更高,如果僅靠傳統(tǒng)硬件處理,效率低下。
在該論文中,達(dá)摩院提出了一種新的硬件架構(gòu),可硬件卸載遠(yuǎn)端內(nèi)存訪問,提升并行度、減小延時(shí)。該架構(gòu)以玄鐵906處理器為控制核心,并輔以本地訪存加速器Access Engine(AxE)以及遠(yuǎn)端訪存加速器Memory-Over-Fabric(MoF)。該硬件系統(tǒng)高效地分擔(dān)了傳統(tǒng)CPU的部分任務(wù),大幅減小訪存延時(shí),并增加了帶寬利用率。
達(dá)摩院基于此架構(gòu)實(shí)現(xiàn)了單機(jī)四卡FPGA的原型系統(tǒng),并通過AliGraph軟件部署到云端,根據(jù)測(cè)試,相比購(gòu)買CPU服務(wù),使用該原型系統(tǒng)的云上FPGA性價(jià)比提升約 2倍。
達(dá)摩院研究人員表示:“大規(guī)模圖神經(jīng)網(wǎng)絡(luò)的應(yīng)用越來越廣闊,但業(yè)界主流加速方案多數(shù)仍局限于圖數(shù)據(jù)量較小的場(chǎng)景,我們研發(fā)的硬件架構(gòu)可有效解決大規(guī)模分布式圖神經(jīng)網(wǎng)絡(luò)的硬件瓶頸。”
據(jù)介紹,2020年,阿里巴巴三篇論文入選ISCA,創(chuàng)造國(guó)內(nèi)企業(yè)紀(jì)錄,相關(guān)論文研究包括玄鐵910處理器、存算一體芯片以及AI硬件基準(zhǔn)測(cè)試等。
2、電商號(hào)平臺(tái)僅提供信息存儲(chǔ)服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對(duì)本稿件有異議或投訴,請(qǐng)聯(lián)系:info@dsb.cn
