當前位置:首頁 > 科技文檔 > 計算機硬件技術(shù) > 正文

面向飛騰處理器平臺的快速卷積算法優(yōu)化

上海理工大學學報 頁數(shù): 10 2024-12-09
摘要: 為解決卷積神經(jīng)網(wǎng)絡(luò)難以在計算資源受限設(shè)備上部署的問題,面向國產(chǎn)FT-2000/4多核處理器提出一種高性能的快速卷積算法FastInfer。采用分塊策略優(yōu)化通用矩陣乘法,將處理器訪問頻率高的數(shù)據(jù)存入更靠近處理器的緩存中,從而提高計算過程中的訪存效率。配合分塊方案設(shè)計實現(xiàn)高性能的矩陣乘法微內(nèi)核,使用向量外積運算更新數(shù)據(jù),提高計算訪存比,實現(xiàn)最大程度掩蓋訪存指令的延遲。最終實驗結(jié)果表... (共10頁)

開通會員,享受整站包年服務(wù)