基于ASP-SERes2Net的說話人識(shí)別算法
摘要: 為提升說話人識(shí)別的特征提取能力,解決在噪聲環(huán)境下識(shí)別率低的問題,提出一種基于殘差網(wǎng)絡(luò)的說話人識(shí)別算法——ASP-SERes2Net。首先,采用梅爾語譜圖作為神經(jīng)網(wǎng)絡(luò)的輸入;其次,改進(jìn)Res2Net網(wǎng)絡(luò)的殘差塊,并且在每個(gè)殘差塊后引入壓縮激活(squeeze-and-excitation, SE)注意力模塊;然后,用注意力統(tǒng)計(jì)池化(attention statistics poo... (共9頁)
開通會(huì)員,享受整站包年服務(wù)