基于可學(xué)習(xí)圖比率掩碼估計(jì)的圖頻域語音增強(qiáng)方法
信號處理
頁數(shù): 12 2024-01-29
摘要: 在基于深度神經(jīng)網(wǎng)絡(luò)(deep neural network, DNN)的時(shí)頻域語音增強(qiáng)方法中,通常將短時(shí)傅里葉變換(short-time Fourier transform, STFT)得到的復(fù)數(shù)域含噪語音時(shí)頻譜作為DNN輸入,以估計(jì)純凈語音的幅度和相位。此類方法由于會(huì)涉及對復(fù)數(shù)的運(yùn)算,計(jì)算復(fù)雜度和模型參數(shù)量較大。針對此問題,本文利用圖信號處理(graph signal pro... (共12頁)
開通會(huì)員,享受整站包年服務(wù)