基于雙通道特征融合網(wǎng)絡(luò)的語(yǔ)音情感識(shí)別
摘要: 針對(duì)語(yǔ)音情感識(shí)別中判別性的情感特征提取難題,結(jié)合卷積神經(jīng)網(wǎng)絡(luò)和視覺(jué)transformer網(wǎng)絡(luò)結(jié)構(gòu),提出一種雙通道特征融合的語(yǔ)音表征方法。使用基于倒瓶頸結(jié)構(gòu)的卷積模塊通道,并引入類transformer訓(xùn)練策略提取局部頻譜特征,通過(guò)改進(jìn)視覺(jué)transformer提取全局序列特征,利用卷積神經(jīng)網(wǎng)絡(luò)直接提取整個(gè)語(yǔ)譜圖代替分塊部分,更好地提取時(shí)序信息,將提取到的特征信息進(jìn)行融合,能夠獲... (共8頁(yè))
開(kāi)通會(huì)員,享受整站包年服務(wù)