借助語音和面部圖像的雙模態(tài)情感識(shí)別
摘要: 為提升情感識(shí)別模型的準(zhǔn)確率,解決情感特征提取不充分的問題,對(duì)語音和面部圖像的雙模態(tài)情感識(shí)別進(jìn)行研究。語音模態(tài)提出一種結(jié)合通道-空間注意力機(jī)制的多分支卷積神經(jīng)網(wǎng)絡(luò)(Multi-branch Convolutional Neural Networks, MCNN)的特征提取模型,在時(shí)間、空間和局部特征維度對(duì)語音頻譜圖提取情感特征;面部圖像模態(tài)提出一種殘差混合卷積神經(jīng)網(wǎng)絡(luò)(Resid... (共11頁(yè))
開通會(huì)員,享受整站包年服務(wù)