用于聲音事件定位與檢測(cè)的空間信息增強(qiáng)方法
摘要: 聲音事件定位與檢測(cè)包含到達(dá)方向估計(jì)和聲音事件檢測(cè)兩個(gè)子任務(wù)。作為當(dāng)前聲音事件定位與檢測(cè)領(lǐng)域中應(yīng)用最為廣泛的模型之一,卷積循環(huán)神經(jīng)網(wǎng)絡(luò)模型采用卷積神經(jīng)網(wǎng)絡(luò)分別從單個(gè)音頻通道中提取特征,這導(dǎo)致模型丟失了不同通道間的相關(guān)信息。然而,通道間的相關(guān)信息蘊(yùn)含了與聲源位置相關(guān)的空間線索,空間信息的缺失必然會(huì)影響模型的到達(dá)方向估計(jì)性能。此外,卷積循環(huán)神經(jīng)網(wǎng)絡(luò)模型中使用的交叉熵?fù)p失函數(shù)還會(huì)引起特... (共13頁)
開通會(huì)員,享受整站包年服務(wù)