當前位置:首頁 > 科技文檔 > 計算機軟件及計算機應(yīng)用 > 正文

基于ECA-Net的雙信息流圖像字幕生成方法研究

光電子·激光 頁數(shù): 9 2024-03-22
摘要: 針對圖像字幕生成中由于視覺信息不足使生成的描述語句與圖像內(nèi)容不匹配的問題,提出一種基于高效通道注意力(efficient channel attention network, ECA-Net)的雙信息流圖像字幕生成方法。首先,該方法將圖像分割特征作為另一個視覺信息源,采用迭代獨立層歸一化(iterative independent layer normalization, II... (共9頁)

開通會員,享受整站包年服務(wù)