基于跨尺度Vision Transformer的深度哈希算法
摘要: 為了解決當(dāng)前深度哈希算法提取跨尺度特征能力不足以及難以擬合數(shù)據(jù)的全局相似度分布問題,提出了一種基于跨尺度Vision Transformer的深度哈希算法。首先,利用金字塔卷積和跨尺度注意力機(jī)制構(gòu)建了一種多層次編碼器,來捕獲圖像豐富的語義信息;其次,提出了一種基于代理的深度哈希算法,該算法為每個(gè)類別生成哈希代理,使得哈希碼可以學(xué)習(xí)具有鑒別性的類別特征,從而縮小與同類別哈希代理的... (共7頁)
開通會員,享受整站包年服務(wù)