當(dāng)前位置:首頁 > 科技文檔 > 計算機(jī)軟件及計算機(jī)應(yīng)用 > 正文

基于多頭注意力機(jī)制與長短期記憶網(wǎng)絡(luò)的自然場景文本識別

傳感技術(shù)學(xué)報 頁數(shù): 6 2024-12-15
摘要: 隨著計算機(jī)視覺和自然語言處理技術(shù)的不斷發(fā)展,自然場景文本檢測與識別技術(shù)已成為計算機(jī)視覺領(lǐng)域的研究熱點之一。提出了一種基于多頭注意力機(jī)制與長短期記憶網(wǎng)絡(luò)(LSTM)的自然場景文本檢測與識別方法。該方法通過結(jié)合目標(biāo)檢測算法和序列識別算法,利用多頭注意力機(jī)制對圖像中的文本區(qū)域進(jìn)行精確的定位和特征提取,進(jìn)而通過LSTM網(wǎng)絡(luò)對提取的特征進(jìn)行編碼和解碼,實現(xiàn)對自然場景中文本的準(zhǔn)確識別。在文... (共6頁)

開通會員,享受整站包年服務(wù)