當前位置:首頁 > 科技文檔 > 計算機軟件及計算機應用 > 正文

視覺富文檔理解預訓練綜述

計算機科學 頁數(shù): 18 2024-08-26
摘要: 視覺富文檔指語義結(jié)構(gòu)不僅由文本內(nèi)容決定,還與排版格式和表格結(jié)構(gòu)等視覺元素相關(guān)的文檔?,F(xiàn)實生活中的票據(jù)理解和證件識別等應用場景,都需要對視覺富文檔進行自動化的閱讀、分析和處理。這一過程即為視覺富文檔理解,屬于自然語言處理和計算機視覺的交叉領(lǐng)域。近年來,視覺富文檔理解領(lǐng)域的預訓練技術(shù)在打破下游任務的訓練壁壘和提升模型表現(xiàn)上取得了重大的進展。然而,目前對現(xiàn)有的預訓練模型的歸納總結(jié)和深... (共18頁)

開通會員,享受整站包年服務