視覺富文檔理解預訓練綜述
計算機科學
頁數(shù): 18 2024-08-26
摘要: 視覺富文檔指語義結(jié)構(gòu)不僅由文本內(nèi)容決定,還與排版格式和表格結(jié)構(gòu)等視覺元素相關(guān)的文檔?,F(xiàn)實生活中的票據(jù)理解和證件識別等應用場景,都需要對視覺富文檔進行自動化的閱讀、分析和處理。這一過程即為視覺富文檔理解,屬于自然語言處理和計算機視覺的交叉領(lǐng)域。近年來,視覺富文檔理解領(lǐng)域的預訓練技術(shù)在打破下游任務的訓練壁壘和提升模型表現(xiàn)上取得了重大的進展。然而,目前對現(xiàn)有的預訓練模型的歸納總結(jié)和深... (共18頁)
開通會員,享受整站包年服務