當前位置:首頁 > 科技文檔 > 計算機軟件及計算機應(yīng)用 > 正文

基于圖結(jié)構(gòu)特征和語義關(guān)聯(lián)度的無監(jiān)督藏文關(guān)鍵短語抽取方法

中文信息學(xué)報 頁數(shù): 9 2024-11-15
摘要: 在資源稀缺、語義結(jié)構(gòu)復(fù)雜的藏文語境下,關(guān)鍵短語抽取是一項具有挑戰(zhàn)性的自然語言處理任務(wù)?,F(xiàn)有藏文關(guān)鍵短語抽取方法依賴于詞頻和位置等統(tǒng)計特征,忽略了詞匯間的語義關(guān)系。該文提出了一種基于圖結(jié)構(gòu)特征和語義關(guān)聯(lián)度的無監(jiān)督藏文關(guān)鍵短語抽取方法。該方法使用藏文預(yù)訓(xùn)練語言模型和圖結(jié)構(gòu)特征來建模文檔,使用自注意力機制融合全局和局部信息表示;通過計算原始文檔與其掩碼版本之間的語義關(guān)聯(lián)度得分,采用綜... (共9頁)

開通會員,享受整站包年服務(wù)