基于圖結(jié)構(gòu)特征和語義關(guān)聯(lián)度的無監(jiān)督藏文關(guān)鍵短語抽取方法
摘要: 在資源稀缺、語義結(jié)構(gòu)復(fù)雜的藏文語境下,關(guān)鍵短語抽取是一項具有挑戰(zhàn)性的自然語言處理任務(wù)?,F(xiàn)有藏文關(guān)鍵短語抽取方法依賴于詞頻和位置等統(tǒng)計特征,忽略了詞匯間的語義關(guān)系。該文提出了一種基于圖結(jié)構(gòu)特征和語義關(guān)聯(lián)度的無監(jiān)督藏文關(guān)鍵短語抽取方法。該方法使用藏文預(yù)訓(xùn)練語言模型和圖結(jié)構(gòu)特征來建模文檔,使用自注意力機制融合全局和局部信息表示;通過計算原始文檔與其掩碼版本之間的語義關(guān)聯(lián)度得分,采用綜... (共9頁)
開通會員,享受整站包年服務(wù)