一種基于WordNet和Corpus Statistics的語義相似性計(jì)算方法
摘要: 提出一種新的基于WordNet和文本集語義參數(shù)IC的計(jì)算方法,通過綜合考慮概念在WordNet中語義信息以及數(shù)據(jù)集中的概率信息,即概念的自信息,同時(shí)利用新的參數(shù)考慮概念對在WordNet中的共享信息,設(shè)計(jì)了一種通用的概念語義相似性計(jì)算方法,該方法簡化了傳統(tǒng)語義相似性算法,并解決了語義相似性計(jì)算領(lǐng)域的相關(guān)問題,可以應(yīng)用在信息抽取、信息檢索、文檔分類及本體學(xué)習(xí)中.領(lǐng)域通用的數(shù)據(jù)集R&B數(shù)據(jù)實(shí)驗(yàn)結(jié)果表明,該方法在計(jì)算語義相似度問題上有效。 (共6頁)
開通會員,享受整站包年服務(wù)