基于字形特征的中文醫(yī)學(xué)命名實(shí)體識別方法
摘要: 作為醫(yī)學(xué)信息抽取的第一個(gè)關(guān)鍵環(huán)節(jié),醫(yī)學(xué)命名實(shí)體識別任務(wù)旨在從如電子醫(yī)療病例、中文醫(yī)藥說明書等非結(jié)構(gòu)化文本中抽取出醫(yī)學(xué)相關(guān)的實(shí)體.目前大多數(shù)中文醫(yī)學(xué)命名實(shí)體識別工作通過在預(yù)訓(xùn)練模型上進(jìn)行微調(diào)來獲得文本表示向量,然后利用特征工程來提升模型在醫(yī)療領(lǐng)域上的性能.這些模型大部分源自在通用數(shù)據(jù)集上表現(xiàn)較好的模型,沒有考慮中文醫(yī)學(xué)數(shù)據(jù)集的語言特性.通過在多個(gè)醫(yī)學(xué)數(shù)據(jù)集上進(jìn)行統(tǒng)計(jì)分析,發(fā)現(xiàn)部分... (共10頁)
開通會員,享受整站包年服務(wù)