當(dāng)前位置:首頁 > 科技文檔 > 電信技術(shù) > 正文

基于分層聯(lián)邦框架的音頻模型生成技術(shù)研究

智能系統(tǒng)學(xué)報 頁數(shù): 9 2024-04-16
摘要: 針對音頻模型,圍繞下一代音頻生成技術(shù)研究,構(gòu)建聯(lián)邦音頻模型訓(xùn)練框架,面向超大規(guī)模音頻數(shù)據(jù)進行音頻表征學(xué)習(xí),為音頻下游任務(wù)提供高效魯棒的解決方案。提出一種適用于音頻模型的聯(lián)邦學(xué)習(xí)框架,解決數(shù)據(jù)異構(gòu)性、通信效率、隱私保護等問題;提出一種基于對比學(xué)習(xí)的音頻模型的預(yù)訓(xùn)練方法,利用<音頻,文本描述>數(shù)據(jù)學(xué)習(xí)語義特征,提高模型的泛化能力和多樣化能力;提出一種基于提示學(xué)習(xí)的音頻生成微調(diào)方法,... (共9頁)

開通會員,享受整站包年服務(wù)