【2021.11.11概覽】arxiv每日語音合成相關更新
作者:由 LabmemZhouyx 發表于 書法時間:2021-11-11
1】
OSSEM: one-shot speaker adaptive speech enhancement using meta learning
概覽:本文提出了一種基於元學習的說話人自適應語音增強方法OSSEM,以one-shot方式實現系統對說話人的自適應,即使用一條音訊做模型部分結構的微調。模型結構包括一個基於transformer的SE網路和一個speaker-specific masking網路(SSM)。實驗結果顯示該方法能夠只基於一條語音對預訓練模型做有效自適應,並且達到和當前sota SE系統相當的效能。
個人看法:Meta-Learning開始在語音各領域中應用起來,整個結構比較明瞭,圖1對元學習訓練策略描述的也很清晰。
論文地址:
https://
arxiv。org/abs/2111。0570
3