您當前的位置:首頁 > 書法

【2021.11.11概覽】arxiv每日語音合成相關更新

作者:由 LabmemZhouyx 發表于 書法時間:2021-11-11

1】

OSSEM: one-shot speaker adaptive speech enhancement using meta learning

概覽:本文提出了一種基於元學習的說話人自適應語音增強方法OSSEM,以one-shot方式實現系統對說話人的自適應,即使用一條音訊做模型部分結構的微調。模型結構包括一個基於transformer的SE網路和一個speaker-specific masking網路(SSM)。實驗結果顯示該方法能夠只基於一條語音對預訓練模型做有效自適應,並且達到和當前sota SE系統相當的效能。

【2021.11.11概覽】arxiv每日語音合成相關更新

【2021.11.11概覽】arxiv每日語音合成相關更新

個人看法:Meta-Learning開始在語音各領域中應用起來,整個結構比較明瞭,圖1對元學習訓練策略描述的也很清晰。

論文地址:

https://

arxiv。org/abs/2111。0570

3

標簽: 語音  OSSEM  shot  speaker  SE