【2021.11.11概覽】arxiv每日語音合成相關更新

作者：由 LabmemZhouyx 發表于書法時間：2021-11-11

1】

OSSEM: one-shot speaker adaptive speech enhancement using meta learning

概覽：本文提出了一種基於元學習的說話人自適應語音增強方法OSSEM，以one-shot方式實現系統對說話人的自適應，即使用一條音訊做模型部分結構的微調。模型結構包括一個基於transformer的SE網路和一個speaker-specific masking網路（SSM）。實驗結果顯示該方法能夠只基於一條語音對預訓練模型做有效自適應，並且達到和當前sota SE系統相當的效能。