您當前的位置:首頁 > 書法

【2021.11.01概覽】arxiv每日語音合成相關更新

作者:由 LabmemZhouyx 發表于 書法時間:2021-11-01

1】

VRAIN-UPV MLLP's system for the Blizzard Challenge 2021

洛桑聯邦理工學院

概覽:本文是針對Blizzard Challenge 2021比賽的SH1任務(用5小時單人錄音資料搭建一個西班牙語合成系統),提出了一種結合顯式時長建模的非自迴歸聲學模型+GAN-based聲碼器的合成系統。其中,非自迴歸聲學模型是基於ForwardTacotron,聲碼器基於HiFi-GAN。另外本系統在建模時長資訊時,引入了一個額外的CTC loss來進行語音幀和音素的強制對齊。

【2021.11.01概覽】arxiv每日語音合成相關更新

【2021.11.01概覽】arxiv每日語音合成相關更新

個人看法:可視為一個相對SOTA也較簡潔的TTS系統搭建教程,從資料處理到模型結構。其中用CTC loss來關聯STT和TTS兩個模組,端到端地進行顯式時長建模比較有借鑑意義。

論文地址:

https://

arxiv。org/abs/2110。1579

2

標簽: 建模  Blizzard  challenge  2021  顯式