2019超導25強
全世界各行各業聯合起來,internet一定要實現!
eNews 正文

微軟和浙大聯合推出全新語音合成系統FastSpeech

2019-06-03 eNet&Ciweek/雅君

近日,微軟團隊聯合浙江大學提出了一種基于Transformer的新型前饋網絡FastSpeech。

FastSpeech采用一種新型的前饋Transformer網絡架構,拋棄掉傳統的編碼器-注意力-解碼器機制與自回歸的Transformer TTS相比,FastSpeech將梅爾譜的生成速度提高了近270倍,將端到端語音合成速度提高了38倍,單GPU上的語音合成速度達到了實時語音速度的30倍。

FastSpeech還將與并行神經聲碼器結合在一起訓練,語音領域或形成完全端到端訓練的語音到文本并行架構。


相關頻道: eNews

您對本文或本站有任何意見,請在下方提交,謝謝!

投稿信箱:[email protected]
廣告