代码拉取完成,页面将自动刷新
(简体中文|English)
PP-TTS 是 PaddleSpeech 自研的流式语音合成系统。在实现前沿算法的基础上,使用了更快的推理引擎,实现了流式语音合成技术,使其满足商业语音交互场景的需求。
语音合成基本流程如下图所示:
PP-TTS 默认提供基于 FastSpeech2 声学模型和 HiFiGAN 声码器的中文流式语音合成系统:
PaddleSpeech TTS 模型之间的性能对比,请查看 TTS-Benchmark。
Default FastSpeech2:tts3/run.sh
流式 FastSpeech2:tts3/run_cnndecoder.sh
HiFiGAN:voc5/run.sh
一键式实现语音合成:text_to_speech
个性化语音合成 - 基于 FastSpeech2 模型的个性化语音合成:style_fs2
会说话的故事书 - 基于 OCR 和语音合成的会说话的故事书:story_talker
元宇宙 - 基于语音合成的 2D 增强现实:metaverse
一键式搭建非流式语音合成服务:speech_server
一键式搭建流式语音合成服务:streaming_tts_server
更多教程,包括模型设计、模型训练、推理部署等,请参考 AIStudio 教程:PP-TTS:流式语音合成原理及服务部署
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。