#RePost #GitHub #TTS

🗣 **ChatTTS - 对话式高可控的语音合成模型**

▎项目功能:文本转语音模型

▎项目介绍:一款专门为对话场景设计的文本转语音模型,例如LLM助手对话任务,支持英文和中文两种语言。

最大的模型使用了 10 万小时以上的中英文数据进行训练。在 HuggingFace 中开源的版本为 4 万小时训练且未 SFT 的版本。

使用需知

🔴为了限制 ChatTTS 的使用,我们在 4w 小时模型的训练过程中添加了少量额外的高频噪音,并用 mp3 格式尽可能压低了音质,以防不法分子用于潜在的犯罪可能。同时我们在内部训练了检测模型,并计划在未来开放。

▎项目亮点:

对话式 TTS:

ChatTTS针对对话式任务进行了优化,实现了自然流畅的语音合成,同时支持多说话人。

细粒度控制:

该模型能够预测和控制细粒度的韵律特征,包括笑声、停顿和插入词等。

更好的韵律:

ChatTTS在韵律方面超越大部分开源TTS模型。同时提供预训练模型,支持进一步研究。

▎相关推荐:

🔵**ChatTTS_colab - 基于 ChatTTS ,支持音色抽卡、长音频生成和分角色朗读**

🔵**ChatTTS-Forge - 提供了完善的 ChatTTS 封装,包括 API WebUI Playground**

https://github.com/panyanyany/Awesome-ChatTTS

▎项目地址:**点击打开**

Message link
 
 
Back to Top
OKHK