#RePost #GitHub #TTS🗣 **ChatTTS - 对话式高可控的语音合成模型**▎项目功能

#RePost #GitHub #TTS

🗣 **ChatTTS - 对话式高可控的语音合成模型**

▎项目功能：文本转语音模型

▎项目介绍：一款专门为对话场景设计的文本转语音模型，例如LLM助手对话任务，支持英文和中文两种语言。

最大的模型使用了 10 万小时以上的中英文数据进行训练。在 HuggingFace 中开源的版本为 4 万小时训练且未 SFT 的版本。

❗使用需知

🔴为了限制 ChatTTS 的使用，我们在 4w 小时模型的训练过程中添加了少量额外的高频噪音，并用 mp3 格式尽可能压低了音质，以防不法分子用于潜在的犯罪可能。同时我们在内部训练了检测模型，并计划在未来开放。

▎项目亮点：

⏺对话式 TTS:

ChatTTS针对对话式任务进行了优化，实现了自然流畅的语音合成，同时支持多说话人。

⏺细粒度控制:

该模型能够预测和控制细粒度的韵律特征，包括笑声、停顿和插入词等。

⏺更好的韵律:

ChatTTS在韵律方面超越大部分开源TTS模型。同时提供预训练模型，支持进一步研究。

▎相关推荐：

🔵**ChatTTS_colab - 基于 ChatTTS ，支持音色抽卡、长音频生成和分角色朗读**

🔵**ChatTTS-Forge - 提供了完善的 ChatTTS 封装，包括 API WebUI Playground**

https://github.com/panyanyany/Awesome-ChatTTS

▎项目地址：**点击打开**

Message link