👋 动态记录 & 转发分享 ✨ https://tg.okhk.net/ ✌️
#GitHub #AI #TTS #Video #Tool
Linly-Dubbing - 智能视频多语言 AI 配音/翻译工具
智能视频多语言AI配音和翻译工具,在 YouDub-webui 的基础上进行了拓展和优化。
集成 Linly-Talker 的数字人对口型技术,为用户带来更加自然的多语言视频体验。
Linly-Dubbing - 智能视频多语言 AI 配音/翻译工具
智能视频多语言AI配音和翻译工具,在 YouDub-webui 的基础上进行了拓展和优化。
集成 Linly-Talker 的数字人对口型技术,为用户带来更加自然的多语言视频体验。
TikTok语音生成器
文字转语音工具,支持多种语言和语音,如 jessie、C3PO、ghostface 等 TikTok 语音,每个语言下都有很多角色,比如中文就有 熊二、猴哥、小萝莉 等,最多可输入 500 字,免费使用,无需注册。
Message link
TTS Azure Web - Azure 文本转语音 Web 应用
▎项目功能:文本转语音
▎项目介绍:一个 Azure 文本转语音(TTS)网络应用,可以在本地运行或使用你的 Azure Key 一键部署。
也可以直接使用作者部署好的演示网站,效果挺好,上限 2000 字,支持多语言、多角色,可以自定义风格、语速、语调和音量调整。
▎项目地址:**点击打开**
Message link
🗣 **Text to Speech.im - 在线免费文本转语音**
▎网站功能:文本转语音
▎网站介绍:一个高质量文本转语音工具,支持多种语言和音色的选择,还可以调整语速,点击生成即可试听或下载,免费可商用。
▎网站网址:**点击打开**
Message link
🗣 **Fish Speech - 开源最大文本转语音模型**
▎网站功能:文本转语音
▎网站介绍:一个基于 VQ-GAN 和 Llama、VITS,由 Fish Audio 开发的文本转语音模型。
提供了多语言支持和高质量的语音合成,支持中文、日文和英文三种语言的合成。
特别是基于一些知名游戏角色的声音,如《原神》、《崩坏:星穹铁道》和《碧蓝档案》。
▎网站网址:**点击打开**
Message link
#RePost #GitHub #TTS
🗣 **ChatTTS - 对话式高可控的语音合成模型**
▎项目功能:文本转语音模型
▎项目介绍:一款专门为对话场景设计的文本转语音模型,例如LLM助手对话任务,支持英文和中文两种语言。
最大的模型使用了 10 万小时以上的中英文数据进行训练。在 HuggingFace 中开源的版本为 4 万小时训练且未 SFT 的版本。
❗使用需知
🔴为了限制 ChatTTS 的使用,我们在 4w 小时模型的训练过程中添加了少量额外的高频噪音,并用 mp3 格式尽可能压低了音质,以防不法分子用于潜在的犯罪可能。同时我们在内部训练了检测模型,并计划在未来开放。
▎项目亮点:
⏺对话式 TTS:
ChatTTS针对对话式任务进行了优化,实现了自然流畅的语音合成,同时支持多说话人。
⏺细粒度控制:
该模型能够预测和控制细粒度的韵律特征,包括笑声、停顿和插入词等。
⏺更好的韵律:
ChatTTS在韵律方面超越大部分开源TTS模型。同时提供预训练模型,支持进一步研究。
▎相关推荐:
🔵**ChatTTS_colab - 基于 ChatTTS ,支持音色抽卡、长音频生成和分角色朗读**
🔵**ChatTTS-Forge - 提供了完善的 ChatTTS 封装,包括 API WebUI Playground**
https://github.com/panyanyany/Awesome-ChatTTS
▎项目地址:**点击打开**
Message link
🗣 **ChatTTS - 对话式高可控的语音合成模型**
▎项目功能:文本转语音模型
▎项目介绍:一款专门为对话场景设计的文本转语音模型,例如LLM助手对话任务,支持英文和中文两种语言。
最大的模型使用了 10 万小时以上的中英文数据进行训练。在 HuggingFace 中开源的版本为 4 万小时训练且未 SFT 的版本。
❗使用需知
🔴为了限制 ChatTTS 的使用,我们在 4w 小时模型的训练过程中添加了少量额外的高频噪音,并用 mp3 格式尽可能压低了音质,以防不法分子用于潜在的犯罪可能。同时我们在内部训练了检测模型,并计划在未来开放。
▎项目亮点:
⏺对话式 TTS:
ChatTTS针对对话式任务进行了优化,实现了自然流畅的语音合成,同时支持多说话人。
⏺细粒度控制:
该模型能够预测和控制细粒度的韵律特征,包括笑声、停顿和插入词等。
⏺更好的韵律:
ChatTTS在韵律方面超越大部分开源TTS模型。同时提供预训练模型,支持进一步研究。
▎相关推荐:
🔵**ChatTTS_colab - 基于 ChatTTS ,支持音色抽卡、长音频生成和分角色朗读**
🔵**ChatTTS-Forge - 提供了完善的 ChatTTS 封装,包括 API WebUI Playground**
https://github.com/panyanyany/Awesome-ChatTTS
▎项目地址:**点击打开**
Message link
免费文本转语音网站 Fish Audio
Fish Audio 是一个专注于文本转语音 (TTS) 技术的平台,致力开发文本转语音(TTS)模型。Fish Audio 能够将文本转换成逼真的语音。
Fish Audio 支持中文、日语、英语三种主流语言,模型广场中有丁真、川建国等热门模型可用。
网址:https://fish.audio/zh-CN/
Message link
王炸级别的文本转语音(TTS)模型——Seed-TTS
字节跳动推出的 Seed-TTS,能够生成几乎无法与人类语音区分的自然声音。
主要特性:
高度逼真:生成自然、逼真的语音。
无需训练:无需额外训练即可生成自然语音。
多样化表现:理解语音上下文,生成带有情感和表现力的语音。
多语种支持:适用于视频博主等需要多语种支持的场景。
应用场景:
小说推文:生成带有情感的生动语音。
视频博主:轻松更换视频语音,支持多语种。
项目介绍及演示:
https://bytedancespeech.github.io/seedtts_tech_report
GitHub 项目地址:https://github.com/BytedanceSpeech/seed-tts-eval
via 人工智能讨论组 - 即刻圈子 (author: AI觉醒独立计划)
Message link
**Azure Text To Speech**
文本转语音工具,提供多种角色与语言的语音生成,并可调整语速、语调与音量,可在线播放和下载,免费使用,无需注册。
现在的晓晓很逼真,语气什么的都有了,只是对于情感还是差一些。
主页 丨 项目地址
Message link
**Text to Speech**
文本转语音工具,支持多种语言、多种角色、男女性别,生成速度较慢,可下载 mp3 文件,免费使用,无需注册。
texttospeech.im/zh-CN
频道 @WidgetChannel
Message link
**简易语音工具箱**
如题,提供了多种自动化音频工具,包括音频处理、语音识别、语音转录、语音合成等,功能依次关联,能够形成一套完整的工作流,支持中日英三种语言,免费开源。
🐙 项目地址
Message link
🔉 **ChatTTS - 最近很火爆的文本转语音项目**
视频演示
在线体验
开发者声称该项目突破了开源天花板!最大的模型使用了 10 万小时以上的中英文数据进行训练。在 HuggingFace 中开源的版本为 4 万小时训练且未 SFT 的版本(无版权风险)
ChatTTS 无障碍支持中英文,还支持一些细粒度控制,允许加入笑声、说话停顿、语气词等
它还可以复刻已经逝去的人的绝版声音,看演示视频不论是语调还是语气的变化,都挺接近本人的
在线体验一波真的非常好玩,再这么玩下去,播音员都要失业了
Message link
#TTS 模型汇总:
GPT-SoVITS :https://github.com/RVC-Boss/GPT-SoVITS
Fish Speech v1.2 :https://huggingface.co/fishaudio/fish-speech-1.2
字节的Seed-TTS :https://bytedancespeech.github.io/seedtts_tech_report/
ChatTTS :https://github.com/2noise/ChatTTS
HuggingFace的Parler-TTS :https://github.com/huggingface/parler-tts
MetaVoice-1B :https://github.com/metavoiceio/metavoice-src
MARS5-TTS :https://github.com/Camb-ai/MARS5-TTS
OpenVoice :https://github.com/myshell-ai/OpenVoice
EmotiVoice :https://github.com/netease-youdao/EmotiVoice/blob/main/README.zh.md
edge-tts :https://github.com/rany2/edge-tts
来源:https://vxtwitter.com/aigclink/status/1808407487600906419
GPT-SoVITS :https://github.com/RVC-Boss/GPT-SoVITS
Fish Speech v1.2 :https://huggingface.co/fishaudio/fish-speech-1.2
字节的Seed-TTS :https://bytedancespeech.github.io/seedtts_tech_report/
ChatTTS :https://github.com/2noise/ChatTTS
HuggingFace的Parler-TTS :https://github.com/huggingface/parler-tts
MetaVoice-1B :https://github.com/metavoiceio/metavoice-src
MARS5-TTS :https://github.com/Camb-ai/MARS5-TTS
OpenVoice :https://github.com/myshell-ai/OpenVoice
EmotiVoice :https://github.com/netease-youdao/EmotiVoice/blob/main/README.zh.md
edge-tts :https://github.com/rany2/edge-tts
来源:https://vxtwitter.com/aigclink/status/1808407487600906419