👋 动态记录 & 转发分享 ✨ https://tg.okhk.net/ ✌️
#RePost #GitHub #TTS
🗣 **ChatTTS - 对话式高可控的语音合成模型**
▎项目功能:文本转语音模型
▎项目介绍:一款专门为对话场景设计的文本转语音模型,例如LLM助手对话任务,支持英文和中文两种语言。
最大的模型使用了 10 万小时以上的中英文数据进行训练。在 HuggingFace 中开源的版本为 4 万小时训练且未 SFT 的版本。
❗使用需知
🔴为了限制 ChatTTS 的使用,我们在 4w 小时模型的训练过程中添加了少量额外的高频噪音,并用 mp3 格式尽可能压低了音质,以防不法分子用于潜在的犯罪可能。同时我们在内部训练了检测模型,并计划在未来开放。
▎项目亮点:
⏺对话式 TTS:
ChatTTS针对对话式任务进行了优化,实现了自然流畅的语音合成,同时支持多说话人。
⏺细粒度控制:
该模型能够预测和控制细粒度的韵律特征,包括笑声、停顿和插入词等。
⏺更好的韵律:
ChatTTS在韵律方面超越大部分开源TTS模型。同时提供预训练模型,支持进一步研究。
▎相关推荐:
🔵**ChatTTS_colab - 基于 ChatTTS ,支持音色抽卡、长音频生成和分角色朗读**
🔵**ChatTTS-Forge - 提供了完善的 ChatTTS 封装,包括 API WebUI Playground**
https://github.com/panyanyany/Awesome-ChatTTS
▎项目地址:**点击打开**
Message link
🗣 **ChatTTS - 对话式高可控的语音合成模型**
▎项目功能:文本转语音模型
▎项目介绍:一款专门为对话场景设计的文本转语音模型,例如LLM助手对话任务,支持英文和中文两种语言。
最大的模型使用了 10 万小时以上的中英文数据进行训练。在 HuggingFace 中开源的版本为 4 万小时训练且未 SFT 的版本。
❗使用需知
🔴为了限制 ChatTTS 的使用,我们在 4w 小时模型的训练过程中添加了少量额外的高频噪音,并用 mp3 格式尽可能压低了音质,以防不法分子用于潜在的犯罪可能。同时我们在内部训练了检测模型,并计划在未来开放。
▎项目亮点:
⏺对话式 TTS:
ChatTTS针对对话式任务进行了优化,实现了自然流畅的语音合成,同时支持多说话人。
⏺细粒度控制:
该模型能够预测和控制细粒度的韵律特征,包括笑声、停顿和插入词等。
⏺更好的韵律:
ChatTTS在韵律方面超越大部分开源TTS模型。同时提供预训练模型,支持进一步研究。
▎相关推荐:
🔵**ChatTTS_colab - 基于 ChatTTS ,支持音色抽卡、长音频生成和分角色朗读**
🔵**ChatTTS-Forge - 提供了完善的 ChatTTS 封装,包括 API WebUI Playground**
https://github.com/panyanyany/Awesome-ChatTTS
▎项目地址:**点击打开**
Message link
😀 **fabritor - 开源多功能创意图片编辑器**
▎网站功能:图片编辑器
▎网站介绍:一款基于 fabricjs 的开源创意图片编辑器,旨在让开发者快速构建属于自己的图片编辑器。
可应用于海报设计、小红书公众号封面设计、banner 设计等场景。
▎网站网址:**点击打开**
Message link
#RePost #Doc #AI #DevOps
大模型应用开发教程
写了个 大模型应用开发的教程,公开免费
只为了像我一样的工程师/产品入门大模型开发 少走点弯路。
面向小白,尽量通俗易懂且实用。
via 人工智能讨论组 - 即刻圈子 (author: Random_thoughts)
Message link
大模型应用开发教程
写了个 大模型应用开发的教程,公开免费
只为了像我一样的工程师/产品入门大模型开发 少走点弯路。
面向小白,尽量通俗易懂且实用。
via 人工智能讨论组 - 即刻圈子 (author: Random_thoughts)
Message link
fideo-live-record,一款方便的直播录制软件! 它支持监控直播,可以帮助用户简单便捷的对直播进行录制并保存为MP4格式的视频,平台方面它支持抖音,虎牙,斗鱼,快手,微博,网易cc,bilibili,花椒, 淘宝等平台!
https://github.com/chenfan0/fideo-live-record
#RePost #AI #GitHub
微调大语言模型,只用这个就够了~!
GitHub - hiyouga/LLaMA-Factory: A WebUI for Efficient Fine-Tuning of 100+ LLMs (ACL 2024)
🧐LLaMA-Factory是一个高效微调100多个大语言模型的WebUI,支持多种模型和训练方法,旨在简化模型微调过程。
➡️链接:https://github.com/hiyouga/LLaMA-Factory/blob/main/README_zh.md
✨重点
●🔧 多模型支持:支持LLaMA、LLaVA、Mistral、Qwen、Baichuan、ChatGLM等多种模型。
●💡 集成方法:包含持续预训练、多模态监督微调、奖励建模、PPO、DPO等多种训练方法。
●📊 高级算法:支持GaLore、BAdam、DoRA、LongLoRA、LLaMA Pro等先进算法。
●📈 实验监控:提供LlamaBoard、TensorBoard、Wandb等多种监控工具。
●🚀 高效推理:提供类似OpenAI风格的API,支持Gradio UI和CLI,使用vLLM进行高效推理。
●📝 详细文档:包括安装、数据准备、快速开始等详细说明,支持Colab和本地机器。
via 人工智能讨论组 - 即刻圈子 (author: Simon的白日梦)
Message link
微调大语言模型,只用这个就够了~!
GitHub - hiyouga/LLaMA-Factory: A WebUI for Efficient Fine-Tuning of 100+ LLMs (ACL 2024)
🧐LLaMA-Factory是一个高效微调100多个大语言模型的WebUI,支持多种模型和训练方法,旨在简化模型微调过程。
➡️链接:https://github.com/hiyouga/LLaMA-Factory/blob/main/README_zh.md
✨重点
●🔧 多模型支持:支持LLaMA、LLaVA、Mistral、Qwen、Baichuan、ChatGLM等多种模型。
●💡 集成方法:包含持续预训练、多模态监督微调、奖励建模、PPO、DPO等多种训练方法。
●📊 高级算法:支持GaLore、BAdam、DoRA、LongLoRA、LLaMA Pro等先进算法。
●📈 实验监控:提供LlamaBoard、TensorBoard、Wandb等多种监控工具。
●🚀 高效推理:提供类似OpenAI风格的API,支持Gradio UI和CLI,使用vLLM进行高效推理。
●📝 详细文档:包括安装、数据准备、快速开始等详细说明,支持Colab和本地机器。
via 人工智能讨论组 - 即刻圈子 (author: Simon的白日梦)
Message link
强推一波comfyui_LLM_party!之前一直在找能够在comfyui中实现大部分LLM agents功能的插件,这个是最完善的一个!:能接API也能用本地LLM;有memory和多轮迭代功能;自带天气、google搜索等简单爬虫;支持LVM图像多模态大语言模型;支持RAG本地知识库接入;支持条件问答;可以对接到企微和钉钉、飞书!
而且up主在B站和QQ群的答疑还特别及时! 在comfyui中玩LLM的朋友一定要关注下~!🥹
GitHub - heshengtao/comfyui_LLM_party: Dify in comfyui
🧐Comfyui_LLM_party是一个兼容Omost的插件,适用于所有具有类似OpenAI接口的模型,并支持本地模型如llama/qwen/GLM。
➡️链接:https://github.com/heshengtao/comfyui_LLM_party/blob/main/README_ZH.md
✨重点
●🔧 功能支持:支持所有OpenAI格式的API调用,适配多种本地模型,并提供模块化工具调用功能。
●🗂 模型兼容:兼容多种模型如ollama、qwen、GLM、deepseek、moonshot、豆包等,并支持本地模型如llama/qwen/GLM。
●💡 节点库:提供了一整套用于LLM工作流构建的节点库,用户可以快速构建并整合到现有SD工作流中。
●📖 使用指南:详细说明了如何在comfyui中构建模块化AI,如何使用节点以及配置APIKEY等步骤。
●🔍 多种功能:支持在线查询、条件语句、循环链接、个性化AI、知识库搜索、代码解释器等功能。
●🚀 安装方法:提供三种安装方法,用户可以通过comfyui管理器、一键安装或手动下载方式进行安装。
via 人工智能讨论组 - 即刻圈子 (author: Simon的白日梦)
Message link
🔎 **爱盼 - 一个开源的网盘资源搜索 Web 项目**
体验:kkwnhub.com
项目基于 vue、nuxt.js ,搜索接口是第三方 API,对 IP 有访问限制,建议自部署
支持 Vercel、Docker 部署
相关阅读
SearchSearchGo - 一款简约的阿里云盘搜索引擎 UI
Message link
**PIKIMOV**
在线视频剪辑工具,支持图层、关键帧、视频效果等功能,可导入图像、音视频和 3D 模型,可临时替代 After Effects,完全免费,无需注册。
值得一提的是,该项目的灵感来自于 Photopea 的广泛成功。
Message link
Claude 3.5 进阶秘籍 | 5大绝招助你成为AI达人👩🎓
图1. Claude官方宝库:针对商业和个人任务优化的提示词,助你事半功倍。💼✨
https://docs.anthropic.com/en/prompt-library/library
图2. 码农福音!最新Claude 3.5编程提示,实现无缝规划、代码审查和安全检查。🖥️🔒
https://www.reddit.com/r/ClaudeAI/comments/1e39tvj/sonnet_35_coding_system_prompt_v2_with_explainer/
图3. Claude发布的超强“提示词评估工具”,让你在开发者控制台轻松优化提示,效果倍增!🚀💯
https://www.anthropic.com/news/evaluate-prompts
图4. 经过实验证明的“角色提示”法则威力无穷,让Claude更懂你。 🎭🧠
https://llmindset.co.uk/posts/youre-an-expert-claude-workbench/
图5. 开发者新宠:刚在GitHub上推出就已获得数千个Stars,Claude Engineer命令行工具震撼登场。🌟⌨️
https://github.com/Doriandarko/claude-engineer
via AI探索站 - 即刻圈子 (author: 李自然)
Message link
**EcoPaste**
跨平台的剪切板管理工具,支持纯文本、富文本、HTML、图片和文件,并提供剪切板内容收藏、自动分组、搜索、OCR识别、一键唤醒等功能,所有剪切板内容均在本地存储,保证数据安全,免费开源。
🐙 项目地址
Message link
免费文本转语音网站 Fish Audio
Fish Audio 是一个专注于文本转语音 (TTS) 技术的平台,致力开发文本转语音(TTS)模型。Fish Audio 能够将文本转换成逼真的语音。
Fish Audio 支持中文、日语、英语三种主流语言,模型广场中有丁真、川建国等热门模型可用。
网址:https://fish.audio/zh-CN/
Message link
📦 **NanaBox - 一款开源的轻量虚拟机软件**
下载页面
Windows 商店
NanaBox 支持创建和管理虚拟机,可以运行各种操作系统,包括 Windows、Linux 和 macOS
最大的特点便是它使用了 Hyper-V 的低级 API,这使得 NanaBox 更加轻量和灵活
开发者同时也是是 NanaZip 的开发者 M2-Team,其开发的软件主打一个轻量、快捷
📑相关阅读
▫️VMware 宣布 Workstation Pro 和 Fusion Pro 产品现在起将免费供个人用户使用,企业和组织需付费商用订阅[
](https://t.me/geekshare/4043)[▫️](https://t.me/geekshare/4144)[NanaZip - 一款开源的文件压缩工具](https://t.me/geekshare/4043)
Message link
✂️ **ShotEasy - 一个开源的图像在线处理工具**
Chrome 商店
在线使用
ShotEasy 有在线版本和插件版本,在线版本可以部署在 Vercel
插件的功能基本参考 TinySnap ,还不够完善
此类工具太多了,这个项目界面做的比较好些,适合做 SEO 赚取广告费
Message link
**
*🤖️ [AI 套壳:壳中壳*](https://github.com/terobox/poixe)
Poixe 可以同时在一个页面打开多个 AI 套壳项目
目前已套 ChatGPT-Next-Web、ChatBox、LobeChat、chatgpt-web-midjourney-proxy
Message link
最近都在做AI相关的产品,也测试了不少AI的模型,OpenAI在这个月就不支持中国的开发者了,所以我整理了一个可以免费使用的AI合集分享给大家,也收集了各家付费的AI模型,有需要的可以参考。
免费AI合集:https://freeaihunter.com
后面会把聚合AI的平台也一起收集放上来,大家可以推荐一些,回头一起收录。
数据开源:https://github.com/EasyChris/freeaihunter
希望这些资源能帮到大家,祝各位顺利开发出更多精彩的AI产品!
Message link