👋 动态记录 & 转发分享 ✨ https://tg.okhk.net/ ✌️
#RePost #AI #Tool #GitHub
🖥 **NopeCHA - AI 自动 CAPTCHA 验证码识别插件**
▎插件功能:验证码自动识别
▎插件平台:#Chrome #Edge
▎插件介绍:一个可以自动识别 CAPTCHA 验证码的 AI 工具,支持识别所有版本的 reCAPTCHA、FunCAPTCHA、hCaptcha、WAF 验证码、300+ 文本验证码类型和 Cloudflare 验证等。
免费用户每 24 小时最多 100 次识别,对于个人应该够用。并且与 Selenium、Puppeteer 和 Playwright 等自动化工具兼容。
▎相关推荐:
⏺**Buster - 自动跳过 reCAPTCHA 验证插件**
▎插件安装:**点击安装**
Message link
🖥 **NopeCHA - AI 自动 CAPTCHA 验证码识别插件**
▎插件功能:验证码自动识别
▎插件平台:#Chrome #Edge
▎插件介绍:一个可以自动识别 CAPTCHA 验证码的 AI 工具,支持识别所有版本的 reCAPTCHA、FunCAPTCHA、hCaptcha、WAF 验证码、300+ 文本验证码类型和 Cloudflare 验证等。
免费用户每 24 小时最多 100 次识别,对于个人应该够用。并且与 Selenium、Puppeteer 和 Playwright 等自动化工具兼容。
▎相关推荐:
⏺**Buster - 自动跳过 reCAPTCHA 验证插件**
▎插件安装:**点击安装**
Message link
💻 **Awesome macOS open source applications - 优秀 macOS 开源应用列表**
▎项目功能:macOS 开源应用列表
▎项目介绍:一个专门收集和整理适用于 macOS 的开源应用程序,每个条目都包含应用的简短描述、主要功能和源码链接。
应用程序涵盖生产力工具、开发环境、实用工具和多媒体软件等多种类型。
▎项目地址:**点击打开**
Message link
📱 **ChatCopilot - 获取微信聊天记录并支持实时存储到数据库的工具**
▎项目功能:微信聊天记录提取
▎项目介绍:一款用 Go 实现的获取微信聊天记录并支持实时存储到数据库的工具,目前只支持在 MacOS 上可运行。
现已支持获取群聊天记录、实时获取已保存记录、获取联系人聊天记录。
▎项目地址:**点击打开**
Message link
🗂 **Superfile - 漂亮而现代的终端文件管理器**
▎软件功能:终端文件管理器
▎软件平台:#Windows #macOS #Linux
▎软件介绍:一款功能强大的现代终端文件管理器,可以方便地浏览和管理本地文件和文件夹,支持拖放操作。
支持预览多种常见文件格式,包括图像、PDF、代码等,无需打开其它应用,支持文件搜索、传输、共享、多标签页,并支持拓展功能。
▎软件下载:**点击下载**
Message link
🗣 **Fish Speech - 开源最大文本转语音模型**
▎网站功能:文本转语音
▎网站介绍:一个基于 VQ-GAN 和 Llama、VITS,由 Fish Audio 开发的文本转语音模型。
提供了多语言支持和高质量的语音合成,支持中文、日文和英文三种语言的合成。
特别是基于一些知名游戏角色的声音,如《原神》、《崩坏:星穹铁道》和《碧蓝档案》。
▎网站网址:**点击打开**
Message link
😀 **Inpaint_wechat - 照片修复小小助手**
▎项目功能:图像修复
▎项目介绍:一款快速P图微信小程序,用来消除图片中指定的人和物,基于微信 AI 能力,纯客户端实现,无服务端。
程序采用了 WebAssembly 技术,并结合适配微信的 OpenCV 技术,以实现对模型的预处理和后处理。
▎项目地址:**点击打开**
Message link
📝 **FreeReNamer - 强大且易用的文件批量重命名工具**
▎软件功能:文件批量重命名
▎软件平台:#Windows #macOS #Linux
▎软件介绍:一个功能强大又易用的文件批量重命名软件,支持 js 脚本,内置 Monaco Editor。
支持拖拽添加文件和文件夹、创建多个配置、单个配置内支持多个规则等功能。
▎在线网站:**点击打开**
▎相关推荐:
⏺Rename - 在线文件批量重命名工具
⏺Flut Renamer - 开源文件批量重命名工具
⏺SubtitleRenamer - 开源跨平台字幕重命名工具
⏺Rename Photos - 开源跨平台图片重命名应用
▎软件下载:**点击下载**
Message link
💡 **Pix2Text - 开源多功能图像内容识别工具**
▎软件功能:图像内容识别
▎软件平台:#Web #Windows #macOS #Linux
▎软件介绍:一款开源 Python3 工具,可以识别图片中的版面、表格、图片、文字、数学公式等内容,并整合所有内容后以 Markdown 格式输出。
它是 Mathpix 的免费替代品,可将视觉内容无缝转换为基于文本的表述,支持 80 多种语言。
P2T 也可以把一整个 PDF 文件(PDF 的内容可以是扫描图片或者其他任何格式)转换为 Markdown 格式。
网页版每人每天可以免费识别 10000 个字符,正常使用应该够用了。
▎在线体验:**点击打开**
▎网站版本:**点击打开**
▎相关推荐:
🔵Pix2Text-Mac - 识别数学公式的 Mac 桌面版应用
🔵CnOCR - 基于 PyTorch/MXNet 的中文/英文 OCR Python 包
🔵CnSTD - 基于 PyTorch/MXNet 的 中文/英文 场景文字、数学公式检测、篇章分析的 Python3 包
▎软件下载:**点击下载**
Message link
#RePost #GitHub #TTS
🗣 **ChatTTS - 对话式高可控的语音合成模型**
▎项目功能:文本转语音模型
▎项目介绍:一款专门为对话场景设计的文本转语音模型,例如LLM助手对话任务,支持英文和中文两种语言。
最大的模型使用了 10 万小时以上的中英文数据进行训练。在 HuggingFace 中开源的版本为 4 万小时训练且未 SFT 的版本。
❗使用需知
🔴为了限制 ChatTTS 的使用,我们在 4w 小时模型的训练过程中添加了少量额外的高频噪音,并用 mp3 格式尽可能压低了音质,以防不法分子用于潜在的犯罪可能。同时我们在内部训练了检测模型,并计划在未来开放。
▎项目亮点:
⏺对话式 TTS:
ChatTTS针对对话式任务进行了优化,实现了自然流畅的语音合成,同时支持多说话人。
⏺细粒度控制:
该模型能够预测和控制细粒度的韵律特征,包括笑声、停顿和插入词等。
⏺更好的韵律:
ChatTTS在韵律方面超越大部分开源TTS模型。同时提供预训练模型,支持进一步研究。
▎相关推荐:
🔵**ChatTTS_colab - 基于 ChatTTS ,支持音色抽卡、长音频生成和分角色朗读**
🔵**ChatTTS-Forge - 提供了完善的 ChatTTS 封装,包括 API WebUI Playground**
https://github.com/panyanyany/Awesome-ChatTTS
▎项目地址:**点击打开**
Message link
🗣 **ChatTTS - 对话式高可控的语音合成模型**
▎项目功能:文本转语音模型
▎项目介绍:一款专门为对话场景设计的文本转语音模型,例如LLM助手对话任务,支持英文和中文两种语言。
最大的模型使用了 10 万小时以上的中英文数据进行训练。在 HuggingFace 中开源的版本为 4 万小时训练且未 SFT 的版本。
❗使用需知
🔴为了限制 ChatTTS 的使用,我们在 4w 小时模型的训练过程中添加了少量额外的高频噪音,并用 mp3 格式尽可能压低了音质,以防不法分子用于潜在的犯罪可能。同时我们在内部训练了检测模型,并计划在未来开放。
▎项目亮点:
⏺对话式 TTS:
ChatTTS针对对话式任务进行了优化,实现了自然流畅的语音合成,同时支持多说话人。
⏺细粒度控制:
该模型能够预测和控制细粒度的韵律特征,包括笑声、停顿和插入词等。
⏺更好的韵律:
ChatTTS在韵律方面超越大部分开源TTS模型。同时提供预训练模型,支持进一步研究。
▎相关推荐:
🔵**ChatTTS_colab - 基于 ChatTTS ,支持音色抽卡、长音频生成和分角色朗读**
🔵**ChatTTS-Forge - 提供了完善的 ChatTTS 封装,包括 API WebUI Playground**
https://github.com/panyanyany/Awesome-ChatTTS
▎项目地址:**点击打开**
Message link
😀 **fabritor - 开源多功能创意图片编辑器**
▎网站功能:图片编辑器
▎网站介绍:一款基于 fabricjs 的开源创意图片编辑器,旨在让开发者快速构建属于自己的图片编辑器。
可应用于海报设计、小红书公众号封面设计、banner 设计等场景。
▎网站网址:**点击打开**
Message link
#RePost #Doc #AI #DevOps
大模型应用开发教程
写了个 大模型应用开发的教程,公开免费
只为了像我一样的工程师/产品入门大模型开发 少走点弯路。
面向小白,尽量通俗易懂且实用。
via 人工智能讨论组 - 即刻圈子 (author: Random_thoughts)
Message link
大模型应用开发教程
写了个 大模型应用开发的教程,公开免费
只为了像我一样的工程师/产品入门大模型开发 少走点弯路。
面向小白,尽量通俗易懂且实用。
via 人工智能讨论组 - 即刻圈子 (author: Random_thoughts)
Message link
肯杜瓦村的木制渔船,桑给巴尔,坦桑尼亚 (© Lubos Paukeje/Alamy Stock Photo)
fideo-live-record,一款方便的直播录制软件! 它支持监控直播,可以帮助用户简单便捷的对直播进行录制并保存为MP4格式的视频,平台方面它支持抖音,虎牙,斗鱼,快手,微博,网易cc,bilibili,花椒, 淘宝等平台!
https://github.com/chenfan0/fideo-live-record
#RePost #AI #GitHub
微调大语言模型,只用这个就够了~!
GitHub - hiyouga/LLaMA-Factory: A WebUI for Efficient Fine-Tuning of 100+ LLMs (ACL 2024)
🧐LLaMA-Factory是一个高效微调100多个大语言模型的WebUI,支持多种模型和训练方法,旨在简化模型微调过程。
➡️链接:https://github.com/hiyouga/LLaMA-Factory/blob/main/README_zh.md
✨重点
●🔧 多模型支持:支持LLaMA、LLaVA、Mistral、Qwen、Baichuan、ChatGLM等多种模型。
●💡 集成方法:包含持续预训练、多模态监督微调、奖励建模、PPO、DPO等多种训练方法。
●📊 高级算法:支持GaLore、BAdam、DoRA、LongLoRA、LLaMA Pro等先进算法。
●📈 实验监控:提供LlamaBoard、TensorBoard、Wandb等多种监控工具。
●🚀 高效推理:提供类似OpenAI风格的API,支持Gradio UI和CLI,使用vLLM进行高效推理。
●📝 详细文档:包括安装、数据准备、快速开始等详细说明,支持Colab和本地机器。
via 人工智能讨论组 - 即刻圈子 (author: Simon的白日梦)
Message link
微调大语言模型,只用这个就够了~!
GitHub - hiyouga/LLaMA-Factory: A WebUI for Efficient Fine-Tuning of 100+ LLMs (ACL 2024)
🧐LLaMA-Factory是一个高效微调100多个大语言模型的WebUI,支持多种模型和训练方法,旨在简化模型微调过程。
➡️链接:https://github.com/hiyouga/LLaMA-Factory/blob/main/README_zh.md
✨重点
●🔧 多模型支持:支持LLaMA、LLaVA、Mistral、Qwen、Baichuan、ChatGLM等多种模型。
●💡 集成方法:包含持续预训练、多模态监督微调、奖励建模、PPO、DPO等多种训练方法。
●📊 高级算法:支持GaLore、BAdam、DoRA、LongLoRA、LLaMA Pro等先进算法。
●📈 实验监控:提供LlamaBoard、TensorBoard、Wandb等多种监控工具。
●🚀 高效推理:提供类似OpenAI风格的API,支持Gradio UI和CLI,使用vLLM进行高效推理。
●📝 详细文档:包括安装、数据准备、快速开始等详细说明,支持Colab和本地机器。
via 人工智能讨论组 - 即刻圈子 (author: Simon的白日梦)
Message link
强推一波comfyui_LLM_party!之前一直在找能够在comfyui中实现大部分LLM agents功能的插件,这个是最完善的一个!:能接API也能用本地LLM;有memory和多轮迭代功能;自带天气、google搜索等简单爬虫;支持LVM图像多模态大语言模型;支持RAG本地知识库接入;支持条件问答;可以对接到企微和钉钉、飞书!
而且up主在B站和QQ群的答疑还特别及时! 在comfyui中玩LLM的朋友一定要关注下~!🥹
GitHub - heshengtao/comfyui_LLM_party: Dify in comfyui
🧐Comfyui_LLM_party是一个兼容Omost的插件,适用于所有具有类似OpenAI接口的模型,并支持本地模型如llama/qwen/GLM。
➡️链接:https://github.com/heshengtao/comfyui_LLM_party/blob/main/README_ZH.md
✨重点
●🔧 功能支持:支持所有OpenAI格式的API调用,适配多种本地模型,并提供模块化工具调用功能。
●🗂 模型兼容:兼容多种模型如ollama、qwen、GLM、deepseek、moonshot、豆包等,并支持本地模型如llama/qwen/GLM。
●💡 节点库:提供了一整套用于LLM工作流构建的节点库,用户可以快速构建并整合到现有SD工作流中。
●📖 使用指南:详细说明了如何在comfyui中构建模块化AI,如何使用节点以及配置APIKEY等步骤。
●🔍 多种功能:支持在线查询、条件语句、循环链接、个性化AI、知识库搜索、代码解释器等功能。
●🚀 安装方法:提供三种安装方法,用户可以通过comfyui管理器、一键安装或手动下载方式进行安装。
via 人工智能讨论组 - 即刻圈子 (author: Simon的白日梦)
Message link
🔎 **爱盼 - 一个开源的网盘资源搜索 Web 项目**
体验:kkwnhub.com
项目基于 vue、nuxt.js ,搜索接口是第三方 API,对 IP 有访问限制,建议自部署
支持 Vercel、Docker 部署
相关阅读
SearchSearchGo - 一款简约的阿里云盘搜索引擎 UI
Message link
**PIKIMOV**
在线视频剪辑工具,支持图层、关键帧、视频效果等功能,可导入图像、音视频和 3D 模型,可临时替代 After Effects,完全免费,无需注册。
值得一提的是,该项目的灵感来自于 Photopea 的广泛成功。
Message link
Claude 3.5 进阶秘籍 | 5大绝招助你成为AI达人👩🎓
图1. Claude官方宝库:针对商业和个人任务优化的提示词,助你事半功倍。💼✨
https://docs.anthropic.com/en/prompt-library/library
图2. 码农福音!最新Claude 3.5编程提示,实现无缝规划、代码审查和安全检查。🖥️🔒
https://www.reddit.com/r/ClaudeAI/comments/1e39tvj/sonnet_35_coding_system_prompt_v2_with_explainer/
图3. Claude发布的超强“提示词评估工具”,让你在开发者控制台轻松优化提示,效果倍增!🚀💯
https://www.anthropic.com/news/evaluate-prompts
图4. 经过实验证明的“角色提示”法则威力无穷,让Claude更懂你。 🎭🧠
https://llmindset.co.uk/posts/youre-an-expert-claude-workbench/
图5. 开发者新宠:刚在GitHub上推出就已获得数千个Stars,Claude Engineer命令行工具震撼登场。🌟⌨️
https://github.com/Doriandarko/claude-engineer
via AI探索站 - 即刻圈子 (author: 李自然)
Message link