👋 动态记录 & 转发分享 https://tg.okhk.net/ ✌️
#RePost #AI #Tool #GitHub

🖥 **NopeCHA - AI 自动 CAPTCHA 验证码识别插件**

▎插件功能:验证码自动识别

▎插件平台:#Chrome #Edge

▎插件介绍:一个可以自动识别 CAPTCHA 验证码的 AI 工具,支持识别所有版本的 reCAPTCHA、FunCAPTCHA、hCaptcha、WAF 验证码、300+ 文本验证码类型和 Cloudflare 验证等。

免费用户每 24 小时最多 100 次识别,对于个人应该够用。并且与 Selenium、Puppeteer 和 Playwright 等自动化工具兼容。

▎相关推荐:

**Buster - 自动跳过 reCAPTCHA 验证插件**

▎插件安装:**点击安装**

Message link
#RePost #GitHub #macOS #Tool

💻 **Awesome macOS open source applications - 优秀 macOS 开源应用列表**

▎项目功能:macOS 开源应用列表

▎项目介绍:一个专门收集和整理适用于 macOS 的开源应用程序,每个条目都包含应用的简短描述、主要功能和源码链接。

应用程序涵盖生产力工具、开发环境、实用工具和多媒体软件等多种类型。

▎项目地址:**点击打开**

Message link
#RePost #GitHub #Tool

📱 **ChatCopilot - 获取微信聊天记录并支持实时存储到数据库的工具**

▎项目功能:微信聊天记录提取

▎项目介绍:一款用 Go 实现的获取微信聊天记录并支持实时存储到数据库的工具,目前只支持在 MacOS 上可运行。

现已支持获取群聊天记录、实时获取已保存记录、获取联系人聊天记录。

▎项目地址:**点击打开**

Message link
#RePost #GitHub #Tool #DevOps

🗂 **Superfile - 漂亮而现代的终端文件管理器**

▎软件功能:终端文件管理器

▎软件平台:#Windows #macOS #Linux

▎软件介绍:一款功能强大的现代终端文件管理器,可以方便地浏览和管理本地文件和文件夹,支持拖放操作。

支持预览多种常见文件格式,包括图像、PDF、代码等,无需打开其它应用,支持文件搜索、传输、共享、多标签页,并支持拓展功能。

▎软件下载:**点击下载**

Message link
#RePost #GitHub #TTS #Tool

🗣 **Fish Speech - 开源最大文本转语音模型**

▎网站功能:文本转语音

▎网站介绍:一个基于 VQ-GAN 和 Llama、VITS,由 Fish Audio 开发的文本转语音模型。

提供了多语言支持和高质量的语音合成,支持中文、日文和英文三种语言的合成。

特别是基于一些知名游戏角色的声音,如《原神》、《崩坏:星穹铁道》和《碧蓝档案》。

▎网站网址:**点击打开**

Message link
#RePost #GitHub #AI #Tool

😀 **Inpaint_wechat - 照片修复小小助手**

▎项目功能:图像修复

▎项目介绍:一款快速P图微信小程序,用来消除图片中指定的人和物,基于微信 AI 能力,纯客户端实现,无服务端。

程序采用了 WebAssembly 技术,并结合适配微信的 OpenCV 技术,以实现对模型的预处理和后处理。

▎项目地址:**点击打开**

Message link
#RePost #GitHub #Tool

📝 **FreeReNamer - 强大且易用的文件批量重命名工具**

▎软件功能:文件批量重命名

▎软件平台:#Windows #macOS #Linux

▎软件介绍:一个功能强大又易用的文件批量重命名软件,支持 js 脚本,内置 Monaco Editor。

支持拖拽添加文件和文件夹、创建多个配置、单个配置内支持多个规则等功能。

▎在线网站:**点击打开**

▎相关推荐:

Rename - 在线文件批量重命名工具

Flut Renamer - 开源文件批量重命名工具

SubtitleRenamer - 开源跨平台字幕重命名工具

Rename Photos - 开源跨平台图片重命名应用

▎软件下载:**点击下载**

Message link
#OCR #RePost #Tool #GitHub

💡 **Pix2Text - 开源多功能图像内容识别工具**

▎软件功能:图像内容识别

▎软件平台:#Web #Windows #macOS #Linux

▎软件介绍:一款开源 Python3 工具,可以识别图片中的版面、表格、图片、文字、数学公式等内容,并整合所有内容后以 Markdown 格式输出。

它是 Mathpix 的免费替代品,可将视觉内容无缝转换为基于文本的表述,支持 80 多种语言。

P2T 也可以把一整个 PDF 文件(PDF 的内容可以是扫描图片或者其他任何格式)转换为 Markdown 格式。

网页版每人每天可以免费识别 10000 个字符,正常使用应该够用了。

▎在线体验:**点击打开**

▎网站版本:**点击打开**

▎相关推荐:

🔵Pix2Text-Mac - 识别数学公式的 Mac 桌面版应用

🔵CnOCR - 基于 PyTorch/MXNet 的中文/英文 OCR Python 包

🔵CnSTD - 基于 PyTorch/MXNet 的 中文/英文 场景文字、数学公式检测、篇章分析的 Python3 包

▎软件下载:**点击下载**

Message link
#RePost #GitHub #TTS

🗣 **ChatTTS - 对话式高可控的语音合成模型**

▎项目功能:文本转语音模型

▎项目介绍:一款专门为对话场景设计的文本转语音模型,例如LLM助手对话任务,支持英文和中文两种语言。

最大的模型使用了 10 万小时以上的中英文数据进行训练。在 HuggingFace 中开源的版本为 4 万小时训练且未 SFT 的版本。

使用需知

🔴为了限制 ChatTTS 的使用,我们在 4w 小时模型的训练过程中添加了少量额外的高频噪音,并用 mp3 格式尽可能压低了音质,以防不法分子用于潜在的犯罪可能。同时我们在内部训练了检测模型,并计划在未来开放。

▎项目亮点:

对话式 TTS:

ChatTTS针对对话式任务进行了优化,实现了自然流畅的语音合成,同时支持多说话人。

细粒度控制:

该模型能够预测和控制细粒度的韵律特征,包括笑声、停顿和插入词等。

更好的韵律:

ChatTTS在韵律方面超越大部分开源TTS模型。同时提供预训练模型,支持进一步研究。

▎相关推荐:

🔵**ChatTTS_colab - 基于 ChatTTS ,支持音色抽卡、长音频生成和分角色朗读**

🔵**ChatTTS-Forge - 提供了完善的 ChatTTS 封装,包括 API WebUI Playground**

https://github.com/panyanyany/Awesome-ChatTTS

▎项目地址:**点击打开**

Message link
#RePost #Design #Tool #URL

😀 **fabritor - 开源多功能创意图片编辑器**

▎网站功能:图片编辑器

▎网站介绍:一款基于 fabricjs 的开源创意图片编辑器,旨在让开发者快速构建属于自己的图片编辑器。

可应用于海报设计、小红书公众号封面设计、banner 设计等场景。

▎网站网址:**点击打开**

Message link
#RePost #Doc #AI #DevOps

大模型应用开发教程

写了个 大模型应用开发的教程,公开免费

只为了像我一样的工程师/产品入门大模型开发 少走点弯路。

面向小白,尽量通俗易懂且实用。

via 人工智能讨论组 - 即刻圈子 (author: Random_thoughts)

Message link
香料岛之旅
肯杜瓦村的木制渔船,桑给巴尔,坦桑尼亚 (© Lubos Paukeje/Alamy Stock Photo)
推荐一个在抖音上通过录播搞流量的好工具!

fideo-live-record,一款方便的直播录制软件! 它支持监控直播,可以帮助用户简单便捷的对直播进行录制并保存为MP4格式的视频,平台方面它支持抖音,虎牙,斗鱼,快手,微博,网易cc,bilibili,花椒, 淘宝等平台!

https://github.com/chenfan0/fideo-live-record
#RePost #AI #GitHub

微调大语言模型,只用这个就够了~!

GitHub - hiyouga/LLaMA-Factory: A WebUI for Efficient Fine-Tuning of 100+ LLMs (ACL 2024)

🧐LLaMA-Factory是一个高效微调100多个大语言模型的WebUI,支持多种模型和训练方法,旨在简化模型微调过程。

➡️链接:https://github.com/hiyouga/LLaMA-Factory/blob/main/README_zh.md

重点

🔧 多模型支持:支持LLaMA、LLaVA、Mistral、Qwen、Baichuan、ChatGLM等多种模型。

💡 集成方法:包含持续预训练、多模态监督微调、奖励建模、PPO、DPO等多种训练方法。

📊 高级算法:支持GaLore、BAdam、DoRA、LongLoRA、LLaMA Pro等先进算法。

📈 实验监控:提供LlamaBoard、TensorBoard、Wandb等多种监控工具。

🚀 高效推理:提供类似OpenAI风格的API,支持Gradio UI和CLI,使用vLLM进行高效推理。

📝 详细文档:包括安装、数据准备、快速开始等详细说明,支持Colab和本地机器。

via 人工智能讨论组 - 即刻圈子 (author: Simon的白日梦)

Message link
#RePost #URL

中小学电子教材下载网站

中文 K12 教科书下载网站。网站简洁无广告,选择对应版本获得链接后下载即可。

网址:https://textbook.synaiv.com/
#RePost #AI #GitHub

强推一波comfyui_LLM_party!之前一直在找能够在comfyui中实现大部分LLM agents功能的插件,这个是最完善的一个!:能接API也能用本地LLM;有memory和多轮迭代功能;自带天气、google搜索等简单爬虫;支持LVM图像多模态大语言模型;支持RAG本地知识库接入;支持条件问答;可以对接到企微和钉钉、飞书!

而且up主在B站和QQ群的答疑还特别及时! 在comfyui中玩LLM的朋友一定要关注下~!🥹

GitHub - heshengtao/comfyui_LLM_party: Dify in comfyui

🧐Comfyui_LLM_party是一个兼容Omost的插件,适用于所有具有类似OpenAI接口的模型,并支持本地模型如llama/qwen/GLM。

➡️链接:https://github.com/heshengtao/comfyui_LLM_party/blob/main/README_ZH.md

重点

🔧 功能支持:支持所有OpenAI格式的API调用,适配多种本地模型,并提供模块化工具调用功能。

🗂 模型兼容:兼容多种模型如ollama、qwen、GLM、deepseek、moonshot、豆包等,并支持本地模型如llama/qwen/GLM。

💡 节点库:提供了一整套用于LLM工作流构建的节点库,用户可以快速构建并整合到现有SD工作流中。

📖 使用指南:详细说明了如何在comfyui中构建模块化AI,如何使用节点以及配置APIKEY等步骤。

🔍 多种功能:支持在线查询、条件语句、循环链接、个性化AI、知识库搜索、代码解释器等功能。

🚀 安装方法:提供三种安装方法,用户可以通过comfyui管理器、一键安装或手动下载方式进行安装。

via 人工智能讨论组 - 即刻圈子 (author: Simon的白日梦)

Message link
#RePost #Video #Tool #URL

**PIKIMOV**

在线视频剪辑工具,支持图层关键帧视频效果等功能,可导入图像、音视频和 3D 模型,可临时替代 After Effects,完全免费,无需注册。

值得一提的是,该项目的灵感来自于 Photopea 的广泛成功。

Message link
#RePost #AI #GitHub #URL

Claude 3.5 进阶秘籍 | 5大绝招助你成为AI达人👩‍🎓

图1. Claude官方宝库:针对商业和个人任务优化的提示词,助你事半功倍。💼

https://docs.anthropic.com/en/prompt-library/library

图2. 码农福音!最新Claude 3.5编程提示,实现无缝规划、代码审查和安全检查。🖥️🔒

https://www.reddit.com/r/ClaudeAI/comments/1e39tvj/sonnet_35_coding_system_prompt_v2_with_explainer/

图3. Claude发布的超强“提示词评估工具”,让你在开发者控制台轻松优化提示,效果倍增!🚀💯

https://www.anthropic.com/news/evaluate-prompts

图4. 经过实验证明的“角色提示”法则威力无穷,让Claude更懂你。 🎭🧠

https://llmindset.co.uk/posts/youre-an-expert-claude-workbench/

图5. 开发者新宠:刚在GitHub上推出就已获得数千个Stars,Claude Engineer命令行工具震撼登场。🌟⌨️

https://github.com/Doriandarko/claude-engineer

via AI探索站 - 即刻圈子 (author: 李自然)

Message link
Back to Top
OKHK