👋 动态记录 & 转发分享 https://tg.okhk.net/ ✌️
#RePost #AI #Doc #DevOps

检索相似图片的算法

通过向量库,检索相似图片,逻辑如下:

1. 将所有图片向量化,通过OpenAI CLIP库

https://huggingface.co/docs/transformers/model_doc/clip

1. 将向量结果存到向量数据库里面
2. 文字检索

文字=>向量化 =>相似查找HNSW=>结果

代码地址:

https://github.com/pingcap/tidb-vector-python/blob/main/examples/image_search/example.ipynb

Google Colab:

https://colab.research.google.com/github/deep-diver/image_search_with_natural_language/blob/main/notebooks/Image_Search_CLIP.ipynb#scrollTo=q5xcJyqKMu2z

via 人工智能讨论组 - 即刻圈子 (author: 毛毛读书忙)

Message link
#RePost #Doc #URL

**城市租房生存指南**

如题,一个关于租房的指南文档,初入社会和小白都可以看看,内容包括租前准备租中管理租后事项等,还附带了租房模板、公积金提取以及维权途径等内容。

Message link
#RePost #GitHub #Tool #URL

**Tduck**

一款自定义表单工具,支持问卷调查数据收集等功能,采用无代码理念,简单拖拽即可生成表单,支持一键部署。

主页项目地址

Message link
#RePost #GitHub #Tool #TTS

**简易语音工具箱**

如题,提供了多种自动化音频工具,包括音频处理、语音识别、语音转录、语音合成等,功能依次关联,能够形成一套完整的工作流,支持中日英三种语言,免费开源。

🐙 项目地址

Message link
#RePost #AI #GitHub

推荐一款开源免费的 AI 音乐生成器——MusicGPT。

主要特性:

高效本地运行:支持在任何平台上高效本地运行最新的音乐生成 AI 模型,如 Meta 的 MusicGen 模型。

跨平台支持:兼容 Windows、macOS 和 Linux 系统。

开箱即用:无需安装任何依赖,小白用户也能轻松使用。

GitHub:https://github.com/gabotechs/MusicGPT

via 人工智能讨论组 - 即刻圈子 (author: AI觉醒独立计划)

Message link
#RePost #HomeLab #GitHub #Tool

[小雅全家桶部署,立享百万资源**](https://github.com/monlor/docker-xiaoya)

💡使用 Docker Compose 以更优雅的方式来部署小雅服务,支持一键部署 Alist + Emby + Jellyfin,全平台支持,Linux/Windows/Mac/群晖,X86/Arm架构

🚀 部署alist+下载元数据+部署emby/jellyfin服务全流程自动,无需人工干预

🔄 一键部署

🗣 部署或更新脚本

脚本支持重复执行

bash -c "$(curl -fsSL https://raw.githubusercontent.com/monlor/docker-xiaoya/main/install.sh)"

🗣 卸载脚本

bash -c "$(curl -fsSL https://raw.githubusercontent.com/monlor/docker-xiaoya/main/uninstall.sh)"

🔄 部署配置推荐

🔵 Alist + Emby: 2核 4G内存 150G硬盘

🔵 仅部署 Alist: 1核 512M内存 512M硬盘

🔵 Alist + Emby + Jellyfin: 2核 4G内存 200G硬盘

🔵 Alist + Jellyfin: 2核 4G内存 150G硬盘

🔄 服务组件介绍

🔵 Alist: 提供资源在线播放,WebDav服务

🔵 Metadata: Emby和Jellyfin的元数据管理

🔵 Emby: 用家庭影视库的方式,可视化展示Alist中的资源

🔵 Jellyfin: Emby的开源版本,功能是一样的

via. *monlor* from. *数字生活频道*

Message link
#RePost #GitHub #AI #TTS #Tool

🔉 **ChatTTS - 最近很火爆的文本转语音项目**

视频演示

在线体验

开发者声称该项目突破了开源天花板!最大的模型使用了 10 万小时以上的中英文数据进行训练。在 HuggingFace 中开源的版本为 4 万小时训练且未 SFT 的版本(无版权风险)

ChatTTS 无障碍支持中英文,还支持一些细粒度控制,允许加入笑声、说话停顿、语气词等

它还可以复刻已经逝去的人的绝版声音,看演示视频不论是语调还是语气的变化,都挺接近本人的

在线体验一波真的非常好玩,再这么玩下去,播音员都要失业了

Message link
#RePost #GitHub #Chrome #Tool

这个有意思,像comfyui一样在chrome中自定义创建能自动完成某种工作的网页工作流。

GitHub - AutomaApp/automa: A browser extension for automating your browser by connecting blocks

🧐Automa是一款浏览器扩展,通过连接模块实现浏览器自动化,能够自动填表、执行重复任务、截图和抓取网站数据。

➡️链接:https://github.com/automaapp/automa

重点

🧩Automa通过连接不同的模块来实现自动化任务,支持定时执行自动化操作。

🌐提供了一个市场,用户可以在这里分享和下载各种工作流,便于交流和使用。

🔧支持Chrome和Firefox浏览器,用户可以在本地安装并运行开发或生产版本。

📜Automa的源码分为多个模块,包括核心功能、开发环境配置和工具,采用GNU AGPL或商业许可。

🌍项目在GitHub上有超过1万颗星和1000个分叉,受到广泛关注和贡献。

via 人工智能讨论组 - 即刻圈子 (author: Simon的白日梦)

Message link
Docmost

#RePost #GitHub #Tool #Doc

一个开源协作文档和wiki软件。它是 Confluence 和 Notions 等软件的替代品。帮助用户更方便地生成和维护项目的文档。

该工具的主要功能包括:

自动化文档生成:Docmost 可以根据项目的源代码和注释自动生成文档,减少了手动编写文档的工作量。

支持多种格式:支持生成 HTML、PDF、Markdown 等多种格式的文档,以满足不同的需求。

集成 CI/CD 管道:可以集成到 CI/CD 管道中,实现文档的自动更新和发布,确保文档始终与代码同步。

用户友好界面 插件和扩展

起步阶段,感兴趣可以留意一下

https://github.com/docmost/docmost

Message link GitHub - docmost/docmost: Docmost is an open-source collaborative wiki and documentation software. It is an open-source alternative…
#RePost #AI #Video #Prompt

Claude 3.5 Sonnet + Replit,极简制作3Blue1Brown风格Manim动画

前2天做的关于理想汽车财报亮点的视频在推上还比较受欢迎,今天又尝试了做小米的,这次是多次沟通修改的。

这里我解释下,不是Claude直接生成最后的视频效果,而是让Claude先用Manim库生成Python脚本,之后本地运行Python脚本渲染生成MP4。

我也看到一些用户反馈Manim本地安装各种依赖比较难,不用着急,今天推荐一个非常好用的平台——Replit。

Replit是一个在线的集成开发环境(IDE),可以让你直接在浏览器中编写、运行和分享代码,无需进行复杂的本地环境配置,非常适合快速原型设计和学习新的编程语言或框架。

Replit官方为Manim做了一个开箱即用的模版和拓展。

链接:https://replit.com/@ArnavBansal/manim

下面视频对应的提示词:

「提取附件财务报告的要点,使用Manim库编写动画进行展示。动画要多样化,显示效果要华丽。

首页标题页背景改成橙色,文字白色;其他页背景改成灰色#ececec,白色文字改成 黑色文字,橙色保持不变,请给到完整代码

make it better,让动画效果更丰富

很不错,成功运行了,请你再努力下,make it better,幻灯片转换优化,字体大小优化、动画优化等

CLaude先总结这篇财报的亮点,接着基于这些亮点,写了代码。」

注:这里示例用的是小米2024年第一季度业绩公告,44页PPT样式的PDF。

via AI探索站 - 即刻圈子 (author: kate人不错)

Invalid media: video

Message link manim
#RePost #AI #Video #GitHub

开源社区终于有一个好的视频转绘项目了!

还提供了 Colab 笔记,直接运行就可以,不需要摆弄麻烦的 Comfyui 流程和一堆模型了。

Diffutoon 能够以动漫风格渲染出细节丰富、高分辨率和长时间的视频。它还可以通过一个附加模块根据提示编辑内容。

项目地址,里面有 Colab 笔记可以直接运行:https://github.com/modelscope/DiffSynth-Studio/tree/main/examples/Diffutoon

via AI探索站 - 即刻圈子 (author: 歸藏)

Invalid media: video

Message link DiffSynth-Studio/examples/Diffutoon at main · modelscope/DiffSynth-Studio
#RePost #GitHub #Tool

Ente 是一项提供完全开源、端到端加密的服务 平台,让您将数据存储在云中,而无需信任 服务提供商。在这个平台上,到目前为止,我们已经构建了两个应用程序:Ente Photos(Apple 和 Google Photos 的替代品)和 Ente Auth(2FA 替代已弃用的 Authy)。

https://github.com/ente-io/ente

Message link GitHub - ente-io/ente: Fully open source, End to End Encrypted alternative to Google Photos and Apple Photos
#RePost #AI #Prompt
# Role : 录音转文字校准专家

## Profile :
- author: 小七姐
- version: 1.1
- language: 中文
- LLM:GPT4o
- description: 你是一位录音文字校准专家,能够消除口语表达中的停顿、重复和口语化语气词等常见问题,同时能解决录音软件在记录文字时会产生的错别字、多音字记录不准等技术问题,将口语化的录音文件转换为书面文字。

## Background :
在录音转写过程中,录音软件经常会因为口音、语速等原因产生一些错别字、多音字记录不准等问题。此外,口语表达中的停顿、重复和口语化语气词等也会影响文字的流畅和准确性。为了将录音文件转写为高质量的书面文字,需要对这些问题进行校准和修正。

## Goals :
1. 消除录音文字中的停顿、重复和口语化语气词。
2. 修正录音文字中的错别字和多音字。
3. 确保转写文字保持原文完整性,不遗失任何细节。
4. 提供高质量、流畅的书面文字版本。

## Constraints :
1. 保持原文的完整性,不得删除或遗漏任何信息。
2. 仅校准,而不改写任何原文,确保文字内容忠实于原录音。
3. 修正错误时需保证语义的准确性和连贯性。
4. 校准过程中不得改变原文意思
5. 绝对不会对原文做概括和缩略性的总结,仅仅做出校对

## Skills :
1. 熟悉录音转写的常见问题及其解决方法。
2. 精通中文,能够识别并修正错别字和多音字。
3. 具有良好的语言表达能力,能够将口语化的内容转换为流畅的书面文字。
4. 具备细致入微的校对能力,确保文字的准确性和完整性。

## Workflows :
1. 输入: 引导用户提交录音文字稿。
2. 校准: 消除停顿、重复和口语化语气词,修正错别字和多音字。
3. 输出: 提供校准后的高质量书面文字版本。
4. 检查: 确认修正后的文字保持原文完整性和准确性。
5. 反馈: 根据用户反馈进一步调整和优化校准文字。

## Initialization :
您好,我是录音文字校准专家,我能够帮助您将录音文件中的文字转写为高质量的书面文字。请提供您的录音文字稿,我会进行校准并修正其中的错误,同时保持原文的完整性,不遗失任何细节。


更多 prompt 可以看下我 yellow page 里的提示词图书馆:

https://vxc3hj17dym.feishu.cn/wiki/VDb1wMKDNiNj0mkJn6VcFgRenVc?from=from_copylink

via AI探索站 - 即刻圈子 (author: 小七姐)

Message link
#RePost #AI #Tool

AI在日常生活中的普及率真的低到超出我的想象,最近总是有很多朋友问我:“有什么好用的AI工具”,“遇到XX场景该使用哪个”,“国外的用不了怎么办”等等😂

趁这个机会一站式测评和整理了一些国产(无需魔法)好用且免费(部分付费但值得) 的AI工具,并一句话盘点了它们各自的最强优势。从对话、搜索到画图、视频、PPT制作、Excel处理,分享出来。欢迎大家分享自己觉得好用的,一起交流~

🗣️ AI对话聊天工具(免费):

kimi助手:查资料阅读文件

海螺AI:强语音交互

腾讯元宝:订阅号的优质信息源

豆包:适合家庭,老人小孩友好

🔍 AI搜索引擎(免费):

秘塔AI搜索:可以搜到播客信息源,生成思维导图和PPT

360AI搜索:实时解析视频,提取字幕

天工AI搜索:啥都能干,没有短板也没有特长

博查AI搜索:支持豆包、通义千问、kimi模型

🎨 AI绘画 & 设计工具:

Dremina即梦:剪映旗下绘图视频平台(每天送积分)

通义万相:阿里通义大家族成员,AI绘画(每天免费额度)

奇域AI:中式审美,国内头部AI画图工具(每天有免费额度)

稿定AI:一站式AI设计工具,包括AI做图、AI文案、AI素材等(基础功能免费,高级付费)

🎥 AI视频工具:

Pixverse:免费且强大,服务器在海外加载速度比较慢(每天送50积分)

Dreamina即梦:国内头部,强推首尾帧功能(每天可以免费可以生成5次视频)

必剪Studio:B站推出的,支持AI数字分身定制和视频创作(免费内测中)

即创:抖音一站式视频、图文和直播创作(注册就能免费用)

📊 AI PPT工具:

万知:支持AI文档阅读和PPT创作,内容很丰富详实,审美在线。(免费)

讯飞智文:科大讯飞产品,虽然只有20个模板,但排版和审美在线(免费)

WPS AI:WPS办公助手,功能很全(基础免费,高级功能订阅)

美图AI PPT:美图秀秀产品(每天可免费生成4次)

📈 AI表格数据处理工具(免费):

办公小浣熊:数据分析及可视化,够专业

酷表ChatExcel:北大团队开发,通过聊天处理Excel

⚖️ AI法律助手(免费):

通义法睿:阿里出品,普通人的法律AI顾问

ChatLaw:北大开源,适合法律专家、学子

via AI探索站 - 即刻圈子 (author: AIGC阿岑)

Message link
#RePost

经常会去吃老乡鸡的餐,上个月看到一份《老乡鸡食品安全溯源报告》,内容丰富详实,每道菜的做法、供应商的信息一应俱全,看上去不像假的。对我来说最有参考价值的就是这张图。(我没想到西蓝花也可以预制)

Message link
#RePost #Tool #GitHub

❤️ **NetMount - 一站式统一管理和挂载云存储神器**

▎软件功能:云存储管理和挂载

▎软件平台:Windows macOS **Linux

▎软件介绍:一个简单、易用、高效的开源云存储管理工具,统一管理和挂载云存储设施。

RcloneAlist 强力驱动,支持阿里、百度、天翼、123、115、Dropbox、OneDrive、Azure、OSS 等几乎所有云存储服务。

提供集中直观的存储管理工具,功能丰富的文件浏览器,支持文件上传、复制、移动、删除、重命名。

你可以像本地磁盘一样管理文件,云存储整合为本地文件系统,使用户能无缝访问云端资源,通过虚拟文件系统技术实现高效操作,简化数据管理,提供流畅的云到本地交互体验。

▎软件下载:**点击下载**

Message link
#RePost #Tool #URL #Free

🔔 **F5Bot - 一个免费的的监控服务****

**F5Bot 可以监控 Reddit、Hacker News 和 Lobsters 的关键词

设置好关键词,一旦这些网站出现设置好的关键词,F5Bot 会向你发送邮件

该服务完全免费无限制

Message link
blackbox.ai

#RePost #AI #Tool #DevOps

AI辅助工具。特别为开发者设计的AI编程辅助工具,功能包含:代码沟通和代码搜索等。类似github的copilot等插件工具,好不好用不知道看看无妨。预计不用多久就要被墙了

目前支持:Python、HTML、Front-End-Builder、Java、Javascript、React、Android、Flutter、Next.js、AngularJS、Swift、MongoDB、Pytorch、Xcode、Azure、Bitbucket、DigitalOcean、Docker、Electron、Erlang、FastAPI、Firebase、Flask、Git、Gitlab、Go、Godot、Heroku、GoogleCloud

Message link
Back to Top
OKHK