👋 动态记录 & 转发分享 ✨ https://tg.okhk.net/ ✌️
**reader**
开源阅读 3 网页版,提供了超多书源,支持搜索、书架、发现、WebDAV 同步、文字过滤、朗读等功能,还可导入本地书籍,很好的还原了阅读 app,喜欢网页看小说的可以看看。
体验地址 丨 项目地址
Message link
🔖 **Pintree - 将浏览器书签变成漂亮的导航网站**
开源页面
这个项目大部分都是用免费服务开发而成,并且是纯静态的,详细的可以看这里
➡**️已收录至「网址导航****」**
Message link
**ChartCube**
图表制作工具,只需上传数据,即可制作多种图表,支持折线图、柱状图、条形图、饼图、面积图、热力图、雷达图等,选择图表后还可进行超多配置,可导出为图片、代码和配置文件,免费使用,无需注册。
这个是支付宝推出的服务,有几年了,挺好用的。
Message link
**WebCamera**
基于 WebRTC 技术的实时监控工具,可将手机或电脑用作监控摄像头,再利用其它设备访问网页监控画面,并支持监控音频,采用 P2P 点对点连接,保证隐私和通信效率,免费使用,无需注册。
Message link
🔗 **TL-RTC-File - 一个开源的网页在线媒体流传输工具**
**在线体验**
该工具基于 WebRTC 开发。支持跨平台传输、多人音视频、屏幕共享、直播、连麦、多人聊天互动等功能
该项目还提供了详细的部署教程,感兴趣的可以一试
WebRTC的全称为「Web Real-Time Communication」,译为网页即时通信,是一个支持网页浏览器进行实时语音对话或视频对话的 API
Message link
#RePost #GitHub #Tool
可以帮你操作手机的agent助手,可以接API也可以端侧运行(感觉水军狂喜了……😂)
GitHub - X-PLUG/MobileAgent
🧐MobileAgent是一个功能强大的移动设备操作助手家族,支持多模态操作,具备视觉感知能力,能通过多代理协作实现高效导航和自动化操作。
➡️链接:https://github.com/X-PLUG/MobileAgent
✨重点
功能特点
●📱 MobileAgent-v2:这是移动设备操作助手的最新版本,通过多代理协作实现高效导航。支持安卓和iOS设备。
●👁️ 视觉感知:MobileAgent具有自主多模态操作能力,能通过视觉感知实现更智能的设备操作。
●🤖 自动化操作:可以自动化执行多种移动设备操作,如应用程序的打开和使用、界面导航等。
应用场景
●🔧 研究和开发:适用于学术研究和应用开发,用户可以基于该项目进行定制和扩展。
●📈 自动化测试:可用于移动应用的自动化测试,减少人力投入,提高测试效率。
技术背景
●📄 学术支持:MobileAgent已被ICLR 2024的大型语言模型代理研讨会接受,并在arXiv上发布了相关论文。
●📊 多模态大语言模型:项目关联了多个多模态大语言模型,如mPLUG-Owl和Qwen-VL,展示了其在理解、定位、文本读取等方面的强大能力。
资源与文档
●📄 文档:提供详细的使用说明和技术文档,帮助用户快速上手。
●📜 开源许可:项目采用MIT许可,开源免费使用。
通过这一项目,研究人员和开发者可以探索和实现更智能、更高效的移动设备操作和自动化解决方案。
via 人工智能讨论组 - 即刻圈子 (author: Simon的白日梦)
Message link
可以帮你操作手机的agent助手,可以接API也可以端侧运行(感觉水军狂喜了……😂)
GitHub - X-PLUG/MobileAgent
🧐MobileAgent是一个功能强大的移动设备操作助手家族,支持多模态操作,具备视觉感知能力,能通过多代理协作实现高效导航和自动化操作。
➡️链接:https://github.com/X-PLUG/MobileAgent
✨重点
功能特点
●📱 MobileAgent-v2:这是移动设备操作助手的最新版本,通过多代理协作实现高效导航。支持安卓和iOS设备。
●👁️ 视觉感知:MobileAgent具有自主多模态操作能力,能通过视觉感知实现更智能的设备操作。
●🤖 自动化操作:可以自动化执行多种移动设备操作,如应用程序的打开和使用、界面导航等。
应用场景
●🔧 研究和开发:适用于学术研究和应用开发,用户可以基于该项目进行定制和扩展。
●📈 自动化测试:可用于移动应用的自动化测试,减少人力投入,提高测试效率。
技术背景
●📄 学术支持:MobileAgent已被ICLR 2024的大型语言模型代理研讨会接受,并在arXiv上发布了相关论文。
●📊 多模态大语言模型:项目关联了多个多模态大语言模型,如mPLUG-Owl和Qwen-VL,展示了其在理解、定位、文本读取等方面的强大能力。
资源与文档
●📄 文档:提供详细的使用说明和技术文档,帮助用户快速上手。
●📜 开源许可:项目采用MIT许可,开源免费使用。
通过这一项目,研究人员和开发者可以探索和实现更智能、更高效的移动设备操作和自动化解决方案。
via 人工智能讨论组 - 即刻圈子 (author: Simon的白日梦)
Message link
**Text to Speech**
文本转语音工具,支持多种语言、多种角色、男女性别,生成速度较慢,可下载 mp3 文件,免费使用,无需注册。
texttospeech.im/zh-CN
频道 @WidgetChannel
Message link
*🤗 [tansformers.js - 通过浏览器运行 900+ 开源 AI 项目*](https://github.com/xenova/transformers.js)
Hugging Face 页面
用户可以直接在浏览器中运行大量机器学习模型,无需后端服务器
transformers.js 支持文本分类、问答、语言建模、摘要、翻译、多项选择、文本生成、图像分类、目标检测、分割、语音识别和零样本图像分类等...
Message link
#RePost #GitHub #Tool #URL
⏲**LibreSpeed - 一个开源的在线测网速工具**
在线体验:librespeed.org
支持测试下载速度、上传速度、延迟、抖动、多点测速等功能,支持 Docker 部署
Message link
⏲**LibreSpeed - 一个开源的在线测网速工具**
在线体验:librespeed.org
支持测试下载速度、上传速度、延迟、抖动、多点测速等功能,支持 Docker 部署
Message link
🎥 **Stability AI 发布最强文生图开源模型「Stable Diffusion 3 Medium」**
在线体验
官方称 SD3 Medium 为迄今为止最先进的开源图像生成模型,模型包含 20 亿个参数,适合在消费类 PC 和笔记本电脑以及企业级 GPU 上运行
✨Features
▫️克服常见的手部和面部瑕疵,无需复杂工作流程即可提供高质量图像。
▫️理解涉及空间关系、构图元素、动作和风格的复杂提示。
▫️在生成文本方面取得前所未有的成果,无人工痕迹和拼写错误。
▫️低 VRAM 占用,适用于标准消费级 GPU,也不会降低性能。
▫️能够从小数据集吸收细微细节,使其非常适合定制。
📑相关阅读
今天,Stability AI 发布了「Stable Diffusion 3」!
Message link
*💻 [LM Studio - 一个可以在本地运行大模型的程序](https://lmstudio.ai/)*
LM Studio 可以在本地轻松部署使用 Llama 3、Phi 3、Falcon、Mistral、StarCoder、Gemma 等大模型
**
LM Studio 使用 CPU 和内存进行推理,可以不依赖显卡算力,所以只要你的电脑不是太老,基本上都可以安装使用**
支持Windows、Linux、macOS
*📑相关阅读*
▫️Pinokio - 真「一键」部署 AI 大模型神器!
▫️Jan - 一个多合一的 AI 大模型客户端
▫️Ollama - 在本地运行 Llama 2 大模型
Message link
**Agr Reader**
Material3 风格的 RSS 阅读器,界面简约美观,支持自定义阅读样式、全文解析、沉浸式翻译,并支持接入 FreshRSS/Tiny Tiny RSS/Miniflux 等服务。
订阅源推荐网站
https://rss-source.com
https://plink.anyfeeder.com
https://feedx.best
https://github.com/AboutRSS/ALL-about-RSS
https://morerss.com/zh.php
www.agrreader.xyz
Message link
**Rin - 一个基于 Cloudflare Pages + Workers + D1 + R2 全家桶的博客**
在线演示
无需服务器、无需备案,只需要一个解析到 Cloudflare 的域名即可部署该博客
支持登录、在线编辑、评论、Webhook等功能
将白嫖进行到底!
Message link
⬆️ **Social Auto Upload - 一键分发短视频至自媒体平台**
该项目旨在自动化上传视频到多个社交媒体平台,包括抖音、小红书、视频号、TikTok、YouTube 和 B 站等
支持自动化上传、定时上传、Cookie 管理、国外平台代理设置、多线程上传和 Slack 推送等功能
Message link
⭐️ **Dokploy - 一个免费的自托管平台即服务 (PaaS)**
开源页面
Dokploy 是 Heroku、Vercel 和 Netliify 等平台的开源的替代品
这类服务的出现是大势所趋,部署项目时可以省去很多步骤
相关阅读
Coolify - 一个开源的 Vercel 代替方案
Message link
**any-reader**
一个多站点聚合阅读工具,适用于小说、漫画和视频,提供 JS 解析库、VSCode 插件、桌面端、网页端、Docker 等,支持自定义规则,同时兼容 **ESO 书源规则**,也支持本地 TXT 和 EPUB 格式阅读。
主页 丨 项目地址
Message link
检索相似图片的算法
通过向量库,检索相似图片,逻辑如下:
1. 将所有图片向量化,通过OpenAI CLIP库
https://huggingface.co/docs/transformers/model_doc/clip
1. 将向量结果存到向量数据库里面
2. 文字检索
文字=>向量化 =>相似查找HNSW=>结果
代码地址:
https://github.com/pingcap/tidb-vector-python/blob/main/examples/image_search/example.ipynb
Google Colab:
https://colab.research.google.com/github/deep-diver/image_search_with_natural_language/blob/main/notebooks/Image_Search_CLIP.ipynb#scrollTo=q5xcJyqKMu2z
via 人工智能讨论组 - 即刻圈子 (author: 毛毛读书忙)
Message link