👋 动态记录 & 转发分享 https://tg.okhk.net/ ✌️
#RePost #GitHub #Tool #macOS

📷 **Cap - 一个开源的录屏工具**

Cap 是 Loom 的开源代替品,除了基本录制功能,最大的特色便是支持录制完分享链接查看,无需保存再发送

目前支持 macOS 和 Web

Message link
#RePost #TTS #Tool #GitHub

王炸级别的文本转语音(TTS)模型——Seed-TTS

字节跳动推出的 Seed-TTS,能够生成几乎无法与人类语音区分的自然声音。

主要特性:

高度逼真:生成自然、逼真的语音。

无需训练:无需额外训练即可生成自然语音。

多样化表现:理解语音上下文,生成带有情感和表现力的语音。

多语种支持:适用于视频博主等需要多语种支持的场景。

应用场景:

小说推文:生成带有情感的生动语音。

视频博主:轻松更换视频语音,支持多语种。

项目介绍及演示:

https://bytedancespeech.github.io/seedtts_tech_report

GitHub 项目地址:https://github.com/BytedanceSpeech/seed-tts-eval

via 人工智能讨论组 - 即刻圈子 (author: AI觉醒独立计划)

Message link
#RePost #GitHub #Tool

🔖 **AigoTools - 一款开源的网址导航程序**

在线演示

AigoTools 内置站点管理和自动收录功能,同时提供国际化、SEO、多种图片存储方案

支持一键部署至第三方托管服务

**已收录至网址导航**

Message link
#RePost #GitHub #Tool

**To QQMusic**

一个歌单迁移工具,主要支持网易云转到 QQ 音乐,优点是可保留原始歌单顺序和自由选择每首歌的匹配结果,缺点是即使有完全匹配的结果,也必须手动选择,免费使用。

🐙 项目地址

Message link
#RePost #GitHub #Tool #Chrome

**Best Cookier**

一个浏览器 Cookie 管理插件,支持 cookie 的增删改查、监控、导入导出等功能,可实现一些网站的账号共享功能,比如知乎、爱奇艺、掘金、v2、github 等,免费开源。

安装地址项目地址

Message link
#AI #Tool #URL #RePost

**Logo Galleria**

基于 AI 的 LOGO 生成工具,可设置主要图案文字,并可添加负面提示,生成速度较慢,效果蛮不错的,免费下载,无需注册。

Message link
#TTS #URL #RePost #GitHub

**Azure Text To Speech**

文本转语音工具,提供多种角色语言的语音生成,并可调整语速、语调与音量,可在线播放和下载,免费使用,无需注册。

现在的晓晓很逼真,语气什么的都有了,只是对于情感还是差一些。

主页项目地址

Message link
#RePost #Tool #GitHub #Windows #macOS

⌨️ **Keyviz - 一款开源的键鼠操作可视化工具****

[

**](https://github.com/mulaRahul/keyviz)当你按下键盘或者鼠标时,Keyviz 可以显示操作动画。自定义程度也很高,你可以自由设定自己喜欢的样式

支持 Windows 和 macOS

使用场景比较多,比如用于录屏或者直播等

Message link
#RePost #Tool #URL

**发票提取助手**

发票提取工具,可将电子发票提取到 Excel 表格中,支持批量处理,免费使用,无需注册。

Message link
#RePost #Tool #GitHub #URL

**缤纷快传**

文件传输工具,支持为下载链接限速限时限次,还支持「即传即收」功能,无账户体系,无数据库依赖,部署方便。

演示地址项目地址

Message link
#RePost #URL #GitHub #Tool

**reader**

开源阅读 3 网页版,提供了超多书源,支持搜索、书架、发现、WebDAV 同步、文字过滤、朗读等功能,还可导入本地书籍,很好的还原了阅读 app,喜欢网页看小说的可以看看。

体验地址项目地址

Message link
#RePost #Video #Tool #GitHub

**m3u8d**

m3u8 视频下载工具,可自动合并 ts 文件转换为 mp4,支持嵌套 m3u8 的 url、下载 aes 加密内容、多线程下载等,没有 ffmpeg 依赖, 不需要单独配置任何环境。

🐙 项目地址

Message link
#RePost #Tool #URL

**ChartCube**

图表制作工具,只需上传数据,即可制作多种图表,支持折线图、柱状图、条形图、饼图、面积图、热力图、雷达图等,选择图表后还可进行超多配置,可导出为图片代码配置文件,免费使用,无需注册。

这个是支付宝推出的服务,有几年了,挺好用的。

Message link
#RePost #Tool #URL

**WebCamera**

基于 WebRTC 技术的实时监控工具,可将手机电脑用作监控摄像头,再利用其它设备访问网页监控画面,并支持监控音频,采用 P2P 点对点连接,保证隐私和通信效率,免费使用,无需注册。

Message link
#RePost #GitHub #Tool #URL #Video

🔗 **TL-RTC-File - 一个开源的网页在线媒体流传输工具**

**在线体验**

该工具基于 WebRTC 开发。支持跨平台传输、多人音视频、屏幕共享、直播、连麦、多人聊天互动等功能

该项目还提供了详细的部署教程,感兴趣的可以一试

WebRTC的全称为「Web Real-Time Communication」,译为网页即时通信,是一个支持网页浏览器进行实时语音对话或视频对话的 API

Message link
#RePost #GitHub #Tool

可以帮你操作手机的agent助手,可以接API也可以端侧运行(感觉水军狂喜了……😂

GitHub - X-PLUG/MobileAgent

🧐MobileAgent是一个功能强大的移动设备操作助手家族,支持多模态操作,具备视觉感知能力,能通过多代理协作实现高效导航和自动化操作。

➡️链接:https://github.com/X-PLUG/MobileAgent

重点

功能特点

📱 MobileAgent-v2:这是移动设备操作助手的最新版本,通过多代理协作实现高效导航。支持安卓和iOS设备。

👁️ 视觉感知:MobileAgent具有自主多模态操作能力,能通过视觉感知实现更智能的设备操作。

🤖 自动化操作:可以自动化执行多种移动设备操作,如应用程序的打开和使用、界面导航等。

应用场景

🔧 研究和开发:适用于学术研究和应用开发,用户可以基于该项目进行定制和扩展。

📈 自动化测试:可用于移动应用的自动化测试,减少人力投入,提高测试效率。

技术背景

📄 学术支持:MobileAgent已被ICLR 2024的大型语言模型代理研讨会接受,并在arXiv上发布了相关论文。

📊 多模态大语言模型:项目关联了多个多模态大语言模型,如mPLUG-Owl和Qwen-VL,展示了其在理解、定位、文本读取等方面的强大能力。

资源与文档

📄 文档:提供详细的使用说明和技术文档,帮助用户快速上手。

📜 开源许可:项目采用MIT许可,开源免费使用。

通过这一项目,研究人员和开发者可以探索和实现更智能、更高效的移动设备操作和自动化解决方案。

via 人工智能讨论组 - 即刻圈子 (author: Simon的白日梦)

Message link
#TTS #URL #Tool #RePost

**Text to Speech**

文本转语音工具,支持多种语言、多种角色、男女性别,生成速度较慢,可下载 mp3 文件,免费使用,无需注册。

texttospeech.im/zh-CN

频道 @WidgetChannel

Message link
#AI #Chrome #Tool #GitHub #RePost

*🤗 [tansformers.js - 通过浏览器运行 900+ 开源 AI 项目*](https://github.com/xenova/transformers.js)

Hugging Face 页面

用户可以直接在浏览器中运行大量机器学习模型,无需后端服务器

transformers.js 支持文本分类、问答、语言建模、摘要、翻译、多项选择、文本生成、图像分类、目标检测、分割、语音识别和零样本图像分类等...

Message link
Back to Top
OKHK