#RePost #GitHub #Tool

可以帮你操作手机的agent助手,可以接API也可以端侧运行(感觉水军狂喜了……😂

GitHub - X-PLUG/MobileAgent

🧐MobileAgent是一个功能强大的移动设备操作助手家族,支持多模态操作,具备视觉感知能力,能通过多代理协作实现高效导航和自动化操作。

➡️链接:https://github.com/X-PLUG/MobileAgent

重点

功能特点

📱 MobileAgent-v2:这是移动设备操作助手的最新版本,通过多代理协作实现高效导航。支持安卓和iOS设备。

👁️ 视觉感知:MobileAgent具有自主多模态操作能力,能通过视觉感知实现更智能的设备操作。

🤖 自动化操作:可以自动化执行多种移动设备操作,如应用程序的打开和使用、界面导航等。

应用场景

🔧 研究和开发:适用于学术研究和应用开发,用户可以基于该项目进行定制和扩展。

📈 自动化测试:可用于移动应用的自动化测试,减少人力投入,提高测试效率。

技术背景

📄 学术支持:MobileAgent已被ICLR 2024的大型语言模型代理研讨会接受,并在arXiv上发布了相关论文。

📊 多模态大语言模型:项目关联了多个多模态大语言模型,如mPLUG-Owl和Qwen-VL,展示了其在理解、定位、文本读取等方面的强大能力。

资源与文档

📄 文档:提供详细的使用说明和技术文档,帮助用户快速上手。

📜 开源许可:项目采用MIT许可,开源免费使用。

通过这一项目,研究人员和开发者可以探索和实现更智能、更高效的移动设备操作和自动化解决方案。

via 人工智能讨论组 - 即刻圈子 (author: Simon的白日梦)

Message link
 
 
Back to Top
OKHK