vivo开源创新技术,多模态AI再迎突破
2025-04-08

多
多模态AI
正面
加自选
vivo与香港中文大学团队开源多模态AI技术UI—R1,通过强化学习(RL)显著提升GUI智能体动作预测能力。该技术仅用136张截图等少量高质量数据,设计包含动作类型、坐标准确度和格式规范的奖励函数,并采用GRPO算法优化,使模型在跨平台测试中表现优异,如在ScreenSpot测试中准确率达78.6%,超越大模型CogAgent—18B。研究证明小数据高效训练和强化学习在多模态任务中的潜力。
今日额度已用完
开通会员后解锁无限制查看权益

重要提示和声明
本页面内容由AI提炼生成,无法确保完全真实准确,不代表 官方立场,不构成投资建议。阅读详细说明,请
点击此处
