vivo开源创新技术，多模态AI再迎突破

2025-04-08

加自选

vivo与香港中文大学团队开源多模态AI技术UI—R1，通过强化学习（RL）显著提升GUI智能体动作预测能力。该技术仅用136张截图等少量高质量数据，设计包含动作类型、坐标准确度和格式规范的奖励函数，并采用GRPO算法优化，使模型在跨平台测试中表现优异，如在ScreenSpot测试中准确率达78.6%，超越大模型CogAgent—18B。研究证明小数据高效训练和强化学习在多模态任务中的潜力。

今日额度已用完

开通会员后解锁无限制查看权益

重要提示和声明

本页面内容由AI提炼生成，无法确保完全真实准确，不代表官方立场，不构成投资建议。阅读详细说明，请点击此处