vivo开源创新技术,多模态AI再迎突破

2025-04-08
vivo与香港中文大学团队开源多模态AI技术UI—R1,通过强化学习(RL)显著提升GUI智能体动作预测能力。该技术仅用136张截图等少量高质量数据,设计包含动作类型、坐标准确度和格式规范的奖励函数,并采用GRPO算法优化,使模型在跨平台测试中表现优异,如在ScreenSpot测试中准确率达78.6%,超越大模型CogAgent—18B。研究证明小数据高效训练和强化学习在多模态任务中的潜力。
今日额度已用完
开通会员后解锁无限制查看权益
重要提示和声明
本页面内容由AI提炼生成,无法确保完全真实准确,不代表 官方立场,不构成投资建议。阅读详细说明,请 点击此处
本页面内容由AI基于全网用户讨论及市场动态提炼生成,仅供 用户作一般性的参考阅读使用,不构成投资建议。
本页面提及的观点不代表 官方立场,亦不代表本公司对其中任何行业或相关公司的判断:本页面如提及任何投资标的,亦仅基于一般举例和参考目的,不应被视为投资建议。
AI仍处于早期发展阶段,在技术上尚不成熟,且用户讨论具有UGC属性,本公司无法保证AI提炼生成内容完全真实准确。若涉及对你或其他相关方可能产生重大影响的情形,建议你采取合理必要措施对AI提炼、生成的内容进行核实,并咨询相关专业机构和专业人士,本页面内容不应成为你进一步作为或不作为的依据。
投资有风险,决策需谨慎。在任何情况下,本公司不对任何人因使用本页面的任何内容所导致的损失承担任何责任。
首页 自选股 会员 我的
Baidu
map