这届出题太难了!新基准让多模态模型集体自闭,GPT—4o都是零分
2025-02-18

多
多模态AI
正面
加自选
ZeroBench是一个针对多模态模型的高难度视觉基准测试,包含100个复杂问题,涉及多步骤推理和广泛的知识领域。20多个知名AI模型在首次测试中全部得零分,显示当前多模态模型的能力与ZeroBench的难度之间存在显著差距。研究团队通过多轮筛选和调整,确保了问题的挑战性。
今日额度已用完
开通会员后解锁无限制查看权益

重要提示和声明
本页面内容由AI提炼生成,无法确保完全真实准确,不代表 官方立场,不构成投资建议。阅读详细说明,请
点击此处
