这届出题太难了！新基准让多模态模型集体自闭，GPT—4o都是零分

2025-02-18

加自选

ZeroBench是一个针对多模态模型的高难度视觉基准测试，包含100个复杂问题，涉及多步骤推理和广泛的知识领域。20多个知名AI模型在首次测试中全部得零分，显示当前多模态模型的能力与ZeroBench的难度之间存在显著差距。研究团队通过多轮筛选和调整，确保了问题的挑战性。

今日额度已用完

开通会员后解锁无限制查看权益

重要提示和声明

本页面内容由AI提炼生成，无法确保完全真实准确，不代表官方立场，不构成投资建议。阅读详细说明，请点击此处