大模型全军覆没,中科院自动化所推出多图数学推理新基准
2025-03-12

多
多模态AI
正面
加自选
中国科学院自动化研究所推出多图数学推理数据集MV—MATH,旨在评估MLLM在多视觉场景中的数学推理能力。实验结果显示,包括GPT-4在内的多个大模型表现不佳,所有模型均未及格,表明MLLM在复杂多视觉感知与图像交叉理解上仍存在显著挑战。
今日额度已用完
开通会员后解锁无限制查看权益

重要提示和声明
本页面内容由AI提炼生成,无法确保完全真实准确,不代表 官方立场,不构成投资建议。如需阅读详细说明,请
点击此处
