大模型全军覆没，中科院自动化所推出多图数学推理新基准

2025-03-12

加自选

中国科学院自动化研究所推出多图数学推理数据集MV—MATH，旨在评估MLLM在多视觉场景中的数学推理能力。实验结果显示，包括GPT-4在内的多个大模型表现不佳，所有模型均未及格，表明MLLM在复杂多视觉感知与图像交叉理解上仍存在显著挑战。

今日额度已用完

开通会员后解锁无限制查看权益

重要提示和声明

本页面内容由AI提炼生成，无法确保完全真实准确，不代表官方立场，不构成投资建议。如需阅读详细说明，请点击此处