
从未停步为您分享以下优质知识
AI在数学考试中的满分因考试类型和模型能力而异,具体如下:
- 满分:
150分
- AI表现:2024年测试中,阿里Qwen2-72B、GPT-4o等模型在数学科目上均未及格,最高分仅75分(满分150分)。
- 满分:
42分(每题7分,共6题)
- AI表现:2025年测试中,AI模型普遍存在逻辑错误、缺乏创造力和评分失败等问题,最高得分仅5%。
- 满分:
29分(金牌标准)
- AI表现:2024年谷歌DeepMind的AI系统在IMO中取得28分银牌,接近金牌标准但未达标。
总结:AI在不同数学考试中的满分标准差异较大,且当前技术仍存在逻辑推理和创造力不足的短板。