12月10日,2025年全国中学生数学奥林匹克竞赛(CMO)决赛落下帷幕,一个特殊的"考生"——上海人工智能实验室旗下的书生科学多模态大模型(Intern-S1-20251122)——以102分的优异成绩引发广泛关注。这一分数不仅在AI参赛者中排名第一,更超过了本届CMO的许多金牌得主(金牌线为78分),在人类选手中位列第三,仅次于126分(满分)和110分的选手。

从"陪考者"到"同场竞技者":AI首次参与奥赛的里程碑

CMO是中国最高规格的数学奥林匹克竞赛,今年主办方首次设立AI测试环节,邀请大模型与人类同场答题,并交由相同的评委专家组阅卷打分。这一创新举措标志着AI与人类在数学竞赛领域的首次正式"同台竞技"。

"AI在奥赛中超越人类是未来一定会发生的事。"上海人工智能实验室青年领军科学家陈恺在赛后表示。他认为,AI在数学竞赛上的进步是一个逐步发展的过程,"现在AI已经能拿奥赛金牌了,未来超过奥赛顶尖的人类选手也大有可能。"

技术突破:AI推理能力的"通专融合"之道

Intern-S1的出色表现,源于其独特的"通专融合"技术架构SAGE(智者)。这一架构的创新点在于以数学引理为核心的多轮分层推理机制,以及基于结果的过程校验模型,显著提升了模型在超长程思考和证明时的严谨性。

"传统大模型在长程推理中容易出现'逻辑断层',而SAGE架构通过多轮分层推理,让AI能够像人类一样逐步推导、探索和修正。"陈恺解释道。

值得注意的是,AI对第四题的解答被阅卷专家评价为"一个新的解法,巧妙的调整法,在学生的解法中没有见过"。这意味着AI不仅能模仿人类解题思路,更能突破人类思维局限,通过自主探索和分析找到新的解题方法。

教育与科研:AI在K12和科研领域的应用前景

AI在奥赛中的成功,对教育和科研领域具有深远意义。陈恺指出,"AI在奥赛能够拿金牌、达到人类第三的水平,就意味着在高中数学或者K12教育领域,AI的辅导能力更强了。"

在教育领域,AI可以为学生提供更精准、更个性化的辅导,不仅能解答问题,更能展示思考过程,帮助学生理解解题思路。"AI可以像最好的数学老师一样,一步步引导学生思考,而不仅仅是给出答案。"陈恺补充道。

在科研领域,AI的推理能力提升正在被应用于实际工作中。"有一些数学家已经在用大模型在其科研过程中帮助做一些定理证明、开阔思路。"陈恺表示,"AI的自主解题能力可能成为科研创新的重要推动力。"

未来展望:AI在特定任务上的突破与更广泛能力的差距

尽管AI在奥赛中表现出色,但专家们强调,这并不意味着AI在数学或更广泛的能力上已超越人类。

"数学是个很宽泛深奥的领域,也有很多前沿的研究,在这方面AI还要更长的时间积累。"陈恺补充道。

中国人民大学附属中学教师、奥数金牌教练张端阳在接触AI模型后表示:"大模型在CMO的表现,也让我惊讶于AI发展的速度之快,就像10年前的围棋一样,突破可能就是一刹那。"

上海人工智能实验室在官方发文中表示,计划将Intern-S1的长程推理能力拓展应用于物理、化学、生命科学等基础科研领域,通过与专业工具的打通与融合,实现从"长时间独立思考"向"长时间独立科研"转变,进而加速各领域科研范式的变革。

结语:AI与人类的共进之路

AI在奥赛中摘得金牌,是AI技术发展的重要里程碑,但同时也提醒我们,AI与人类的关系不是简单的"取代",而是"互补"与"共进"。

"AI在奥赛中超越人类是未来一定会发生的事,"陈恺总结道,"但这不意味着AI在所有领域都能超越人类。AI与人类的协作,才是未来发展的正确方向。"

当AI能提供新的解题思路,当AI能辅助科研创新,当AI能提升教育质量,我们看到的不是AI对人类的威胁,而是AI作为人类智慧延伸的无限可能。在数学这个推理能力的代表领域,AI与人类正在共同书写一个新的篇章。

从102分到126分,AI与人类的差距正在缩小;从解题思路到创新方法,AI与人类的协作正在深化。在AI与人类共同探索的道路上,未来已来,而我们正站在一个新时代的起点上。