揭秘首个AI数学大赛：为防止人类替考，AI“先交代”再交卷

4月15日上午8点，2024阿里巴巴全球数学竞赛预选赛正式交卷，58个国家与地区的选手在线鏖战48小时，更有来自全球知名高校院所与企业的563支队伍使用AI作答，其中00后占比超50%。他们各显神通，使用模型调优、AI Agent、提示词工程等多种方式，推动AI构建更强大的数学能力。

阿里巴巴全球数学竞赛组委会介绍，当前，AI已经在不少领域展现超越人类的能力，但在“人类智慧的皇冠”数学领域还颇为受限。因此，从2024年起，阿里巴巴全球数学竞赛决定向AI开放，鼓励探索AI的潜力上限，推动AI在数学领域的研究和应用创新。

在这场48小时的预选赛中，AI和人类选手共用一套试卷，题目包括选择题、解答题与证明题。为了保证公平，防止“人类替考”，组委会制定了“赛前固定方案、赛中诚实答题、赛后复现总结”的三步走规则。因此，在正式开考之前，AI参赛团队就需要完成模型的训练或微调，并锁定做题版本；如使用提示词工程，也需要提前提交相应方案。

AI挑战赛吸引了全球563支队伍踊跃报名，主要来自全球知名高校院所与企业，包括北大、清华、牛津、中国科学院、AWS、字节跳动等，大多具有AI专业背景，也有部分来自数学、物理等专业。统计显示，参赛队伍中，00后占比超50%，年轻一代正在成为AI生力军，用多种形式热情探索AI的数学上限。他们有的在开源大模型的基础上进行专项微调，让AI从初等数学进阶到高等数学；他们有的构建起AI Agent，结合提示词工程来调用GPT-4等闭源模型，使得GPT-4的数学解题能力有大幅提升。

西南交通大学应用物理系的大四学生向劲宇是一名AI开发者，也是MetaGPT-MC小组贡献者之一，这次他和多位开发者组队参赛，使用GPT-4与Claude 3组成Muti-Agent的方案，让AI分饰多个角色、相互验证来完成答题步骤，改善了AI“一本正经的胡说八道”的通病，提升了AI做题的准确性。在AWS从事AI研究的毛帽，是数学专业的博士，已连续三年参赛，今年转换身份，从人类选手转为AI的竞赛辅导员，与同事组成一支“豪华团队”，集合了数学、统计、地球物理及机器学习背景的4名博士，希望能向人类选手们秀一把AI的实力。

据介绍，本次AI挑战赛结果将于6月与人类选手成绩同期公布，AI前三名分别获得奖金10000美元、5000美元、2000美元。不少选手表示，他们更期待的是，AI的成绩能否达到人类优秀选手水平，能否达到决赛资格线？在往年的阿里巴巴全球数学竞赛中，只有1%的预选赛选手能够晋级决赛。

文/北京青年报记者温婧

编辑/樊宏伟

友情提示

本站部分转载文章，皆来自互联网，仅供参考及分享，并不用于任何商业用途；版权归原作者所有，如涉及作品内容、版权和其他问题，请与本网联系，我们将在第一时间删除内容！

联系邮箱：1042463605@qq.com

揭秘首个AI数学大赛：为防止人类替考，AI“先交代”再交卷

友情提示

赵斌再次否认姜萍是“天才少女”，强调是团队的一次炒作事件

老师的朋友圈能有多搞笑，点开前没想到这么好笑，一条比一条好笑

数学启蒙，就看这10部神级数学纪录片

浙大婉拒姜萍，称要按规定办事，哈佛要人网友反对，多所大学表态

姜萍妈妈晒女儿备考画面，没想到却引发网友质疑，难道是摆拍？

打脸！阿里官方答疑全程直播，有知情人透露内幕

夫妻在外地遭遇车祸，可是人25元的挂号费都拿不出。

拜登宣布赦免其子亨特·拜登，特朗普回应：如此的职权滥用！

《还珠格格》《一帘幽梦》作者琼瑶去世，终年86岁

外交部：三名被美方错误羁押的中国公民平安回到祖国

《还珠格格》《一帘幽梦》作者琼瑶轻生身亡，终年86岁

距卸任还有一个半月美总统拜登宣布赦免其子亨特·拜登

广州白云机场进境旅客用行李箱携带百万美金被查！现场曝光

空调也被“卡脖子”？日本产品把生产线搬走，国产空调不能用了？

乌能源部副部长：俄天然气过境运输将从2025年停止

美最强驱逐舰不惜血本搞“换装”

韩国为何突发“紧急戒严令”又解除

江苏昆山通报“一公园长椅被焊上钢管”：隔断扶手现已连夜全部拆除