174名北大学生能否考过AI？结果很意外

2025-12-28 14:20 新华社

　　“因为大模型太会‘背书’了。”团队成员解释道。互联网可及的测试题大多已被博闻强识的AI在训练阶段熟读。而化学，恰恰是一门不能只靠死记硬背的学科。它既有严密的逻辑推演，又充满了对微观世界的空间想象。“我们非常好奇，大语言模型的一维 next token prediction，能否解决二维、甚至三维空间中的复杂推理问题。”

　　要设计一套让AI“没见过”、必须靠硬实力推理的题目，难度极高。然而，这正是北大化院的独特优势所在。近百名师生——其中不乏奥赛金牌得主——集结起来，决定给AI出一套高门槛、重推理、防作弊的试卷。

　　他们要考的，是AI是否真的“懂”化学。

　　一场游戏中的学术共创

　　设计题目往往是枯燥的，但这群年轻的北大人却把它变成了一场“游戏”。

　　为了构建这套高质量评估集，团队搭建了一个专属协作平台。在这里，出题、审题、修题从单调的任务，变成了一套循序渐进的“通关”流程。成员们在平台上协作，互相审阅、彼此“找茬”，让严谨的科学探讨与活跃的思维碰撞交织共融。

　　团队还引入了积分激励系统，让出题过程就像在游戏中打怪升级。一道题目需历经编写初稿、撰写解析，再通过初审与终审的严格审核，每个环节均由不同的同学把关，并发放相应的积分。终审通过的题目，甚至最多迭代过15个版本。

SUPERChem题库的三阶段审核流程

　　当最强大脑遇上“北大难度”

　　考试成绩揭晓。

1 23 4 5 6 下一页

174名北大学生能否考过AI？结果很意外

猜你喜欢

热点新闻

174名北大学生能否考过AI？结果很意外

猜你喜欢

热点新闻

转发学习！9图了解政协知识点

今年我国将制定托育服务法等法律

2025年是国产人形机器人技术突破关键一年

国宝“七仔”遭喜鹊薅毛，秦岭大熊猫研究中心：有利于整理毛发

哈梅内伊将被安葬在出生地

哈梅内伊次子，要接班了？

哈尔滨19米高网红大雪人打卡78天终于“下班”，曾亮相央视春晚分会场

冬残奥村开门迎客，中国代表团从容备战

高铁上可使用插排吗？12306回应