开云体育战报：马斯克Grok4笑傲AI象棋大赛DeepSeek没干过o4-miniKimi K2被喊冤

开云体育NEWS CENTER

您当前位置：首页 > 开云体育

2025-08-10

浏览次数：次

　　最新战报最新战报：首届AI国际象棋对战……马斯克家的Grok 4“遥遥领先”了。

　　眼见自家Grok 4表现出色，马斯克当然不会错过PR良机，不过回应略显凡尔赛：

　　当然，让AI对战国际象棋，过程比输赢重要多了，毕竟谷歌发起这次比赛的初衷，就是测试“涌现”能力。

　　本次比赛由谷歌发布，作为推广Kaggle游戏竞技场的一个环节。首次比赛以国际象棋开始。

　　除了各个顶级模型的象棋对决，直播还邀请了国际象棋特技大师中村光（Hikaru Nakamura）作为讲解。

　　他于7岁那年开始学习国际象棋，到15岁时成为全美国际象棋冠军并拿到GM头衔，也是本届EWC国际象棋（迄今为止规模最大的国际象棋锦标赛）的季军。

　　并且，所有在八分之一决赛中的比赛都以完美的4-0结束。实力差距非常明显。

　　网友们分析了这次赛况，表示Grok 4在这次基准测试中“在战术策略和速度上超越了所有其他模型”。

　　Grok4如同猛兽，它轻松的表现就像“真正的GM”一样下棋，成为当天最佳。

　　R1提供的推理虽然自信却错误，而且对棋盘局势的缺乏洞察导致它留下了棋子给o4-mini率先拿走。

　　这场Gemini 2.5 Pro和Claude Opus 4的对阵是当天最佳对局，两个模型都展示了高水平的棋艺。

　　Claude出现一些失误，而Gemini Pro展现了强大的战术视野，但给出的分析有时过于冗长。

　　这是最快的四分之一决赛，Kimi K2被“碾压”，主要是因为它反复坚持走非法棋步，o3以弃权获胜，没有太多值得分析的表现。

　　不过也有人替Kimi鸣不平：因为Kimi不是推理模型，长思考才能有更好的性能，步骤越往后，越需要长思考。

　　这么说吧，国际象棋规则明确但复杂度高（10^120种可能局面），是测试AI决策能力的理想场景。

　　虽然有网友会产生误读，认为它是“越大越优”，但实际上，这个数字已经远超穷举法的适用范畴。

　　前些时间，陶哲轩在Lex访谈中提到：有些数学问题无法直接通过暴力计算来解决。例如国际象棋排列的数量，我们至今无法用计算机完全解决，但我们现在有AI，它们不会探索博弈树中的每个位置，而是寻求近似值。

　　这位网友表示，在传统AI中，模型实力源于领域特定训练模（为任务量身定制）；而在前沿AI中，模型实力源于一致性泛化（进化出能够映射到一切事物的内部世界结构）。国际象棋只是其中一种投射。

　　也有网友对AI的下一个竞技游戏进行了预测：或许会是UNO？（当然是开玩笑）

　　在Kaggle AI象棋竞赛正式开始之前，有网友在Manifold上发起了一个投票：谁会是这场AI象棋竞赛的最终胜者？

　　本文为澎湃号作者或机构在澎湃新闻上传并发布，仅代表该作者或机构观点，不代表澎湃新闻的观点或立场，澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问。