开云体育

开云体育战报:马斯克Grok4笑傲AI象棋大赛DeepSeek没干过o4-miniKimi K2被喊冤

2025-08-10
浏览次数:
返回列表

  开云体育[永久网址:363050.com]成立于2022年在中国,是华人市场最大的线上娱乐服务供应商而且是亚洲最大的在线娱乐博彩公司之一。包括开云、开云棋牌、开云彩票、开云电竞、开云电子、全球各地赛事、动画直播、视频直播等服务。开云体育,开云体育官方,开云app下载,开云体育靠谱吗,开云官网,欢迎注册体验!

开云体育战报:马斯克Grok4笑傲AI象棋大赛DeepSeek没干过o4-miniKimi K2被喊冤

  最新战报最新战报:首届AI国际象棋对战……马斯克家的Grok 4“遥遥领先”了。

  眼见自家Grok 4表现出色,马斯克当然不会错过PR良机,不过回应略显凡尔赛:

  当然,让AI对战国际象棋,过程比输赢重要多了,毕竟谷歌发起这次比赛的初衷,就是测试“涌现”能力。

  本次比赛由谷歌发布,作为推广Kaggle游戏竞技场的一个环节。首次比赛以国际象棋开始。

  除了各个顶级模型的象棋对决,直播还邀请了国际象棋特技大师中村光(Hikaru Nakamura)作为讲解。

  他于7岁那年开始学习国际象棋,到15岁时成为全美国际象棋冠军并拿到GM头衔,也是本届EWC国际象棋(迄今为止规模最大的国际象棋锦标赛)的季军。

  并且,所有在八分之一决赛中的比赛都以完美的4-0结束。实力差距非常明显。

  网友们分析了这次赛况,表示Grok 4在这次基准测试中“在战术策略和速度上超越了所有其他模型”。

  Grok4如同猛兽, 它轻松的表现就像“真正的GM”一样下棋,成为当天最佳。

  R1提供的推理虽然自信却错误,而且对棋盘局势的缺乏洞察导致它留下了棋子给o4-mini率先拿走。

  这场Gemini 2.5 Pro和Claude Opus 4的对阵是当天最佳对局,两个模型都展示了高水平的棋艺。

  Claude出现一些失误,而Gemini Pro展现了强大的战术视野,但给出的分析有时过于冗长。

  这是最快的四分之一决赛,Kimi K2被“碾压”,主要是因为它反复坚持走非法棋步,o3以弃权获胜,没有太多值得分析的表现。

  不过也有人替Kimi鸣不平:因为Kimi不是推理模型,长思考才能有更好的性能,步骤越往后,越需要长思考。

  这么说吧,国际象棋规则明确但复杂度高(10^120种可能局面),是测试AI决策能力的理想场景。

  虽然有网友会产生误读,认为它是“越大越优”,但实际上,这个数字已经远超穷举法的适用范畴。

  前些时间,陶哲轩在Lex访谈中提到:有些数学问题无法直接通过暴力计算来解决。例如国际象棋排列的数量,我们至今无法用计算机完全解决,但我们现在有AI,它们不会探索博弈树中的每个位置,而是寻求近似值。

  这位网友表示,在传统AI中,模型实力源于领域特定训练模(为任务量身定制);而在前沿AI中,模型实力源于一致性泛化(进化出能够映射到一切事物的内部世界结构)。国际象棋只是其中一种投射。

  也有网友对AI的下一个竞技游戏进行了预测:或许会是UNO?(当然是开玩笑)

  在Kaggle AI象棋竞赛正式开始之前,有网友在Manifold上发起了一个投票:谁会是这场AI象棋竞赛的最终胜者?

  本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问。

搜索