Deepseek新模型意外曝光！编程跑分一举超越开云体育官方Claude 35 Sonnet

开云体育NEWS CENTER

您当前位置：首页 > 开云体育

2025-03-31

浏览次数：次

　　且在LiveBench测评中，它是当前最强开源LLM，并在非推理模型中仅次于gemini-exp-1206，排在第二。

　　目前Hugging Face上已经有了Deepseek-v3（Base）的开源权重，只不过还没上传模型介绍卡片。

　　综合网上多方爆料来看，Deepseek-v3相比前代v2、v2.5有了极大提升——

　　为了进一步了解Deepseek-v3的升级程度，机器学习爱好者Vaibhav (VB) Srivastav（以下简称瓦哥）还深入研究了配置文件，并总结出v3与v2、v2.5的关键区别。

　　第一，在MOE结构中，v3使用了sigmoid作为门控函数，取代了v2中的softmax函数。这允许模型在更大的专家集合上进行选择，而不像softmax函数倾向于将输入分配给少数几个专家。

　　第二，v3引入了一个新的Top-k选择方法noaux_tc，它不需要辅助损失。

　　简单理解，MoE模型通常需要一个辅助损失来帮助训练，主要用于更好地学习如何选择Top-k个最相关的专家来处理每个输入样本。

　　而新方法能在不依赖辅助损失的情况下，直接通过主要任务的损失函数来有效地选择Top-k个专家。这有助于简化训练过程并提高训练效率。

　　这是一种基于群体的专家选择算法，通过将专家划分为不同的小组，并在每个小组内部选择最优秀的k名专家。

　　第三，v3增加了一个新参数e_score_correction_bias，用于调整专家评分，从而在专家选择或模型训练过程中获得更好的性能。

　　此外，v3与v2.5（本月10日官宣开源）的比较也出炉了，后者主要支持联网搜索功能，相比v2全面提升了各项能力。

　　具体而言，v3在配置上超越了v2.5，包括更多的专家数量、更大的中间层尺寸，以及每个token的专家数量。

　　看完上述结果，瓦哥连连表示，明年有机会一定要见见中国的开源团队。(doge）

　　关于v3的实际表现，另一独立开发者Simon Willison（Web开发框架Django的创始人之一）也在第一时间上手测试了。

　　对了，在另一网友的测试中，Deepseek-v3也回答自己来自OpenAI？？

　　不过不管怎样，还未正式官宣的Deepseek-v3已在LiveBench坐上最强开源LLM宝座，在一些网友心中，这比只搞期货的OpenAI遥遥领先。(手动狗头）