开云体育
DeepSeek V3-0324低调发布编码能力直追Claude 37 Sonnet开云体育官方
没有轰轰烈烈的宣传,也没有大张旗鼓的发布会,DeepSeek在3月24日晚间悄然推出了最新的V3-0324版本。目前这一版本已在HuggingFace开源,供用户免费下载和测试。虽然此次更新不能被称为代际跨越,却在多个方面显著提升,尤其是在代码能力上,V3-0324的表现实在令人刮目相看,直逼Claude 3.7 Sonnet。
这次的发布显得格外低调,几乎没有附加资料,开发者Awni Hannun在本地测试后,意外发现了这一更新,并将测试体验分享在X上。在他的512GB内存Mac Studio上,量化版本(搭配vLLM和mlc-llm)的推理速度超过20 tokens/s。他评论称:“这是我在笔记本上运行过的最强大模型。”尽管模型页面提供了配置文件和权重,但缺少正式的文档和性能评估,进一步彰显了此次发布的低调风格。
该模型也可以通过OpenRouter进行在线测试,用户可以直接与其互动。早期的测试者普遍反馈该版本在多个指标上有显著提升,AI研究员Xeophon在X上表示:“在我的内部基准测试中,新版DeepSeek V3在所有测试指标上都有巨大提升,并且成功取代了Sonnet 3.5,达到了最强的非推理类模型。”
值得注意的是,DeepSeek V3并非全新模型,而是基于DeepSeek V3架构(最早于2024年底推出)下的第一个开源权重检查点。这一发布使得这一架构正式对外开放,其内置的FP8量化支持则在内存效率与计算精度之间取得了良好的平衡。
作为一种Mixture-of-Experts (MoE)混合专家模型,尽管其总参数量高达6850亿,但在推理时仅活跃约370亿参数,大幅降低了硬件要求。此外,V3-0324引入了多头潜在注意力(MLA)以及多Token预测(MTP)等新技术,这些创新提升了模型在长距离依赖关系和生成速度上的表现。
在今年12月的首次测试中,DeepSeek系列便展现惊艳的基准测试成绩,上一版本在MATH-500测试得分90.2,远超GPT-4o的74.6; 在MGSM测试中得分也达到了79.8,编程基准测试HumanEval-Mul中更是与GPT-4o平起平坐。虽然这些数据并未直接反映V3-0324的性能,但仍然展示了DeepSeek V3构架的强大潜力。
与此同时,初将《一本书玩转DeepSeek》推出的AI大咖陈云飞,通过此书将DeepSeek的核心玩法以生动易懂的方式介绍给普通读者,这本书包含了13大场景和90个实用案例,旨在帮助读者快速掌握DeepSeek的使用技巧。如此看来,虽然DeepSeek的热度可能不会长期保持,但在这个技术不断进步的平台上,普通人依然可以通过不断学习,找到与AI共同创造的机会。返回搜狐,查看更多