开云体育
开云APP下载深度求索发布DeepSeek-V32-Exp模型 国产芯片厂商争相适配
9月29日,深度求索公司发布DeepSeek-V3.2-Exp模型,该版本实验性引入DeepSeek Sparse Attention稀疏注意力机制,显著降低计算资源消耗并提升推理效率。官方App、网页端、小程序同步更新,API价格全面下调50%-75%。
新版模型发布后,寒武纪、华为昇腾、海光等国产芯片厂商迅速宣布适配。寒武纪开源大模型推理引擎vLLM-MLU源代码,华为昇腾实现0day支持并开源推理代码,海光DCU展现优异性能。
业内人士认为,DeepSeek已成为国产开源模型标杆,有望定义国产芯片标准。相比英伟达二十年建立的生态,DeepSeek用不到一年时间完成初步追赶。国产AI软硬件生态协同效应正在扩大,腾讯、阿里等云厂商也在积极适配国产芯片。
此次更新在V3.1-Terminus基础上优化长文本训练和推理效率,采用疑似原创的稀疏注意力机制。模型兼容CUDA同时使用TileLang语言进行开发,该语言由北大团队主导开发。