开云体育
新版DeepSeek-R1模型上线实测用它开云体育官方做一个端午节赛龙舟小游戏
DeepSeek R1模型完成小版本试升级,参数从671B增加到685B,代码能力和可用性显著提高。
2.升级后的DeepSeek R1模型能进行30-60分钟的长时间思考,响应更敏捷,代码结构清晰且注释完整。
3.然而,升级后的DeepSeek R1模型在写作方面仍存在幻觉问题,需要用户仔细核查AI生成的内容。
4.有用户发现,升级后的DeepSeek R1模型在联网搜索时仍可能出现捏造数据的情况。
模型已完成小版本试升级,欢迎前往官方网页、App、小程序测试(打开深度思考),API接口和使用方式保持不变。
目前,DeepSeek团队在开发者平台 Hugging Face 上发布了该模型的更新版本(DeepSeek-R1-0528),更新后的 R1达685B参数,之前是671B。Hugging Face 存储库不包含模型的描述,仅包含配置文件和权重,即指导其行为的模型内部组件。
DeepSeek R1模型升级后,吸引众多用户第一时间体验。看看大家的第一波实测效果。
据不少用户反馈,DeepSeek升级后的模型,思维链 (CoT) 的行为似乎发生了显著变化,能进行30-60分钟的长时间思考,响应更敏捷。代码能力显著提高直接冲进了国际一线梯队。
有用户称,升级后的DeepSeek R1模型经常能直接一次生成可运行、可落地的代码,不仅能跑通,而且代码结构清晰、注释也很完整,甚至有点 Claude 4 的味道。
相对Claude模型,DeepSeek R1调用成本只要 1/3,对中小开发者更友好。使用DeepSeek R1也不用翻墙,本地服务器响应稳定,不再折腾网络配置。
有网友用升级后的DeepSeek R1测试制作之前 Claude 才能搞定的天气卡片,完美完成任务。
TechWeb也第一时间试用了升级后的DeepSeek R1模型,端午节快到了,请它帮忙设计一个“端午节赛龙舟小游戏”。它2分钟就完成了。
TechWeb又让升级后的DeepSeek R1设计一个微信风格的聊天应用。它用了3分钟写好了这段代码,并提供了运行界面,生成效果如图,大家觉得怎么样。
不过写作也还有一些显著问题,比如有论文撰写用户在使用时就发现升级后的DeepSeek R1模型的AI幻觉的问题仍然不容乐观。
如上,在打开联网搜索,基于真实材料分析的前提下,虽然标注了引用源,但依旧捏造数据。
如上,用户发现:“信息源5明确标注论文发表于2024年,但在信息整理过程中却被错误标注为‘2025年’。这很可能由于提示词进行了明确限定,AI因此倾向于‘谄媚’,即使与参考资料相悖。”
看来,这一波先解放的是程序员了,码字人员还是要注意仔细核查AI生成的内容,谨防AI一本正经的胡说八道。