新版DeepSeek-R1模型上线,实测用它做一个端午节赛龙舟小游戏
5月29日消息,昨日晚间DeepSeek在官方交流群中突发通知:DeepSeek R1模型已完成小版本试升级,欢迎前往官方网页、App、小程序测试(打开深度思考),API接口和使用方式保持不变。
目前,DeepSeek团队在开发者平台 Hugging Face 上发布了该模型的更新版本(DeepSeek-R1-0528),更新后的 R1达685B参数,之前是671B。Hugging Face 存储库不包含模型的描述,仅包含配置文件和权重,即指导其行为的模型内部组件。
截至目前,DeepSeek官方此次并没有公布版本更新的具体内容。
DeepSeek APP新版的更新介绍也只是提到:修复部分已知问题。
DeepSeek R1模型升级后,吸引众多用户第一时间体验。看看大家的第一波实测效果。
代码能力一流,可用性高
据不少用户反馈,DeepSeek升级后的模型,思维链 (CoT) 的行为似乎发生了显著变化,能进行30-60分钟的长时间思考,响应更敏捷。代码能力显著提高直接冲进了国际一线梯队。
有用户称,升级后的DeepSeek R1模型经常能直接一次生成可运行、可落地的代码,不仅能跑通,而且代码结构清晰、注释也很完整,甚至有点 Claude 4 的味道。
相对Claude模型,DeepSeek R1调用成本只要 1/3,对中小开发者更友好。使用DeepSeek R1也不用翻墙,本地服务器响应稳定,不再折腾网络配置。
有网友用升级后的DeepSeek R1测试制作之前 Claude 才能搞定的天气卡片,完美完成任务。
有用户使用新版DeepSeek R1设计的世界时钟面板:
TechWeb也第一时间试用了升级后的DeepSeek R1模型,端午节快到了,请它帮忙设计一个“端午节赛龙舟小游戏”。它2分钟就完成了。
2人在电脑上控制A和L键就能玩这个龙舟比赛了。
TechWeb又让升级后的DeepSeek R1设计一个微信风格的聊天应用。它用了3分钟写好了这段代码,并提供了运行界面,生成效果如图,大家觉得怎么样。
写作还需注意幻觉问题
新版DeepSeek R1的深度思考能力和写作能力还是还是一如既往的强。
让它写一首藏尾诗,它还注意到了“平仄”问题。
不过写作也还有一些显著问题,比如有论文撰写用户在使用时就发现升级后的DeepSeek R1模型的AI幻觉的问题仍然不容乐观。
有用户在使用升级后的DeepSeek R1时发现,
如上,在打开联网搜索,基于真实材料分析的前提下,虽然标注了引用源,但依旧捏造数据。
如上,用户发现:“信息源5明确标注论文发表于2024年,但在信息整理过程中却被错误标注为‘2025年’。这很可能由于提示词进行了明确限定,AI因此倾向于‘谄媚’,即使与参考资料相悖。”
看来,这一波先解放的是程序员了,码字人员还是要注意仔细核查AI生成的内容,谨防AI一本正经的胡说八道。