欧美亚洲丝袜传媒另类_日韩在线免费视频_国内一区在线_亚洲一区二区三区日本久久九

新版DeepSeek-R1模型上線,實測用它做一個端午節賽龍舟小游戲快訊

TechWeb.com.cn 2025-05-29 13:52
分享到:
導讀

比如有論文撰寫用戶在使用時就發現升級后的DeepSeek R1模型的AI幻覺的問題仍然不容樂觀,有用戶在使用升級后的DeepSeek R1時發現,升級后的DeepSeek R1模型經常能直接一次生成可運行、可落地的代碼。

【TechWeb】5月29日消息,昨日晚間DeepSeek在官方交流群中突發通知:DeepSeek R1模型已完成小版本試升級,歡迎前往官方網頁、App、小程序測試(打開深度思考),API接口和使用方式保持不變。

目前,DeepSeek團隊在開發者平臺 Hugging Face 上發布了該模型的更新版本(DeepSeek-R1-0528),更新后的 R1達685B參數,之前是671B。Hugging Face 存儲庫不包含模型的描述,僅包含配置文件和權重,即指導其行為的模型內部組件。


 

截至目前,DeepSeek官方此次并沒有公布版本更新的具體內容。

DeepSeek APP新版的更新介紹也只是提到:修復部分已知問題。

DeepSeek R1模型升級后,吸引眾多用戶第一時間體驗。看看大家的第一波實測效果。

代碼能力一流,可用性高

據不少用戶反饋,DeepSeek升級后的模型,思維鏈 (CoT) 的行為似乎發生了顯著變化,能進行30-60分鐘的長時間思考,響應更敏捷。代碼能力顯著提高直接沖進了國際一線梯隊。

有用戶稱,升級后的DeepSeek R1模型經常能直接一次生成可運行、可落地的代碼,不僅能跑通,而且代碼結構清晰、注釋也很完整,甚至有點 Claude 4 的味道。

相對Claude模型,DeepSeek R1調用成本只要 1/3,對中小開發者更友好。使用DeepSeek R1也不用翻墻,本地服務器響應穩定,不再折騰網絡配置。

有網友用升級后的DeepSeek R1測試制作之前 Claude 才能搞定的天氣卡片,完美完成任務。

有用戶使用新版DeepSeek R1設計的世界時鐘面板:

TechWeb也第一時間試用了升級后的DeepSeek R1模型,端午節快到了,請它幫忙設計一個“端午節賽龍舟小游戲”。它2分鐘就完成了。

2人在電腦上控制A和L鍵就能玩這個龍舟比賽了。

TechWeb又讓升級后的DeepSeek R1設計一個微信風格的聊天應用。它用了3分鐘寫好了這段代碼,并提供了運行界面,生成效果如圖,大家覺得怎么樣。

寫作還需注意幻覺問題

新版DeepSeek R1的深度思考能力和寫作能力還是還是一如既往的強。

讓它寫一首藏尾詩,它還注意到了“平仄”問題。

不過寫作也還有一些顯著問題,比如有論文撰寫用戶在使用時就發現升級后的DeepSeek R1模型的AI幻覺的問題仍然不容樂觀。

有用戶在使用升級后的DeepSeek R1時發現,

如上,在打開聯網搜索,基于真實材料分析的前提下,雖然標注了引用源,但依舊捏造數據。

如上,用戶發現:“信息源5明確標注論文發表于2024年,但在信息整理過程中卻被錯誤標注為‘2025年’。這很可能由于提示詞進行了明確限定,AI因此傾向于‘諂媚’,即使與參考資料相悖。”

看來,這一波先解放的是程序員了,碼字人員還是要注意仔細核查AI生成的內容,謹防AI一本正經的胡說八道。

 

DeepSeek 模型 升級 用戶 使用
分享到:

1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。