先锋影音av资源,一本大道AV伊人久久综合,日本水蜜桃身体乳的美白效果,av网站有哪些

報告服務(wù)熱線400-068-7188

DeepSeek R1悄悄更新!用「小版本」干翻大模型

分享到:
20 直面派 ? 2025-05-29 18:04:29  來源:直面AI E5855G3

作者|涯角 來源|直面AI(ID:faceaibang)

雖然DeepSeek-R2并沒有像2個月之前盛傳的那樣,在5月甚至之前準(zhǔn)時赴約。但是,DeepSeek正在不斷地用小升級追趕其他廠商的大版本。

昨天DeepSeek官方的一則「R1已完成小版本試升級」的消息,在各個AI討論群里炸開了花。這回的DeepSeek-R1-0528版本在各個社區(qū)引發(fā)震動的最主要原因是:它真的不是一次小更新!

目前該升級版的DeepSeek-R1-0528已經(jīng)全量上線官方網(wǎng)頁、APP、小程序等等,API也已經(jīng)可以接入。

關(guān)于DeepSeek官方多么有誠意,我們已經(jīng)在V3版本的升級上看到了——模型性能大幅提升只是開胃小菜,成本價格比更是再度優(yōu)化。這回的更新也是一樣,新版本的DeepSeek-R1主要在編程能力上大幅提升。據(jù)一家LLM API接入網(wǎng)站OpenRouter,這回的新版本R1的輸入輸出價格幾乎與先前版本毫無變化!

在智能水平上,新版本DeepSeek-R1-0528在 Extended NYT Connections 基準(zhǔn)測試上相比原始 DeepSeek R1有了大幅提升:38.6 → 49.8。

01

它真的很難說是「小升級」

現(xiàn)在,全網(wǎng)都在瘋狂拿它跟全面替代AI coding真神的Claude 4對比,發(fā)現(xiàn):這倆模型竟然不相上下?甚至有一張在Livecodebench上DeepSeek-R1-0528與o3-high旗鼓相當(dāng)?shù)幕鶞?zhǔn)測試對比圖,在網(wǎng)上瘋傳。許多網(wǎng)友認(rèn)為這回更新后的DeepSeek-R1-0528在代碼生成等編程領(lǐng)域的實力已經(jīng)進入第一梯隊了。

我們搜集了全網(wǎng)最有趣的實測體驗,看看這回的DeepSeek-R1-0528到底將AI coding的能力拓展了多少:

有X網(wǎng)友@karminski3設(shè)置了一個「DeepSeek-R1-0528 VS Claude-4-sonnet」挑戰(zhàn)賽,用彈球撞擊墻面的效果作對比。

實測下來發(fā)現(xiàn):DeepSeek方的彈球看起來甚至還有光澤,撞碎墻面后的粒子效果幾乎能與Claude-4-sonnet一較高下,控制面板的美觀度也都非常在線。

值得一提的是,在這次的測試中,兩個大模型使用了同一個Prompt,DeepSeek-R1-0528 生成了728行,而Claude-4-sonnet生成了542行。

更新后的R1-0528在粒子效果的表現(xiàn)上尤其好。粒子效果通常會涉及復(fù)雜的動態(tài)動畫和物理模擬,像是物體運動、碰撞、光影變化等等。這足以說明R1-0528在生成復(fù)雜動態(tài)動畫能力上有了很大的突破。

X網(wǎng)友MILO,就做了個可交互的粒子動態(tài)動畫平臺,我們也進去體驗了下。我們注意到除了畫面中央的炫酷粒子爆炸外,右上角的粒子數(shù)計算也以一種很匹配的方式同步進行著。

在全棧網(wǎng)頁開發(fā)上,「小升級」之后的DeepSeek-R1-0528所表現(xiàn)出來的能力也有了很明顯的提升。

比如,X上有網(wǎng)友@DomLiu給 DeepSeek-R1-0528 一個全棧網(wǎng)頁開發(fā)Prompt,就能在幾秒鐘內(nèi)從零開始構(gòu)建了一個完整的應(yīng)用程序。

這段提示詞還非常的簡單:構(gòu)建一個 three.js 應(yīng)用程序,用于加載具有實時顏色/材質(zhì)/配件控制的 3D 模型。直觀的用戶界面。流暢的相機視角。

更為驚艷的是下面這個Case,同樣是這位網(wǎng)友,他幾乎將DeepSeek-R1玩出了花,這也證明小升級后的DeepSeek-R1-0528到底在編程能力上有多強。

簡單來說,他使用升級后的DeepSeek-R1做了一個3D畫廊,有這些功能:

程序化幾何生成,動態(tài)場景生成系統(tǒng),多彩動態(tài)光影效果,相機動畫與過渡,虛擬畫廊導(dǎo)航體驗。

有實際用過Trae、Cursor、Windsurf等一眾AI coding的朋友肯定都懂一個具有強大自主編程能力的基座大模型到底意味著什么?——編程效率的指數(shù)級提升。

3D藝術(shù)畫廊非常直觀地顯示了DeepSeek-R1-0528在面對復(fù)雜任務(wù)時的自主編程能力。

再比如一個3D 太陽系模擬器,在這個產(chǎn)品中,可以點擊任何行星獲取進一步的信息。同時畫面中呈現(xiàn)了極具真實感的軌道。它同樣使用 three.js 構(gòu)建,簡潔、快速、交互性強。

我們也實際上手測試了下,發(fā)現(xiàn)升級后的DeepSeek-R1-0528在面對非常簡單的提示詞時也能做出很快的反應(yīng),并自主地豐富功能。

比如,我只給了它一句:

生成一個蘋果官網(wǎng)風(fēng)格的前端網(wǎng)頁。

它只經(jīng)過14秒的思考,就輕松理清了蘋果官網(wǎng)風(fēng)格設(shè)計頁面的設(shè)計思路:

· 使用蘋果標(biāo)志性的深空灰/銀色調(diào)

· 大字體標(biāo)題和簡潔文案

· 高清產(chǎn)品圖像與漸變背景

· 懸浮動畫效果

· 響應(yīng)式布局

最主要的是,很短時間內(nèi)它就已經(jīng)生成了462行代碼,做出來的效果也與我所設(shè)想的非常相近:

除了純代碼能力之外,DeepSeek-R1-0528在前端審美上也有了很大的提升。

比如下面這個原生iOS風(fēng)格界面設(shè)計,采用了抹茶綠色主題,融合現(xiàn)代美學(xué),看起來搭配很流暢。

除了產(chǎn)品應(yīng)用UI風(fēng)格之外,DeepSeek-R1-0528在HTML網(wǎng)頁的前端網(wǎng)格上也有了很大的提升。

下面兩組新版本的介紹網(wǎng)頁中,深色是DeepSeek-R1-0528生成,在美觀度上更具科技感和視覺沖擊力,也非常符合AI大模型本來的調(diào)性;白色則是由Claude4生成:

02

思維鏈似乎改變了,出現(xiàn)了一些「副作用

這回DeepSeek-R1-0528的強勢開源,甚至讓各國網(wǎng)友都重溫了下今年年初R1發(fā)布時的情景。現(xiàn)在的DeepSeek-R1-0528已經(jīng)擁有了Claude系列的強自主編程能力,同時網(wǎng)友們在實際測試中也注意到它的思維鏈模式似乎發(fā)生了改變。

很多實測后的網(wǎng)友都發(fā)現(xiàn)這回的升級版DeepSeek-R1-0528的思考過程實在是太長了,很容易出現(xiàn)過度思考的現(xiàn)象。

比如,網(wǎng)友們發(fā)現(xiàn)了一個有趣的測試題:「估算一下π/7」,發(fā)現(xiàn)DeepSeek-R1-0528的思考推理過程有些太漫長了。

我們也實際測試了下,面對這樣的一個小問題,DeepSeek-R1-0528的深度思考時間達到了148秒。并且,其推理過程顯得冗余性很大。

DeepSeek-R1-0528在面對「估算一下π/7」這個問題時的思維鏈到底有多長,你可以直觀感受下:

雖然各國網(wǎng)友都直觀感受到了升級后的DeepSeek-R1-0528在推理能力上消耗的時間變得長了,但推理結(jié)果精度的提升也是顯而易見的。經(jīng)過優(yōu)化的DeepSeek-R1-0528在處理復(fù)雜問題時,已經(jīng)展現(xiàn)出了更強的邏輯分析能力和更細致的推理過程,這使得輸出的答案不僅更加準(zhǔn)確,還在深度和廣度上都有了顯著改進。

比如,X網(wǎng)友@baalatejakataru在實際編程過程中發(fā)現(xiàn)新的 DeepSeek-R1-0528想得太多,但是出錯時能夠快速地自我糾正,還能夠很好地寫新興系統(tǒng)編程語言——Zig,表現(xiàn)很不錯。

DeepSeek官方這回同樣延續(xù)了之前發(fā)布即開源的策略,R1-0528已經(jīng)正式開源。除了開源動作之外,更新后的R1仍然采用寬松的MIT許可證,意味著它可用于商業(yè)用途。

這次DeepSeek-R1-0528的升級,進一步印證了當(dāng)下大模型行業(yè)的趨勢:大版本固然令人期待,但持續(xù)穩(wěn)定的小步迭代同樣無法讓人裝作看不見。

雖然DeepSeek-R2尚未如期而至,也引發(fā)了全網(wǎng)對于這一版本的疑惑。但是通過強化編程能力、優(yōu)化前端審美,DeepSeek團隊持續(xù)的小步快跑,無疑讓業(yè)界重新審視小版本升級的巨大價值。盡管思維鏈的冗長帶來了一些「副作用」,但其帶來的精度提升和自我糾錯能力依然讓人無法忽視這次的版本升級。

在未來,DeepSeek-R1-0528的這種不改變大架構(gòu),而是通過「小升級、小迭代」就能達成明顯效果的方式可能將會成為主流,「大版本號盲目崇拜」已經(jīng)被破除。

下一次「小升級」,或許就是另一場風(fēng)暴的開始。

編者按:本文轉(zhuǎn)載自微信公眾號:直面AI(ID:faceaibang),作者:涯角 

本文來源直面AI,內(nèi)容僅代表作者本人觀點,不代表前瞻網(wǎng)的立場。本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。(若存在內(nèi)容、版權(quán)或其它問題,請聯(lián)系:service@qianzhan.com) 品牌合作與廣告投放請聯(lián)系:0755-33015062 或 hezuo@qianzhan.com

p50 q3 我要投稿

分享:
標(biāo)簽: DeepSeek R1 更新 大模型

品牌、內(nèi)容合作請點這里:尋求合作 ››

前瞻經(jīng)濟學(xué)人

專注于中國各行業(yè)市場分析、未來發(fā)展趨勢等。掃一掃立即關(guān)注。

前瞻產(chǎn)業(yè)研究院

中國產(chǎn)業(yè)咨詢領(lǐng)導(dǎo)者,專業(yè)提供產(chǎn)業(yè)規(guī)劃、產(chǎn)業(yè)申報、產(chǎn)業(yè)升級轉(zhuǎn)型、產(chǎn)業(yè)園區(qū)規(guī)劃、可行性報告等領(lǐng)域解決方案,掃一掃關(guān)注。

前瞻數(shù)據(jù)庫
企查貓
作者 直面派
自媒體
38381
關(guān)注
63
文章
0
前瞻經(jīng)濟學(xué)人App二維碼

掃一掃下載APP

與資深行業(yè)研究員/經(jīng)濟學(xué)家互動交流讓您成為更懂趨勢的人

研究員周關(guān)注榜

企查貓(企業(yè)查詢寶)App
×

掃一掃
下載《前瞻經(jīng)濟學(xué)人》APP提問

 
在線咨詢
×
在線咨詢

項目熱線 0755-33015070

AAPP
前瞻經(jīng)濟學(xué)人APP下載二維碼

下載前瞻經(jīng)濟學(xué)人APP

關(guān)注我們
前瞻產(chǎn)業(yè)研究院微信號

掃一掃關(guān)注我們

我要投稿

×
J
主站蜘蛛池模板: 三明市| 日照市| 南昌市| 南投县| 宜昌市| 蒙阴县| 崇明县| 万州区| 格尔木市| 平阳县| 洱源县| 沁水县| 全南县| 大港区| 棋牌| 平陆县| 安国市| 密云县| 齐齐哈尔市| 乐都县| 师宗县| 清镇市| 勃利县| 五原县| 同德县| 资溪县| 沙河市| 简阳市| 蚌埠市| 克拉玛依市| 阿图什市| 新津县| 临海市| 临夏县| 社旗县| 宣武区| 大田县| 剑阁县| 灯塔市| 筠连县| 河间市|