9月29日晚,DeepSeek-V3.2-Exp模型正式發(fā)布。優(yōu)刻得模型服務(wù)平臺UModelVerse極速完成接入,作為AI應(yīng)用開發(fā)者,無需關(guān)注底層算力資源調(diào)度、基礎(chǔ)環(huán)境的模型部署,UModelVerse控制臺全面覆蓋從模型訓(xùn)練到應(yīng)用上線的全流程,輕松實現(xiàn)業(yè)務(wù)模型的快速落地與迭代,歡迎登陸體驗!
UModelVerse控制臺模型廣場
官方表示DeepSeek-V3.2-Exp是一個實驗性(Experimental)的版本,是邁向新一代架構(gòu)的中間步驟。V3.2-Exp在V3.1-Terminus的基礎(chǔ)上引入了DeepSeek Sparse Attention(一種稀疏注意力機制),針對長文本的訓(xùn)練和推理效率進行了探索性的優(yōu)化和驗證。
稀疏注意力機制(DSA)
DeepSeek Sparse Attention(DSA)首次實現(xiàn)了細(xì)粒度稀疏注意力機制,在幾乎不影響模型輸出效果的前提下,實現(xiàn)了長文本訓(xùn)練和推理效率的大幅提升。
V3.1-Terminus和V3.2-Exp在BrowseComp和SWE Verified上的強化學(xué)習(xí)訓(xùn)練曲線,實線和虛線分別表示準(zhǔn)確率和平均輸出tokens
V3.1-Terminus和V3.2-Exp推理成本對比
與之前模型最大的不同在于,DSA不再要求每個Token關(guān)注序列中的所有其他Token,而是引入了一個名為「閃電索引器」(lightning indexer)的高效組件。這個索引器能以極快的速度判斷,對于當(dāng)前正在處理的Token,序列中哪些歷史Token是最重要的。隨后,模型僅從這些關(guān)鍵Token中篩選出少量(例如Top-k,取2048個)進行精細(xì)計算,從而在處理長文本時顯著提升效率。更重要的是,這種設(shè)計在實現(xiàn)效率飛躍的同時,并未犧牲模型的核心性能。
DeepSeek-V3.2-Exp的注意力架構(gòu)
根據(jù)官方公布的評測結(jié)果,在與前代模型V3.1-Terminus嚴(yán)格對齊的訓(xùn)練設(shè)置下,V3.2-Exp在各大公開基準(zhǔn)測試中的表現(xiàn)與前者基本持平。
V3.1-Terminus和V3.2-Exp在各基準(zhǔn)下測評對比
此外,為支持社區(qū)研究,DeepSeek還開源了新模型研究中設(shè)計和實現(xiàn)的GPU 算子,包括TileLang和CUDA兩種版本。官方團隊建議在進行研究性實驗時,優(yōu)先使用基于TileLang的版本,以便于調(diào)試和快速迭代。
得益于新模型服務(wù)成本的大幅降低,官方API價格也相應(yīng)下調(diào),新價格即刻生效。在新的價格政策下,開發(fā)者調(diào)用DeepSeek API的成本將降低50%以上。
登錄UModelVerse一鍵調(diào)用
步驟一:注冊并登錄UCloud云平臺
平臺地址:https://console.ucloud.cn/modelverse/model-center
步驟二:實名認(rèn)證
使用模型服務(wù)前用戶需要完成實名認(rèn)證。
步驟三:創(chuàng)建API Key
進入UModelVerse-API Key管理。
平臺地址:https://console.ucloud.cn/modelverse/experience/api-keys
點擊左上角創(chuàng)建一個Key,新用戶注冊免費50萬tokens。
步驟四:發(fā)送請求
星空人工智能技術(shù)網(wǎng) 倡導(dǎo)尊重與保護知識產(chǎn)權(quán)。如發(fā)現(xiàn)本站文章存在版權(quán)等問題,煩請30天內(nèi)提供版權(quán)疑問、身份證明、版權(quán)證明、聯(lián)系方式等發(fā)郵件至1851688011@qq.com我們將及時溝通與處理。?。?a href="/">首頁 > 大數(shù)據(jù) » 優(yōu)刻得搶先接入DeepSeek-V3.2-Exp