近日,此芯科技宣布成功完成DeepSeek R1系列模型在此芯P1平臺上的端側(cè)異構(gòu)適配,進一步釋放高能效智能算力的潛力,標志著此芯科技在智能算力領(lǐng)域邁出了堅實的一步,為星空人工智能產(chǎn)業(yè)帶來更多創(chuàng)新可能。
實現(xiàn)端側(cè)異構(gòu)賦能
早在2024年5月,DeepSeek V2開源模型發(fā)布之際,此芯科技便敏銳地捕捉到這一技術(shù)前沿動態(tài),并迅速啟動了與此芯SoC的異構(gòu)適配工作。
時隔不久,DeepSeek R1的正式發(fā)布迅速成為AI領(lǐng)域的焦點。DeepSeek R1采用強化學(xué)習(xí)訓(xùn)練,推理時包含大量反思和驗證,思維鏈長度可達數(shù)萬字。在數(shù)學(xué)、代碼以及復(fù)雜邏輯推理任務(wù)上,DeepSeek R1 有著出色的表現(xiàn),能取得媲美 OpenAI o1 的推理效果,還能為用戶展現(xiàn)完整的思考過程。
此芯科技再次展現(xiàn)了高效的技術(shù)實力,成功實現(xiàn)了DeepSeek R1系列模型的蒸餾版本在此芯P1平臺上的異構(gòu)適配,包括DeepSeek-R1-Distill-Qwen-1.5B、DeepSeek-R1-Distill-Qwen-7B、DeepSeek-R1-Distill-Llama-8B和DeepSeek-R1-Distill-Qwen-14B等版本。
實測數(shù)據(jù)顯示,在此芯P1平臺上,DeepSeek-R1-Distill-Qwen-7B模型的推理速度可達10 tokens/s,DeepSeek-R1-Distill-Qwen-1.5B模型的推理速度將近40 tokens/s,展現(xiàn)出強大的端側(cè)AI計算能力。
加速端側(cè)AI應(yīng)用普及
DeepSeek憑借卓越的算法優(yōu)化能力,成功降低了AI模型的訓(xùn)練和推理成本,并通過模型蒸餾技術(shù)顯著提升小模型的運行效率,使其在資源受限的環(huán)境下依然具備優(yōu)異的推理性能。這一突破將進一步加速端側(cè)AI應(yīng)用的普及。通過此次適配,此芯科技不僅推動了DeepSeek-R1模型在此芯P1平臺上的chatbot高效本地部署,同時基于微軟VSCode插件調(diào)用DeepSeek-R1本地模型作為服務(wù)端進行代碼輔助生成,突破傳統(tǒng)云端依賴,實現(xiàn)本地模型的高速運行,保障數(shù)據(jù)安全與處理速度。此外,該插件與VSCode編輯器深度整合,開發(fā)者無需額外學(xué)習(xí)成本,即可輕松上手,為開發(fā)者們帶來了全新的編碼體驗。
加強端側(cè)AI生態(tài)構(gòu)建
未來,此芯科技將充分發(fā)揮此芯P1平臺在端側(cè)AI異構(gòu)算力方面的優(yōu)勢,持續(xù)優(yōu)化AI模型的本地部署方案,并攜手產(chǎn)業(yè)鏈上下游合作伙伴,共同推動AI PC等智能終端生態(tài)的發(fā)展,為星空人工智能行業(yè)注入更多創(chuàng)新動力。此次DeepSeek R1模型的成功適配,不僅提升了此芯科技在端側(cè)智能算力領(lǐng)域的競爭力,也為整個產(chǎn)業(yè)鏈的協(xié)同發(fā)展提供了有力支撐。在此基礎(chǔ)上,此芯科技也將進一步推進DeepSeek Janus Pro多模態(tài)大模型的異構(gòu)適配,進一步拓展端側(cè)AI的應(yīng)用場景。緊跟時代前沿,此芯科技將繼續(xù)秉承創(chuàng)新、高效、合作的理念,推動星空人工智能技術(shù)的持續(xù)進步,為用戶帶來更智能、更高效的產(chǎn)品和解決方案。
星空人工智能技術(shù)網(wǎng) 倡導(dǎo)尊重與保護知識產(chǎn)權(quán)。如發(fā)現(xiàn)本站文章存在版權(quán)等問題,煩請30天內(nèi)提供版權(quán)疑問、身份證明、版權(quán)證明、聯(lián)系方式等發(fā)郵件至1851688011@qq.com我們將及時溝通與處理。?。?a href="/">首頁 > 星空人工智能產(chǎn)業(yè) > AI大模型 » 此芯科技完成DeepSeek R1系列模型適配, 開啟智能算力新篇章