7月14日消息,近日,在"元腦中國行"全國巡展?jié)险旧希?/span>浪潮信息發(fā)布AIStation 星空人工智能開發(fā)平臺(tái)V5升級(jí)版,具備全面的大模型流程支持能力,幫助企業(yè)用戶降低構(gòu)建大模型微調(diào)任務(wù)門檻,提供標(biāo)準(zhǔn)、安全的大模型推理服務(wù),并針對(duì)大模型業(yè)務(wù)資源需求優(yōu)化了集群管理功能,助力行業(yè)客戶快速開展大模型業(yè)務(wù)創(chuàng)新與落地,獲得穩(wěn)定、高效、易用、高精度的大模型服務(wù)。

隨著大模型技術(shù)的迅猛發(fā)展與產(chǎn)業(yè)化進(jìn)程的加速,企業(yè)用戶在這一過程中遭遇了前所未有的挑戰(zhàn)。在微調(diào)大模型時(shí),復(fù)雜的環(huán)境算法配置、多樣的模型結(jié)構(gòu)適配和算力資源管理的難題,讓模型精度的提升變得困難重重。本地化、私有化大模型的部署過程中,也面臨著經(jīng)驗(yàn)不足、性能優(yōu)化瓶頸和算力資源利用不合理等棘手問題,如何在確保數(shù)據(jù)與業(yè)務(wù)隱私的同時(shí)構(gòu)建和使用本地化大模型應(yīng)用,成為了企業(yè)用戶亟需解決的難題。
面對(duì)這些挑戰(zhàn),AIStation V5版本以其全面升級(jí)的功能,為企業(yè)用戶帶來了端到端的大模型開發(fā)流程解決方案。新版本支持適配50+大模型結(jié)構(gòu),內(nèi)置10+微調(diào)數(shù)據(jù)集和20+可配置參數(shù)項(xiàng),提供了低代碼大模型微調(diào)能力。用戶只需一鍵提交任務(wù),即可實(shí)現(xiàn)任務(wù)的統(tǒng)一管理,輕松構(gòu)建大模型微調(diào)任務(wù)并優(yōu)化模型性能。針對(duì)大模型訓(xùn)練與微調(diào)過程中的算力資源占用高、訓(xùn)練穩(wěn)定性難保障的問題,AIStation V5升級(jí)了分布式任務(wù)一鍵配置能力,幫助用戶實(shí)現(xiàn)高效、穩(wěn)定的大模型微調(diào)。
在推理服務(wù)方面,AIStation V5集成了高性能推理服務(wù)框架,使得同等算力下的大模型批量推理服務(wù)承載量較原生部署方式提升1-3倍。通過對(duì)算力、服務(wù)、業(yè)務(wù)訪問的全方位治理以及多樣化的推理服務(wù)部署機(jī)制,AIStation V5能夠滿足不同場景下用戶自研模型的部署需求。用戶可以在大規(guī)模集群內(nèi)更加細(xì)粒度的分配調(diào)度算力,輕松部署和使用不同來源、不同結(jié)構(gòu)、不同規(guī)模的大模型推理服務(wù),就如同在本地部署單個(gè)大模型、傳統(tǒng)AI應(yīng)用與服務(wù)一般簡單。
星空人工智能技術(shù)網(wǎng) 倡導(dǎo)尊重與保護(hù)知識(shí)產(chǎn)權(quán)。如發(fā)現(xiàn)本站文章存在版權(quán)等問題,煩請(qǐng)30天內(nèi)提供版權(quán)疑問、身份證明、版權(quán)證明、聯(lián)系方式等發(fā)郵件至1851688011@qq.com我們將及時(shí)溝通與處理。!:首頁 > 星空人工智能產(chǎn)業(yè) > AI大模型 » 浪潮信息推出AIStation V5星空人工智能開發(fā)平臺(tái)升級(jí)版 具備全面大模型流程支持能力