——原生ANN引擎,QPS飆升數(shù)十倍,成本新低,開發(fā)體驗(yàn)「真香」!
開通入口>> https://www.aliyun.com/product/es/es-serverless
隨著生成式AI與實(shí)時(shí)數(shù)據(jù)分析需求激增,開發(fā)者亟需兼顧高性能、低成本且免運(yùn)維的檢索服務(wù)。阿里云 Elasticsearch Serverless 基于官方8.17版本,深度融合無(wú)服務(wù)器架構(gòu)與分層擴(kuò)展能力,面向信息檢索、向量搜索、語(yǔ)義分析等通用場(chǎng)景,提供全托管服務(wù)。
一、Serverless服務(wù)簡(jiǎn)介
阿里云 Elasticsearch Serverless 采用讀寫分離架構(gòu)與智能資源調(diào)度策略,自動(dòng)監(jiān)控 CPU、內(nèi)存、網(wǎng)絡(luò)等關(guān)鍵指標(biāo),動(dòng)態(tài)調(diào)整計(jì)算資源,消除手動(dòng)擴(kuò)縮容與集群配置負(fù)擔(dān),是企業(yè)輕量化搭建搜索應(yīng)用的高性價(jià)比選擇。
與2024年7月發(fā)布的檢索通用型7.10版本相比,本次推出的檢索增強(qiáng)型8.17版本在最新特性擴(kuò)展、自動(dòng)擴(kuò)縮性能、資源成本優(yōu)化三大維度實(shí)現(xiàn)全面躍升。本文將深度解析該版本通過(guò)工程優(yōu)化帶來(lái)的核心能力升級(jí)。
升級(jí)一:向量檢索性能飛躍
基于 Elasticsearch 8.17 版,發(fā)布最新向量能力,實(shí)現(xiàn)檢索性能、開發(fā)體驗(yàn)的跨越式升級(jí)
· 高效 KNN 檢索:相較于7.10版依賴 script_score 自定義腳本進(jìn)行暴力檢索,8.17版原生支持高效的 KNN 檢索,查詢速度實(shí)現(xiàn)了質(zhì)的飛躍。
· 資源優(yōu)化:在高召回的同時(shí),默認(rèn)int8量化能力將內(nèi)存占用降低75%,bbq 量化進(jìn)一步降低資源消耗。同等資源下,百萬(wàn)級(jí)向量檢索 QPS 提升數(shù)十倍。
· 靈活組合查詢:8.17版原生支持 knn 向量查詢與傳統(tǒng) query 子句的靈活組合,并結(jié)合 RRF(Reciprocal Rank Fusion)實(shí)現(xiàn)多元召回結(jié)果的智能融合與統(tǒng)一排名,顯著提升復(fù)雜場(chǎng)景下的搜索相關(guān)性與用戶體驗(yàn)。
升級(jí)二:智能化彈性調(diào)度架構(gòu)
全面升級(jí)智能化彈性調(diào)度架構(gòu),保障服務(wù)穩(wěn)定的同時(shí)1秒內(nèi)資源拓展到位,擴(kuò)縮更絲滑
ES Serverless 服務(wù)底層采用彈性架構(gòu),基于應(yīng)用 CU 等水位觀測(cè),高效調(diào)度底層機(jī)器資源,實(shí)現(xiàn)低成本承接高用量的業(yè)務(wù)效果。相比檢索通用型(7.10版)應(yīng)用,檢索增強(qiáng)型(8.17版)不但大幅縮短了彈性響應(yīng)時(shí)效,同時(shí)放開了低峰期突增流量限流的限制。
· A場(chǎng)景-流量逐漸穩(wěn)定增長(zhǎng):8.17版能夠瞬時(shí)響應(yīng)并正常承接增加的用戶請(qǐng)求量,幾乎沒有觸發(fā)限流;整體 RT 平穩(wěn)度和耗時(shí)更有優(yōu)勢(shì),擴(kuò)容期間服務(wù)穩(wěn)定、性能有保障。
· B場(chǎng)景-流量瞬時(shí)突增:8.17版能夠穩(wěn)定承接流量突增,而7.10版需要一定時(shí)間緩沖,初期成功率較低。8.17版在整體RT平穩(wěn)度、穩(wěn)定性與無(wú)感擴(kuò)容體驗(yàn)上更優(yōu)。
如下圖,某真實(shí)電商網(wǎng)站在下午 18:00-21:00時(shí)間段開展品類大促活動(dòng),搜索流量能達(dá)到平時(shí)的3倍,并且會(huì)有突增 6 倍的秒殺活動(dòng),本文將模擬【A場(chǎng)景-流量逐漸穩(wěn)定增長(zhǎng)】與【B場(chǎng)景-流量瞬時(shí)突增】?jī)煞N不同趨勢(shì),對(duì)比分析檢索通用型(7.10版)應(yīng)用與檢索增強(qiáng)型(8.17版)應(yīng)用的體驗(yàn)差異(下文簡(jiǎn)稱為7.10應(yīng)用、8.17應(yīng)用)。
A-場(chǎng)景流量逐漸穩(wěn)定增長(zhǎng):三小時(shí)流量分別是一小時(shí)穩(wěn)定增流,一小時(shí)穩(wěn)定高峰,一小時(shí)穩(wěn)定減流。其中高峰為低峰的 3 倍流量。
· 7.10 應(yīng)用受限于彈性機(jī)制的限制。在啟動(dòng)增壓時(shí),若增壓過(guò)程較快(如上),會(huì)出現(xiàn)因彈性反應(yīng)時(shí)間過(guò)長(zhǎng)導(dǎo)致的限流;
· 8.17 應(yīng)用完成了瞬時(shí)響應(yīng),正常承接了增加的用戶請(qǐng)求量,沒有觸發(fā)限流。具體可見:失敗請(qǐng)求數(shù)統(tǒng)計(jì)圖表。
· 8.17 應(yīng)用較 7.10 應(yīng)用在整體 RT 平穩(wěn)度、RT 耗時(shí)上都更有優(yōu)勢(shì),可見流量增長(zhǎng)過(guò)程中 8.17 的 RT/took 都很穩(wěn)定。具體可見:平均 RT 統(tǒng)計(jì)圖表。
· 8.17 應(yīng)用與 7.10 應(yīng)用均表現(xiàn)出優(yōu)秀的穩(wěn)定性體驗(yàn),8.17應(yīng)用擴(kuò)容更加無(wú)感、幾乎未出現(xiàn)重試操作。具體可見:成功率、重試率統(tǒng)計(jì)圖表。
· 在 CU 統(tǒng)計(jì)上,8.17 應(yīng)用更線性更穩(wěn)定;7.10 應(yīng)用在初期彈性和高峰期會(huì)有波動(dòng)。具體可見:消耗CU、應(yīng)用請(qǐng)求 QPS、總請(qǐng)求數(shù)統(tǒng)計(jì)圖表。
B場(chǎng)景-流量瞬時(shí)突增:低峰期流量突增 6 倍場(chǎng)景
· 8.17 應(yīng)用能夠穩(wěn)定承接流量突增;較「A-流量逐漸穩(wěn)定增長(zhǎng)」, 該 case 更可見 7.10 應(yīng)用受限于彈性機(jī)制的限制需要一定的時(shí)間緩沖。在剛突增時(shí),成功率維持在 42%左右,7 分鐘后恢復(fù)至 95%以上;下一區(qū)間的七分鐘后整體恢復(fù)。具體可見:消耗 CU、應(yīng)用請(qǐng)求 QPS、總請(qǐng)求數(shù)統(tǒng)計(jì)圖表。
Tips:使用8.17應(yīng)用時(shí),需保證突增后的流量在 CU 上限以下,CU上限默認(rèn)取值為固定CU額度的3倍,可根據(jù)流量情況選擇合適的固定CU額度配置。7.10應(yīng)用在突增初期 QPS 更高是因?yàn)榭蛻舳酥卦嚈C(jī)制在限流時(shí)觸發(fā)了重試,在彈性完成后恢復(fù)正常。
· 8.17 應(yīng)用較 7.10 應(yīng)用在整體 RT 平穩(wěn)度、RT 耗時(shí)上都更有優(yōu)勢(shì),可見流量增長(zhǎng)過(guò)程中 8.17 的 RT/took 都很穩(wěn)定。具體可見:平均 RT 統(tǒng)計(jì)圖表。
· 8.17 應(yīng)用較 7.10 應(yīng)用在穩(wěn)定性與無(wú)感擴(kuò)容體驗(yàn)更優(yōu),始終保持更優(yōu)的成功率與重試率。具體可見:成功率、重試率統(tǒng)計(jì)圖表。
· 在 CU 統(tǒng)計(jì)上,8.17 應(yīng)用由于完成了秒級(jí)響應(yīng),貼合實(shí)際應(yīng)用請(qǐng)求 QPS 調(diào)度資源;7.10 應(yīng)用也根據(jù)實(shí)際調(diào)度情況統(tǒng)計(jì)出計(jì)量 CU,但在初期彈性和高峰期會(huì)有波動(dòng),8.17 應(yīng)用更線性更穩(wěn)定。具體可見:消耗 CU、應(yīng)用請(qǐng)求 QPS、總請(qǐng)求數(shù)統(tǒng)計(jì)圖表。
Tips:如果您已經(jīng)使用了7.10應(yīng)用,因版本或排期限制暫無(wú)計(jì)劃使用8.17應(yīng)用,針對(duì)周期性流量場(chǎng)景,您可通過(guò)工單形式提交分時(shí)彈性需求,為您的應(yīng)用開啟分時(shí)彈性功能后,將追平8.17應(yīng)用的彈性響應(yīng)效果。
最終對(duì)比結(jié)論:綜上所述,8.17 應(yīng)用彈性擴(kuò)容性能提升明顯,可做到無(wú)感升配,能有效承接突增、平穩(wěn)趨勢(shì)下的流量增長(zhǎng),提供流暢、穩(wěn)定的服務(wù)體驗(yàn)。
升級(jí)三:資源成本優(yōu)化
通過(guò)預(yù)留+彈性 CU 模式靈活調(diào)度資源,CU 單價(jià)再調(diào)低,資源成本再優(yōu)化
為進(jìn)一步優(yōu)化資源成本,提升資源擴(kuò)縮體驗(yàn)。檢索通用型8.17版采用了預(yù)留固定 CU 配額+按需使用的彈性 CU 用量收費(fèi)的模式,預(yù)留固定 CU 的單價(jià)調(diào)整至更低。
綜上所述,阿里云 Elasticsearch Serverless 8.17 版在向量檢索性能、智能化彈性調(diào)度架構(gòu)及資源成本優(yōu)化方面實(shí)現(xiàn)了全面升級(jí),為開發(fā)者提供了高性能、低成本且免運(yùn)維的檢索服務(wù)解決方案。
二、使用指南
公測(cè)說(shuō)明
檢索增強(qiáng)型應(yīng)用(8.17版)_檢索分析服務(wù) Elasticsearch版(ES)-阿里云幫助中心
檢索增強(qiáng)型應(yīng)用(8.17版)于2025年4月25日起已陸續(xù)在華東2(上海)、華北2(北京)、華南1(深圳)、華東1(杭州)地域開啟公測(cè),在此期間,您無(wú)需申請(qǐng)即可免費(fèi)試用。預(yù)計(jì)公測(cè)將于2025年6月16日結(jié)束,屆時(shí),使用服務(wù)將按照相關(guān)計(jì)費(fèi)項(xiàng)收取相應(yīng)費(fèi)用。
三、開通檢索增強(qiáng)型應(yīng)用(8.17版)
步驟一、開通服務(wù)
第一次使用ES Serverless服務(wù)時(shí),需要進(jìn)行服務(wù)開通。
1. 登錄Elasticsearch Serverless服務(wù)控制臺(tái)。
2. 在ES Serverless服務(wù)頁(yè)面,單擊立即開通。
3. 進(jìn)入服務(wù)開通頁(yè)面,選中服務(wù)協(xié)議,單擊立即開通。
步驟二、創(chuàng)建應(yīng)用
1. 進(jìn)入創(chuàng)建Serverless應(yīng)用的頁(yè)面,選擇創(chuàng)建實(shí)例的區(qū)域。
3. 進(jìn)入應(yīng)用管理頁(yè)面,單擊創(chuàng)建應(yīng)用,配置應(yīng)用的基本信息。
(示例)本示例選擇應(yīng)用選型為檢索增強(qiáng)型(8.17版),其他參數(shù)保持默認(rèn)或自定義。
a. (示例)本示例選擇網(wǎng)絡(luò)訪問方式為公網(wǎng)訪問,在公網(wǎng)訪問白名單中添加本地設(shè)備的IP地址,以便使用本地設(shè)備訪問Serverless應(yīng)用的Kibana。
配置應(yīng)用公網(wǎng)訪問或私網(wǎng)訪問,請(qǐng)參見配置Serverless應(yīng)用公網(wǎng)或私網(wǎng)訪問。
您可以在應(yīng)用管理頁(yè)面查看已創(chuàng)建的應(yīng)用列表。請(qǐng)等待應(yīng)用狀態(tài)變?yōu)檫\(yùn)行中,這表示應(yīng)用已成功創(chuàng)建。隨后,您可以根據(jù)個(gè)人需求,嘗試體驗(yàn)更多功能。
星空人工智能技術(shù)網(wǎng) 倡導(dǎo)尊重與保護(hù)知識(shí)產(chǎn)權(quán)。如發(fā)現(xiàn)本站文章存在版權(quán)等問題,煩請(qǐng)30天內(nèi)提供版權(quán)疑問、身份證明、版權(quán)證明、聯(lián)系方式等發(fā)郵件至1851688011@qq.com我們將及時(shí)溝通與處理。?。?a href="/">首頁(yè) > 星空人工智能產(chǎn)業(yè) > VR|虛擬現(xiàn)實(shí) » ES Serverless 8.17王牌發(fā)布:向量檢索「火力全開」,智能擴(kuò)縮「秒級(jí)響應(yīng)」!










