99热综合福利导航,久久66日韩,91一二区少妇,久久产国视频,日韩久久久五月精品八区,丰满狐狸精在线电影,一区婷婷久久,日韩欧美另类在线,欧美中文字幕区

星空人工智能技術網(wǎng)

AI如何更懂醫(yī)?看騰訊天衍實驗室智能醫(yī)療診斷技術創(chuàng)新

近年來,在互聯(lián)網(wǎng)技術和政策、疫情等大環(huán)境的推動下,在線問診需求正高速增長,自然語言處理(NLP)技術在該領域的研究成果和應用落地也越來越多。雖然,智能問診已經(jīng)能夠實現(xiàn)預診斷,但很多時候系統(tǒng)給出的診斷結果與現(xiàn)實情況大相徑庭。舉例來說,當我們能準確地給出“體溫38.5度、有點發(fā)熱、四肢無力”等癥狀時,系統(tǒng)會比較容易根據(jù)提供的信息進行詢問,給出如感冒、病毒感染等相對精準基礎診斷;但如果給出諸如“疲勞”,甚至“累”“沒勁”“胸痛”等含糊不清的主訴,智能診斷系統(tǒng)可能就無能為力了。
這是因為,目前計算機在文本理解的精度和深度上和人類仍然有很大的差距,特別是在醫(yī)學領域,不僅要求計算機學會龐大的專業(yè)術語,形成知識圖譜;更要能讀懂沒有專業(yè)知識的患者對于癥狀的模糊主訴,并將其與專業(yè)術語做關聯(lián)。
在此過程中,研究人員除了要給算法“投喂”龐大的專業(yè)語料和日常知識,提升算法能力,加強AI對真實世界的理解,還需要用更好的策略,選擇合適的模型,優(yōu)化醫(yī)療NLP領域目前面臨的問題,而這也是第二十屆中國計算語言學大會(下稱CCL2021)智能醫(yī)療對話診療評測——“智能化醫(yī)療診斷賽道”要解決的主要難點。
在此賽道中,騰訊天衍實驗室團隊提交的方案憑借較高的疾病預測準確率和癥狀召回率,成功獲得該賽道第一名,下面我們來看看這套方案是如何進行算法思考和模型選擇的。
圖片1.png
任務難點:讓算法迅速讀懂“患者”
“智能化醫(yī)療診斷”賽道的任務是:需要選手開發(fā)一個模擬實際問診過程的可交互程序,用程序與擁有超過2000組醫(yī)患對話樣本的病人模擬器“過招”:首先,要與主辦方提供的baseline模型交手,判斷出“患者”的初始癥狀;然后,還要根據(jù)這些信息,輸出能夠進一步獲取有效信息的問題,對“患者” 進行接下來的癥狀詢問;最終,在不超過11次的交互過程中,識別出“患者”的疾病和癥狀。比賽結果也是以診斷準確率和癥狀召回率來確定。
其中的難點是,2000組的對話樣本,每個都包含著大量數(shù)據(jù)信息:疾病類別、病人自訴文本、直接信息(病人自訴中明確提及的實體信息、癥狀),甚至隱藏信息(需要結合整段醫(yī)患對話得到實體及標簽,判斷患者是否已經(jīng)有該癥狀)。并且,與現(xiàn)實世界病人一樣,機器“患者”不會一次性把癥狀表述清楚,比如出現(xiàn)一種癥狀多種描述等主訴表達。
選手開發(fā)的算法和對應算法選擇的模型,不僅要能“讀懂”被“模糊描述”的癥狀,并迅速將癥狀分類;還要根據(jù)當前詢問到的病人信息,準確判斷出“患者”還可能具備什么癥狀,以便在有限的問診交互環(huán)節(jié)中,增加“患者”有效信息輸出,從而最大可能提升疾病診斷準確率以及癥狀召回率。
因此,該任務不僅考驗算法能力,更同時考驗算法和模型的搭配策略,以提升程序問診的準確性和效率。
方案對策:更高效的算法+更合適的模型 提升推理速度
為了讓AI更加理解“患者”信息,騰訊天衍實驗室利用搜索、問答、預訓練、分類等多項NLP、機器學習技術,進行程序開發(fā),整體方案分為癥狀問詢、疾病預測兩大版塊,每個版塊都采用相同模型預測方案,同時,每個版塊細分為三個部分:基于檢索查詢歷史病例、基于自然語言的癥狀/疾病預測、基于癥狀的癥狀/疾病預測(如圖所示)。這三個部分在同一個交互周期內(nèi)會同時運行,并通過加權算法進行“校準”,來得到需要繼續(xù)問詢的癥狀或者輸出診斷的疾病。
圖片2.png
癥狀問詢預測框架圖
基于檢索查詢歷史病例部分,利用了精準搜索、模糊搜索,以及貝葉斯推理等技術,用來查找算法數(shù)據(jù)庫中的相似病例,這樣做的好處是,不僅能將主訴癥狀的模糊表述和精準表述相結合,以拓寬對于主訴癥狀和疾病的檢索范圍,還能更高效地對癥狀進行預測。
基于自然語言的疾病預測,是將癥狀列表轉化為自然語言后,利用預訓練語言模型預測查詢癥狀概率分布。值得注意的是,此部分選手們采用的模型是天衍實驗室自有的大規(guī)模醫(yī)療預訓練語言模型MedBERT,它是基于大規(guī)模的醫(yī)療在線文本由Robert繼續(xù)訓練得到的,不僅能更好適配醫(yī)療領域內(nèi)的語言學習,還在多項醫(yī)療標準數(shù)據(jù)集上取得了SOTA。相比通用預訓練模型來說,MedBERT更能勝任醫(yī)療相關的任務執(zhí)行。
在癥狀/疾病的預測部分,方案采用了在多項賽事中被驗證、分類效果表現(xiàn)優(yōu)異的分類器——xgboost模型,其優(yōu)勢是使學習出來的模型更加簡單,防止過擬合,因此,進一步提升了算法運行效率。
圖片3.png
疾病預測框架圖
多策略融合召回預測的方式,不僅將檢索、自然語言疾病預測、癥狀疾病預測三種模型優(yōu)勢進行互補,實現(xiàn)了更高的準確率和癥狀召回率,同時,在癥狀召回上,還能鼓勵更多輪的癥狀問詢,并做良好的超參數(shù)配置調優(yōu),從而獲得更高的癥狀召回率。正因如此,在最終評測中,天衍實驗室在疾病預測準確率和癥狀召回率上,均獲得了總分第一的成績,甚至,在癥狀召回率上,還超出其他團隊方案10%以上。
這一成果的獲得,不僅表明天衍實驗室在算法能力和模型具備相對優(yōu)勢,同時,這也是天衍實驗室在醫(yī)療健康領域AI算法研究和應用落地深耕多年的實力體現(xiàn)。

騰訊天衍實驗室一直專注于醫(yī)療健康領域NLP研究,其成果已經(jīng)在騰訊互聯(lián)網(wǎng)醫(yī)院中的導輔診、合理用藥、健康助手等業(yè)務版塊成功落地。同時,天衍實驗室還期望在行業(yè)層面推動整個NLP的創(chuàng)新研究:如,在深度學習頂會ICLR 2021上舉辦MLPCP挑戰(zhàn)賽(醫(yī)療對話生成與自動診斷國際挑戰(zhàn)賽),以推動醫(yī)療咨詢對話系統(tǒng)和預測患者可能的疾病類型等方面的創(chuàng)新突破;攜手CCKS 2021(全國知識圖譜與語義計算大會)和中山大學舉辦蘊含實體的中文醫(yī)療對話生成評測,以助力自然語言基礎、語言理解、信息抽取、知識圖譜構建等領域的研究創(chuàng)新和算法能力提升……未來,天衍實驗室仍將持續(xù)扎根醫(yī)療健康領域,持續(xù)探索和推動NLP領域學術科研與應用方向更多價值落地。 

星空人工智能技術網(wǎng) 倡導尊重與保護知識產(chǎn)權。如發(fā)現(xiàn)本站文章存在版權等問題,煩請30天內(nèi)提供版權疑問、身份證明、版權證明、聯(lián)系方式等發(fā)郵件至1851688011@qq.com我們將及時溝通與處理。?。?a href="/">首頁 > 大數(shù)據(jù) » AI如何更懂醫(yī)?看騰訊天衍實驗室智能醫(yī)療診斷技術創(chuàng)新

感覺不錯,很贊哦! ()
分享到:

相關推薦

留言與評論(共有 0 條評論)
   
驗證碼:
景宁| 吉林市| 高唐县| 手游| 蓝田县| 民乐县| 宜宾县| 噶尔县| 晋宁县| 江川县| 临朐县| 神池县| 博罗县| 阳城县| 团风县| 平远县| 全南县| 贡觉县| 咸丰县| 华池县| 松滋市| 贡山| 开平市| 福州市| 千阳县| 界首市| 宜丰县| 蕲春县| 屏山县| 宣汉县| 马关县| 盐边县| 陇南市| 乐清市| 明光市| 囊谦县| 普洱| 芦山县| 双流县| 泗阳县| 浙江省|