谷歌旗下DeepMind團(tuán)隊(duì)最近發(fā)表一篇名為《乳腺癌篩查AI系統(tǒng)的國(guó)際評(píng)估》的論文,表示他們已經(jīng)在人工智能的醫(yī)學(xué)數(shù)據(jù)應(yīng)用研究領(lǐng)域取得驚人進(jìn)展。他們打造的系統(tǒng)能夠評(píng)估乳房X光片以做出乳腺癌預(yù)測(cè),且實(shí)際表現(xiàn)似乎已經(jīng)超越人類放射科醫(yī)生。與傳統(tǒng)人工看片方法相比,這套系統(tǒng)不僅改善了癌癥誤診率,同時(shí)也顯著降低了乳腺癌病例的漏診可能性。
▲ DeepMind技術(shù)有限公司首席執(zhí)行官兼聯(lián)合創(chuàng)始人Demis Hassabis在2016年11月15日(星期二)英國(guó)倫敦的谷歌Kings Cross辦公室發(fā)表講話。
DeepMind項(xiàng)目的患者數(shù)據(jù)來(lái)自英國(guó)與美國(guó)。在研究當(dāng)中,六名人類放射科醫(yī)生與基于計(jì)算機(jī)的AI方案共同對(duì)乳房X光片進(jìn)行評(píng)估。DeepMind團(tuán)隊(duì)強(qiáng)調(diào)稱,這套方案的目標(biāo)在于讓人工智能成為人類放射科醫(yī)生的好幫手,而非將其徹底取代。這確實(shí)是一招妙棋,畢竟人們至少很難接受完全由計(jì)算機(jī)進(jìn)行診斷——埃隆·馬斯克的大腦芯片植入計(jì)劃也面臨著類似的困境。
為了將這項(xiàng)技術(shù)真正推向市場(chǎng),DeepMind可能首先需要爭(zhēng)取監(jiān)管部門(mén)的支持,將其認(rèn)定為醫(yī)療設(shè)備,而后再獲取CE認(rèn)證標(biāo)識(shí)。看到這里,很多朋友可能要問(wèn):為什么要搞得這么麻煩?這套AI系統(tǒng)在本質(zhì)上,不就是一種看圖軟件嗎?事實(shí)上,乳腺癌篩查工具甚至是相關(guān)輔助工具,都會(huì)受到嚴(yán)格的監(jiān)管。因?yàn)橐坏┌l(fā)生誤診,病人可能會(huì)接受有創(chuàng)手術(shù);如果出現(xiàn)漏診,病人則可能錯(cuò)失接受治療的最佳時(shí)機(jī)。
在歐洲,醫(yī)療設(shè)備的安全與質(zhì)量標(biāo)準(zhǔn)相當(dāng)嚴(yán)格,要求制造商進(jìn)行大量臨床試驗(yàn),并對(duì)項(xiàng)目當(dāng)中的設(shè)計(jì)、開(kāi)發(fā)、配送甚至是安裝流程進(jìn)行全面質(zhì)量控制。此外,內(nèi)部與外部審計(jì)也必不可少,包括由外部審計(jì)師進(jìn)行極為嚴(yán)苛的風(fēng)險(xiǎn)管理評(píng)估。
目前的問(wèn)題在于,以往傳統(tǒng)設(shè)備可以參考“同類產(chǎn)品”以證明自身的運(yùn)行可靠性,但每套AI系統(tǒng)在一定程度上都可謂獨(dú)一無(wú)二,因此只能從零開(kāi)始接受全面驗(yàn)證。
谷歌當(dāng)然不是唯一一家打算利用AI系統(tǒng)進(jìn)軍醫(yī)療保健市場(chǎng)的企業(yè)。在此之前,IBM就一直在努力通過(guò)Watson解決直接醫(yī)學(xué)診斷問(wèn)題,不雖然帶來(lái)了不少令人振奮的個(gè)別成果與產(chǎn)出,但醫(yī)學(xué)研究界目前普遍認(rèn)為Watson演示中的“水分”過(guò)多,無(wú)法在日常臨床應(yīng)用中發(fā)揮同等作用。此外,也有不少學(xué)生以及業(yè)余愛(ài)好者從事醫(yī)學(xué)數(shù)據(jù)AI應(yīng)用方向的研究。但總體而言,將醫(yī)療類AI推向市場(chǎng)往往需要付出高昂的成本與努力,因此目前絕大部分相關(guān)工作仍局限于學(xué)術(shù)范疇之內(nèi)。
除此之外,在將這一乳腺癌篩查技術(shù)推向市場(chǎng)的過(guò)程中,DeepMind還面對(duì)著另一項(xiàng)巨大挑戰(zhàn)——這類自主醫(yī)療篩查系統(tǒng)可能被惡意人士所欺詐,并在誤導(dǎo)之下做出錯(cuò)誤判斷。
哈佛醫(yī)學(xué)院與麻省理工學(xué)院的一支聯(lián)合團(tuán)隊(duì)發(fā)布了一篇振聾發(fā)聵的論文,這篇題為《針對(duì)醫(yī)療用深度學(xué)習(xí)系統(tǒng)的專業(yè)攻擊》的文章提出多種可欺騙此類AI診斷系統(tǒng)的方法。研究人員們發(fā)現(xiàn),即使不清楚AI系統(tǒng)的內(nèi)部細(xì)節(jié),惡意一方仍然能夠成功欺騙目標(biāo)系統(tǒng)。到目前為止,這種愚弄AI系統(tǒng)的能力可能正是迫使我們拒絕全面推廣相關(guān)方案的主要原因。
我們?cè)跓o(wú)人駕駛汽車領(lǐng)域也發(fā)現(xiàn)了類似的趨勢(shì),該技術(shù)最初承諾的是完全自動(dòng)駕駛功能,但現(xiàn)實(shí)情況卻只能帶來(lái)自動(dòng)跟車以及停車輔助系統(tǒng)等非常有限的自動(dòng)化技術(shù)。而對(duì)于這些至關(guān)重要的應(yīng)用領(lǐng)域當(dāng)中,目前,我們還找不到快速擺脫困境的理想辦法。
說(shuō)了這么多,之前強(qiáng)調(diào)的還主要是監(jiān)管與技術(shù)層面的挑戰(zhàn)。但將這樣一套系統(tǒng)真正推向市場(chǎng),其他挑戰(zhàn)同樣所在多有。在單一付款人系統(tǒng)當(dāng)中,醫(yī)生沒(méi)有向企業(yè)付款的積極性,因此企業(yè)一方只能將技術(shù)產(chǎn)品出售給政府機(jī)構(gòu),這就會(huì)極大延長(zhǎng)產(chǎn)品的消化周期。除了報(bào)銷難題之外,某些特定國(guó)家/地區(qū)還擁有自己的管理要求,例如數(shù)據(jù)隱私。本文開(kāi)頭探討的是一種極具前景的概念驗(yàn)證型AI系統(tǒng),主要用于改善乳腺癌的診斷效果;但除了ISO認(rèn)證與CE認(rèn)證之外,這套系統(tǒng)甚至還沒(méi)有開(kāi)始臨床試驗(yàn)以及FDA審批流程。
總而言之,完成這一系列非常精細(xì)的測(cè)試與驗(yàn)證之前,患者們還無(wú)法體驗(yàn)到這項(xiàng)前沿技術(shù)。雖然DeepMind取得了至關(guān)重要且令人興奮的技術(shù)成就,但必須強(qiáng)調(diào)的是,這些技術(shù)尚處于起步階段。請(qǐng)暫且按捺興奮的情緒,我們手頭還有很多工作要做。
好文章,需要你的鼓勵(lì)
新加坡國(guó)立大學(xué)研究團(tuán)隊(duì)開(kāi)發(fā)了SPIRAL框架,通過(guò)讓AI與自己對(duì)弈零和游戲來(lái)提升推理能力。實(shí)驗(yàn)顯示,僅訓(xùn)練AI玩簡(jiǎn)單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無(wú)需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟(jì)大學(xué)團(tuán)隊(duì)開(kāi)發(fā)的GIGA-ToF技術(shù)通過(guò)融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機(jī)噪聲問(wèn)題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實(shí)現(xiàn)37.9%的精度提升,并在真實(shí)設(shè)備上展現(xiàn)出色泛化能力,為機(jī)器人、AR和自動(dòng)駕駛等領(lǐng)域提供更可靠的3D視覺(jué)解決方案。
伊利諾伊大學(xué)研究團(tuán)隊(duì)通過(guò)對(duì)比實(shí)驗(yàn)發(fā)現(xiàn),經(jīng)過(guò)強(qiáng)化學(xué)習(xí)訓(xùn)練的視覺(jué)語(yǔ)言模型雖然表現(xiàn)出"頓悟時(shí)刻"現(xiàn)象,但這些自我糾錯(cuò)行為并不能實(shí)際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗(yàn)證差距",即生成答案的能力強(qiáng)于驗(yàn)證答案質(zhì)量的能力,且模型在自我驗(yàn)證時(shí)無(wú)法有效利用視覺(jué)信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機(jī)構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過(guò)動(dòng)態(tài)稀疏性實(shí)現(xiàn)大語(yǔ)言模型訓(xùn)練加速1.6倍,計(jì)算成本降低2.2倍。該方法使用SVD稀疏性估計(jì)器智能選擇重要計(jì)算部分,在保持模型性能的同時(shí)顯著提升訓(xùn)練效率,已在多個(gè)任務(wù)上驗(yàn)證有效性。