如今,一位新的醫(yī)生進入了急診室——但與我們的傳統(tǒng)認知不同的是,不僅沒有名字,甚至沒有實體。事實上,人工智能技術已經(jīng)進入世界各地的醫(yī)療體系。請各位機器人反對者放心,人工智能在醫(yī)療衛(wèi)生領域的融合并不是要取代人類的工作崗位。人工智能擁有強大的擴展與與強化能力,有時甚至能夠啟發(fā)醫(yī)生對病患作出更為全面的診療。
Bertalan Mesko被認為是醫(yī)學未來學家,他把人工智能稱為“21世紀的聽診器”。他的評估結果可能比他預期的更準確。盡管以往的各類技術與測試確實能夠為醫(yī)生提供對患者進行診斷與治療所需要的各類信息,但醫(yī)生們肩上仍然擔負著過重的臨床與行政責任,而對大量可用信息進行分類無疑也是一項艱巨的任務。
這就是二十一世紀聽診器所能帶來的全部助益。
盡管如此,AI技術在醫(yī)療領域的應用已經(jīng)超出了行政管理的工作范圍。從強大的診斷算法到精心設計的外科手術機器人,這項技術正在醫(yī)學界引發(fā)極為廣泛的關注。很明顯,AI已經(jīng)在醫(yī)學領域占有一席之地,只是尚不確定它的具體價值。
想象一下,如果人工智能被納入到病人護理團隊當中,那么我們首先必須更好地理解AI如何對接人類醫(yī)生。雙方的準確性差異如何?AI能夠做出哪些具體或者獨特的貢獻?AI在哪些領域最具幫助,又是否可能造成危害?只有回答了這些問題,我們才能真正開始預測,而后構建起以AI為支柱的美好未來。
AI vs. 人類醫(yī)生
盡管相關工作仍處于發(fā)展初期,但人工智能在病患診斷方面已經(jīng)擁有了與醫(yī)生類似、甚至更勝一籌的能力。
英國牛津約翰-拉德克里夫醫(yī)院的研究人員們就開發(fā)出一套AI診斷系統(tǒng),能夠以至少八成機率帶來高于人類醫(yī)生的心臟病診斷準確率。而在哈佛大學,研究人員們則打造出一款“智能”顯微鏡,能夠檢測其中潛在的致命血液感染:該人工智能輔助工具訓練自100,000張相關圖像,而這些圖像又源自25,000張由染料處理完成(旨在進一步凸顯細菌影像)的幻燈片,該AI系統(tǒng)能夠以95%的準確率對細菌進行分類。日本橫濱昭和大學的一項研究顯示,一種新型計算機輔助內(nèi)鏡系統(tǒng)能夠顯示結腸位置的潛在癌細胞生長跡象,靈敏度為94%、特異性為79%、準確性為86%。
在某些情況下,研究人員還發(fā)現(xiàn),AI能夠在需要快速判斷的診斷條件下勝過人類醫(yī)生——例如確定病變位置是否屬于癌變等。
在2017年12月由美國醫(yī)學會雜志發(fā)表的一項研究當中,深度學習算法在時間有限的情況下能夠比人類放射科醫(yī)生更好地診斷轉移性乳腺癌。盡管人類放射科工程師在時間充裕的情況下同樣能夠作出良好的判斷,但在實際情況下(特別是在急診室等容量巨大且病患快速流轉的環(huán)境中),快速診斷很可能直接決定著患者的生死存亡。
當然,IBM Watson就擁有這樣的診斷能力:在針對來自腫瘤細胞的遺傳數(shù)據(jù)作出有意義的分析見解時,人類專家需要花上約160個小時來審查并根據(jù)發(fā)現(xiàn)提供治療建議; 相比之下,Watson只用了10分鐘就能給出同樣的可操作建議。谷歌最近也公布了一套開源DeepVariant版本,這是該公司用于解析遺傳數(shù)據(jù)的人工智能工具,并在去年的FDA Truth挑戰(zhàn)賽當中成為準確度最高的工具。
AI技術在預測健康事件方面的表現(xiàn)同樣優(yōu)于人類。
去年4月,諾丁漢大學的研究人員們發(fā)表了一項調(diào)查,結果表明通過利用來自378,256名患者的大量數(shù)據(jù)進行訓練,AI實現(xiàn)了高于現(xiàn)有標準7.6%的患者心血管發(fā)病事件預測準確率。研究人員們在報告中寫道:“在作為測試樣本的約83,000條記錄當中,這樣的準確率提升意味著AI將額外挽救355名病患的生命。而更值得注意的是,神經(jīng)網(wǎng)絡的‘誤報’機率也比標準方法低1.6%——一旦作出誤判,患者很可能受到不必要的治療或者護理程序,而其中很多其實相當危險。”
AI技術超越人類表現(xiàn)的主要領域,集中在具備大量數(shù)據(jù)儲備的情況下,而這正是目前精準醫(yī)學快速發(fā)展的核心方向。
人類診斷項目(簡稱Human Dx)正是為了填充這項空白而建立,其將機器學習與人類醫(yī)生的實踐經(jīng)驗加以結合。該機構正整理來自80多個國家的7500名醫(yī)生與500家醫(yī)療機構的輸入信息,以便開發(fā)出一套系統(tǒng),確保患者、醫(yī)生、機構、設備開發(fā)人員以及研究人員皆可加以訪問并作出更為明智的臨床決策。
人類診斷項目非營利組織主任Shantanu Nundy在接受采訪時表示,在涉及到任何行業(yè)性技術的開發(fā)時,人工智能都應被集成至其功能當中。“必須在設計當中考慮到最終用戶的實際需求。人們會使用Netflix,但并不代表他們想要‘用來看電影的AI’,對吧?人們會使用Amazon,但卻不代表他們想要‘用來購物的AI’。”
換句話來說,如果此類技術設計得足夠出色,并以一種人們認為有用的方式來實現(xiàn),那么人們甚至意識到不自己正在使用AI。
對于思想開放、富有前瞻性的臨床醫(yī)生們來說,像Human Dx這樣的項目可謂極具吸引力。因為其能夠幫助從業(yè)者們減少在技術鉆研方面所投入的時間。DC特區(qū)執(zhí)業(yè)工程師Nundy在采訪中表示,“我們現(xiàn)在需要把50%以上的時間花在電腦屏幕前。”而AI技術的出現(xiàn)將幫助醫(yī)生更為高效地解決甚至擺脫文書工作等行政負擔。
從這個角度來講,在醫(yī)療領域,人工智能的意義并不一定在于取代醫(yī)生,而是優(yōu)化并提高其業(yè)務能力。
總部位于波士頓的人工智能與行為分析企業(yè)Cogito公司移動健康閱讀首席行為科學主管Skyler Place在采訪中表示:“我認為人工智能的價值在于增強人類的能力,而非取代人類。”Cogito公司一直利用人工智能語音識別與分析功能幫助來自眾多行業(yè)的客戶改善服務交互效果,尤其是一款用于追蹤病人行為的心理健康應用程序——Cogito Companion。
這款應用能夠監(jiān)控病人的手機以識別其中的主動及被動行為信號,例如位置數(shù)據(jù),從而了解病人是否多日待在家中;或者提取通信日志以追蹤其是否長期未與他人發(fā)送短信或通話(Cogito稱,該應用只會了解病人是否使用電話或短信功能,而不會追蹤其中的具體內(nèi)容)。患者的護理團隊可以監(jiān)控報告中包含的跡象,進而把握患者可能出現(xiàn)的整體心理健康狀態(tài)變化。
Cogito公司已經(jīng)聯(lián)合波士頓各地多個醫(yī)療衛(wèi)生系統(tǒng)以測試這款應用,且該應用目前已經(jīng)在退伍軍人群體當中找到合適的施展空間。退伍軍人往往面臨著被社會孤立的風險,且可能出于自尊心而不愿接受來自醫(yī)療系統(tǒng)的援助——特別是心理健康指導。Place指出,“我們發(fā)現(xiàn)這款應用能夠建立起信任,從而通過更為廣泛的方式推動醫(yī)療行業(yè)的參與。”他同時補充稱,該應用“能夠有效作為行為轉變的起點”,包括幫助退伍軍人適應這種引導并逐步接受精神治療服務。
這正是AI技術的作用所在:利用機器學習算法分析“音頻檢查”——即病人的錄音(類似于音頻日記)。這些算法能夠從中提取情緒線索,如同兩個人在說話一樣。Place解釋稱,“我們能夠建立符合人們口頭表達方式的算法,包括精力、語調(diào)、對話活躍度以及流量等。”
以此為基礎,人類對算法進行訓練,旨在幫助其理解什么樣的表達聽起來“可信”或者“能力”,從而確定抑郁癥患者的聲音特征、或者狂躁癥患者的聲音差異。該應用除了為患者提供實時信息以追蹤情緒之外,此類信息還有助于臨床醫(yī)生隨時間推移全程追蹤患者的進展情況。在Cogito公司,Place已經(jīng)看到了人工智能在幫助我們理解人類對話以及心理健康狀況方面的巨大潛力。
然而,理解只是第一步,其終目標在于找到一種可行的治療方法——而這正是醫(yī)生目前在精神健康問題方面發(fā)揮的作用。那么,在面對更為實際的問題時,機器人又該扮演怎樣的角色?
在過去幾十年當中,人工智能在醫(yī)學領域最重要的應用之一,集中體現(xiàn)在外科手術機器人的發(fā)展當中。
截至目前,在大多數(shù)情況下,外科手術機器人(其中最著名的當然是da Vinci)都作為人類外科醫(yī)生的延伸,負責控制操作臺上的各類設備。2010年在蒙特利爾進行的全球首例手術當中,手機機器人與機器人麻醉醫(yī)生(被稱為McSleepy)完成了自己的首秀。相關數(shù)據(jù)反映出,這些機器人醫(yī)生確實帶來了令人印象深刻的表現(xiàn)。
2015年,距離第一臺手術機器人進入手術室十多年之后,麻省理工學院對FDA數(shù)據(jù)進行了回顧性分析,旨在評估機器人手術的安全性水平。研究期間共出現(xiàn)144例死亡、1391人受傷,這主要是由于技術難題或設備故障所造成。報告指出:“盡管報告數(shù)量相對較多,但絕大多數(shù)手術都獲得了成功,其中沒有出現(xiàn)任何問題。”但對于更為復雜的手術部位(例如心外科手術),問題的出現(xiàn)次數(shù)明顯高于婦科及普通外科手術。
結論基本可以總結為:雖然手術機器人能夠在某些專業(yè)方向上帶來良好表現(xiàn),但對于更復雜的手術,最好還是留給外科醫(yī)生進行處理——至少目前如此。但這種情況可能很快發(fā)生改變,而且手術機器人將能夠以更為獨立的方式擺脫對人類外科醫(yī)生的依賴,到時候我們可能很難判斷在發(fā)生問題時到底該由誰承擔責任。
患者可以起訴機器人嗎?畢竟這項技術還相對比較年輕,因此這類訴訟將遭遇法律層面的灰色地帶。從傳統(tǒng)角度講,專家們認為醫(yī)療事故是由工程師的疏忽所造成,或者違反了明確的醫(yī)療標準。然而,疏忽這一概念意味著人工智能本身存在某種意識缺失,可以想象的是如果機器人自身被認定為一種效能標準,則必須擁有對應的規(guī)則對其加以約束。
因此,如果問題不能歸咎于機器人,那么責任應該由誰來承擔?患者家屬是否會要求負責監(jiān)督機器人的人類外科醫(yī)生負責?或者應該由機器人的制造公司負責?或者是由負責設計工作的工程師負責?這個問題目前還沒有明確的答案,但可以肯定的是我們必須盡早為其找到解決方向。
未來幾年,AI技術在醫(yī)療領域的作用將持續(xù)升級:在埃森哲發(fā)布的一份報告當中,2014年的醫(yī)療市場AI總值為6億美元。而到2021年,這一數(shù)字很可能達到66億美元。
這一行業(yè)可能將蓬勃發(fā)展,但我們不應該急于或隨意整合AI技術。為何這么說?因為人類所遵循的邏輯可能與機器并不契合。
舉例來說,經(jīng)過訓練的人工智能方案能夠確定特定皮膚病是否屬于潛在癌變。皮膚科醫(yī)生經(jīng)常會使用rulers來判斷病變的癌變可能性,但AI在訓練過程中使用的則是活檢圖像,如果圖像中出現(xiàn)了rulers,則其有可能會認定這意味著目標病患出現(xiàn)了癌變——聽起來荒謬,但這就是機器的學習方法。
算法也有可能繼承我們的偏見,這主要是由于用于訓練AI的素材缺乏多樣性。無論是在醫(yī)學還是其它領域,機器訓練所使用的數(shù)據(jù)在很大程度上取決于研究者自身的身份以及進行訓練的位置。
醫(yī)療決策的另一個宗旨在于,程序或治療所帶來的好處是否超過風險。在考慮人工智能是否可以與手術室的外科醫(yī)生擁有平等地位時,我們首先需要投入大量時間對其中的風險收益與對等分析作出研究。
Human Dx的Nundy表示,“我認為如果能夠和正確的相關方一起構建技術,同時投入更多努力以實現(xiàn)這個目標,那么我相信我們將徹底改變未來。實際上,我們正在努力塑造新的未來。”
雖然有時候我們會對AI主導下的機器人方案引入醫(yī)學領域感到擔憂,但人類正在進行探索,并最終推動這種變化。我們將決定應該在哪里使用AI技術,又該在哪里繼續(xù)沿用傳統(tǒng)解決方法——而不是一味試圖預測未來20年醫(yī)生將以怎樣的方式進行診療。醫(yī)生完全可以利用人工智能作為工具,著手建立自己預期中的未來——對他們自身以及病患都更加美好的未來。
<來源:Futurism.com;編譯:科技行者>
好文章,需要你的鼓勵
騰訊ARC實驗室推出AudioStory系統(tǒng),首次實現(xiàn)AI根據(jù)復雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結合大語言模型的敘事推理能力與音頻生成技術,通過交錯式推理生成、解耦橋接機制和漸進式訓練,能夠將復雜指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準測試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學聯(lián)合研發(fā)的VideoJAM技術,通過讓AI同時學習外觀和運動信息,顯著解決了當前視頻生成模型中動作不連貫、違反物理定律的核心問題。該技術僅需添加兩個線性層就能大幅提升運動質(zhì)量,在多項測試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實用化應用奠定了重要基礎。
上海AI實驗室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓練數(shù)據(jù)集和MM-AlignBench評測基準,通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術能力的同時顯著提升人性化交互水平,為AI價值觀對齊提供了可行技術路徑。
谷歌DeepMind團隊開發(fā)的GraphCast是一個革命性的AI天氣預測模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預報,準確性超越傳統(tǒng)方法90%的指標。該模型采用圖神經(jīng)網(wǎng)絡技術,通過學習40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預測方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學領域帶來了效率和精度的雙重突破。