最近美國癌癥協(xié)會(huì)一份報(bào)告預(yù)計(jì),美國今年約有40000名女性死于乳腺癌。造成該結(jié)果的原因之一,是診斷癌癥腫瘤所需的時(shí)間太長——對(duì)此,研究人員們一直強(qiáng)調(diào)改進(jìn)癌癥的檢測(cè)和預(yù)防,如果疾病在治愈率較高的早期階段就被發(fā)現(xiàn),往往能挽救更多生命。
現(xiàn)在,一個(gè)由麻省理工學(xué)院計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(MIT’s Computer Science and Artificial Intelligence Laboratory,CSAIL)、馬薩諸塞州總醫(yī)院(Massachusetts General Hospital)和哈佛醫(yī)學(xué)院(Harvard Medical School)科學(xué)家們組成的團(tuán)隊(duì)認(rèn)為,AI技術(shù)可以解決這個(gè)難題。
從左至右:馬薩諸塞州總醫(yī)院乳腺成像研究項(xiàng)目主任Manisha Bahl,麻省理工學(xué)院教授Regina Barzilay,哈佛醫(yī)學(xué)院教授及馬薩諸塞州總醫(yī)院放射科的乳腺成像科主任Constance Lehman
目前,乳腺X射線檢查(Mammograms)是乳腺癌的最佳診斷工具——從X光片上看到可疑的病變組織之后,需要對(duì)患者進(jìn)行針刺活檢以檢測(cè)是否患癌。
然而,這一工具總會(huì)存在風(fēng)險(xiǎn),譬如誤診。當(dāng)嘗試提高可以識(shí)別的癌癥數(shù)量時(shí),“假陽性”的結(jié)果也會(huì)增加,導(dǎo)致患者進(jìn)行不必要的活檢和手術(shù)。
也就是說,“假陽性”的一個(gè)常見原因是所謂的“高風(fēng)險(xiǎn)”病變,當(dāng)通過針刺活檢進(jìn)行測(cè)試時(shí),這些病變?cè)谌橄賆射線照片上看起來很可疑,并且具有異常細(xì)胞。這種情況下,醫(yī)生通常采取不同的措施:有些醫(yī)生對(duì)所有的”高危病變“都進(jìn)行手術(shù)去除,有些則對(duì)“較高癌癥發(fā)生率的病變”進(jìn)行手術(shù),例如“非典型乳管增生”(ADH)或“小葉原位癌”(LCIS)。
第一種方法要求患者經(jīng)歷痛苦、耗時(shí)且昂貴的手術(shù),甚至有些手術(shù)毫無必要;第二種方法也存在不精確的情況,可能導(dǎo)致ADH和LCIS以外的“高風(fēng)險(xiǎn)病變”成為漏網(wǎng)之“癌”。
圖:乳腺X射線檢查儀
那么如何避免不必要的手術(shù),同時(shí)仍然保持乳腺X射線檢查的重要作用?
開篇所提到的三位女科學(xué)家團(tuán)隊(duì),聯(lián)手開發(fā)了一套機(jī)器學(xué)習(xí)模型,被稱為“隨機(jī)森林分類器(random-forest classifier)”的方法,并讓它接受了600個(gè)高風(fēng)險(xiǎn)病灶的分析訓(xùn)練。
在綜合了家族遺傳史、人口統(tǒng)計(jì)、以及過往的組織活檢和病理報(bào)告等信息之后,該模型對(duì) 335 個(gè)病灶(最終升級(jí)為癌癥的病患)進(jìn)行了測(cè)試,結(jié)果準(zhǔn)確診斷了97%的乳腺癌是惡性腫瘤,而傳統(tǒng)方法僅為79%。
這項(xiàng)研究的結(jié)論是:在將該機(jī)器學(xué)習(xí)模型引入常規(guī)診斷實(shí)踐后,超過30%的良性病灶切除術(shù)是可以避免的。
同時(shí)。該技術(shù)的工作速度比乳腺X射線檢查快30倍——據(jù)估計(jì),醫(yī)生需要50-70個(gè)小時(shí)來分析50名乳腺癌患者,而該技術(shù)只需要約30分鐘,相當(dāng)于提高了100倍。
圖:數(shù)字化乳腺X射線檢查
這一系統(tǒng)或許能替代傳統(tǒng)的乳腺X射線片子,幫助女性做出明智的決定,采取最好的治療方法。
Regina Barzilay是麻省理工學(xué)院電子工程與計(jì)算機(jī)科學(xué)教授,同時(shí)也是一名乳腺癌幸存者,她認(rèn):“當(dāng)數(shù)據(jù)有這么多的不確定性時(shí),機(jī)器學(xué)習(xí)就是我們需要的、用于改進(jìn)檢測(cè)和防止過度治療的工具,這是一個(gè)趨勢(shì)。”
哈佛醫(yī)學(xué)院教授及馬薩諸塞州總醫(yī)院放射科的乳腺成像科主任Constance Lehman是這個(gè)項(xiàng)目的參與者之一。她強(qiáng)調(diào),“據(jù)我們所知,這是第一個(gè)將機(jī)器學(xué)習(xí)應(yīng)用于區(qū)分需要進(jìn)行手術(shù)的高風(fēng)險(xiǎn)病變和不需要進(jìn)行手術(shù)的高風(fēng)險(xiǎn)病變的研究。”
Lehman介紹,過去,醫(yī)生可能會(huì)建議所有高風(fēng)險(xiǎn)的病變都要進(jìn)行手術(shù)切除。但現(xiàn)在,如果該模型確定病變對(duì)特定患者來說的癌變機(jī)率很低,我們可以與病人就她的選擇采取更有針對(duì)性的醫(yī)療方法。
她還透露,馬薩諸塞州總醫(yī)院放射科的醫(yī)生將從明年開始將該模型納入其臨床實(shí)踐。
馬薩諸塞州總醫(yī)院乳腺成像研究項(xiàng)目主任Manisha Bahl也支持這種看法,她表示,她們的目標(biāo)是在臨床環(huán)境中應(yīng)用該工具。未來,他們希望將乳腺X射線照片、病理幻燈片圖像( images of the pathology slides)、以及醫(yī)療記錄中更廣泛的患者信息結(jié)合,從而將該模型發(fā)展成為適用于其他類型的癌癥甚至完全是其他類型的疾病。
Debashish Ghosh則認(rèn)為,盡管人工智能技術(shù)很強(qiáng),但是更適合美國而不是英國,因?yàn)榻y(tǒng)計(jì)顯示在英國只有不到5%的患者接受了乳腺癌手術(shù),而在美國這一比例是30%,說明英國患者本就有自己的選擇。
有關(guān)這項(xiàng)研究的詳情,已經(jīng)發(fā)表在近日出版的《放射學(xué)》(Radiology)期刊上。
好文章,需要你的鼓勵(lì)
新加坡國立大學(xué)研究團(tuán)隊(duì)開發(fā)了SPIRAL框架,通過讓AI與自己對(duì)弈零和游戲來提升推理能力。實(shí)驗(yàn)顯示,僅訓(xùn)練AI玩簡(jiǎn)單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟(jì)大學(xué)團(tuán)隊(duì)開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機(jī)噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實(shí)現(xiàn)37.9%的精度提升,并在真實(shí)設(shè)備上展現(xiàn)出色泛化能力,為機(jī)器人、AR和自動(dòng)駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團(tuán)隊(duì)通過對(duì)比實(shí)驗(yàn)發(fā)現(xiàn),經(jīng)過強(qiáng)化學(xué)習(xí)訓(xùn)練的視覺語言模型雖然表現(xiàn)出"頓悟時(shí)刻"現(xiàn)象,但這些自我糾錯(cuò)行為并不能實(shí)際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗(yàn)證差距",即生成答案的能力強(qiáng)于驗(yàn)證答案質(zhì)量的能力,且模型在自我驗(yàn)證時(shí)無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機(jī)構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動(dòng)態(tài)稀疏性實(shí)現(xiàn)大語言模型訓(xùn)練加速1.6倍,計(jì)算成本降低2.2倍。該方法使用SVD稀疏性估計(jì)器智能選擇重要計(jì)算部分,在保持模型性能的同時(shí)顯著提升訓(xùn)練效率,已在多個(gè)任務(wù)上驗(yàn)證有效性。