▲ 人工智能可高速從數(shù)百萬遺傳變異里進行搜索,并確定引發(fā)罕見疾病的原因,還可以快速閱讀和查閱現(xiàn)有醫(yī)學(xué)文獻
據(jù)統(tǒng)計,全球有4億人患有罕見疾病。這個數(shù)字比美國總?cè)丝跀?shù)字還大。此外,根據(jù)全球基因組織的相關(guān)資料顯示,80%的罕見疾病由基因缺陷引起,而基因缺陷的準(zhǔn)確診斷結(jié)果平均需要4.8年時間。這就是為什么30%的患有罕見疾病的兒童活不到五歲的重要原因之一。
此外,95%的罕見疾病并不存在獲FDA批準(zhǔn)的治療。這也是件很無助的事情。好消息是,近年來興起的人工智能和機器學(xué)習(xí)成了對抗罕見病的重要工具。
如今,業(yè)界已經(jīng)有不少公司開發(fā)了各種平臺,借助人工智能確認(rèn)罕見疾病基因變異的根源,并提供給醫(yī)學(xué)研究人員和業(yè)內(nèi)人士使用。
其中一家公司是總部在以色列的Emdgene。Emdgene公司建的平臺不僅可以掃描罕見疾病患者的DNA數(shù)據(jù),還可以使用自然語言處理(NLP)閱讀最新的醫(yī)學(xué)文獻。借此,該平臺就能夠找到病人遺傳變異與病人目前狀態(tài)之間相關(guān)的書面記錄,進而加快病情診斷。Emdgene聯(lián)合創(chuàng)始人兼CEO Einat Metzer解釋說,假若沒有這個平臺,要做到這一點的話會是一個艱苦和耗時的過程。
他表示:“每個人的DNA都包含了數(shù)百萬種無害的遺傳變異,實驗室里的遺傳學(xué)家們必須從這么多變異中識別出導(dǎo)致某個疾病的一種變異。在不使用算法的情形下,他們通常是通過手動過濾這幾百種基因變異。此外,他們還必須搜索現(xiàn)有的文獻,以確保不會錯過任何新發(fā)現(xiàn)的信息或其它證據(jù)。”
Metzer還表示,Emedgene機器學(xué)習(xí)算法可完成所有上述步驟,并自動識別致病的變異基因以及文獻里和數(shù)據(jù)庫里的支持證據(jù)。遺傳學(xué)家所要做的,就只是審查產(chǎn)生的結(jié)果,而不是從頭開始做整體分析。
另外,Emedgene上個月還推出了一種名為Pathorolo的新算法。這一算法可以計算一個具體的遺傳病例可能得到解決的可能性,也可以用于重新評估過去未解決的病例——這樣的病例占所有罕見遺傳病例的60%之多。
Metzer 表示:“實驗室一般會定期重新分析過去未解決的病例,希望新發(fā)布的信息或新生物信息學(xué)工具可以協(xié)助解決一些病例。這樣的做法,通??梢詫⒔鉀Q病例的百分比提高10%。但這個過程隨著過去未解決病例的積累和不斷增長而變得十分復(fù)雜,如果沒有機器學(xué)習(xí)的幫助是不可持續(xù)的。而通過Pathorolo算法,我們就可以識別出那些過去未解決而今天有可能得到解決的病例,然后讓實驗室把時間和精力集中放在有望解決以及可定期再分析未解決的病例上。”
當(dāng)然,除了Emdgene之外,也有不少公司正在將AI用于罕見遺傳性疾病的診斷。比如,德國的初創(chuàng)公司Nostos基因組學(xué)。和Emedgene一樣,Nostos基因組學(xué)也在利用機器學(xué)習(xí)處理病人的遺傳變異及確定可能的原因。另一個有意思的例子是總部在美國波士頓的FDNA:今年一月FDNA在《自然醫(yī)學(xué)》(Nature Medicine)雜志上發(fā)表了一篇論文(https://www.nature.com/articles/d41586-019-00027-x),論文詳細(xì)介紹了FDNA打造的名為Face2Gene的智能手機應(yīng)用程序,經(jīng)過大量圖像的訓(xùn)練,該應(yīng)用程序可以識別出患有罕見遺傳性疾病的人。
還有一些比較復(fù)雜的案例,比如Fabric Genomics公司。Fabric Genomics公司總部在美國舊金山,主打用AI進行各種遺傳分析。據(jù)了解,F(xiàn)abric Genomics擁有一些授權(quán)超過1000個臨床實驗室和學(xué)術(shù)機構(gòu)使用的算法。其中,一些算法可用于篩選遺傳變異體可能造成的罕見疾病,診斷成功率能達約50%,而業(yè)界的平均成功率則只有25%至30%。
Fabric Genomics的算法今年四月曾被美國圣迭戈的Rady兒童基因組醫(yī)學(xué)研究所的研究人員采用,利用機器學(xué)習(xí)過程和臨床自然語言處理(CNLP),研究所的罕見遺傳性疾病診斷時長甚至創(chuàng)下了記錄。具體來說,研究所通過使用整個系統(tǒng)協(xié)助診斷重癥監(jiān)護室的嬰幼兒,在20小時內(nèi)提供了基因組測序,共涉及95名患兒及97種遺傳病,精確度達99%。
Rady兒童基因組醫(yī)學(xué)研究所總裁兼CEO Stephen Kingsmore醫(yī)生表示:“有些人稱其為人工智能,我們稱其為增強智能。病人護理自始至終都是醫(yī)生的事。我們通過技術(shù)的力量可以迅速準(zhǔn)確地確定遺傳性疾病的根本原因,然后再迅速地將這一關(guān)鍵信息提供給重癥監(jiān)護室的醫(yī)生,讓他們能夠?qū)W⒌貙δ切┢D難求生存的嬰兒進行個性化護理。”
這些成功的案例表明,AI對罕見病診斷是一劑良方,對4億患有罕見疾病的人來說更是如此。目前這些罕見疾病經(jīng)常被醫(yī)院忽視,醫(yī)院也沒有足夠的資源來處理這些疾病。因此,AI和機器學(xué)習(xí)在這個領(lǐng)域的引入將讓所有人受益。
好文章,需要你的鼓勵
騰訊ARC實驗室推出AudioStory系統(tǒng),首次實現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù),通過交錯式推理生成、解耦橋接機制和漸進式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時學(xué)習(xí)外觀和運動信息,顯著解決了當(dāng)前視頻生成模型中動作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個線性層就能大幅提升運動質(zhì)量,在多項測試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實驗室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評測基準(zhǔn),通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時顯著提升人性化交互水平,為AI價值觀對齊提供了可行技術(shù)路徑。
谷歌DeepMind團隊開發(fā)的GraphCast是一個革命性的AI天氣預(yù)測模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報,準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來了效率和精度的雙重突破。