隨著致命性新冠病毒在全球范圍內(nèi)的持續(xù)擴散,科學(xué)家們正利用基因測序加開源軟件工具跟蹤其具體傳播路徑。
這款名為Nextstrain的軟件工具雖然無法確切預(yù)測病毒的下一步蔓延,但卻能夠及時提醒我們新的病例來自何處。對于全球各地的衛(wèi)生官員來說,這類信息可謂至關(guān)重要。只要快速發(fā)現(xiàn)新病例,他們就能及時跟進,了解這些病例源自境外抑或是本地傳播。
Nextstarin項目成員、計算科學(xué)家James Hadfield表示,這種基因組流行病學(xué)分析“對于公共衛(wèi)生而言極具價值。這類數(shù)據(jù)的處理時間越早,后續(xù)響應(yīng)補救措施的效果就越好。”
此番導(dǎo)致嚴重呼吸系統(tǒng)疾病的COVID-19新型冠狀病毒于去年12月首次出現(xiàn)在中國,隨后快速感染80000余人。截至目前,新冠病毒已經(jīng)傳播至趤85個國家/地區(qū),且韓國、伊朗與意大利的發(fā)病率最高。到本文撰稿時,美國也已經(jīng)確認超過250起病例。
隨著新病例的出現(xiàn),確定病毒來源就變得非常重要,特別是明確感染者來自本地、還是在其他地區(qū)感染到病毒。在準確把握這部分信息之后,公共衛(wèi)生官員即可立足出行限制、學(xué)校停課、疑似病例隔離以及防疫資源分配等層面做出明智決策。
利用基因測序技術(shù)為冠狀病毒“畫像”
基因組分析能夠幫助我們找到揭示病毒起源的線索。在本次疫情爆發(fā)期間,病毒的遺傳密碼會隨著傳播過程不斷發(fā)生穩(wěn)定突變。但每一次突變往往影響不大,只表現(xiàn)為基因中的單一堿基變換——例如由ATC變化為ATTC。著眼于突變,我們能夠在一定程度上把握病毒的傳播時間與地理軌跡。(目前尚無證據(jù)證明這種突變已經(jīng)對新冠病毒的生物活性造成影響。)
通過比較全球范圍內(nèi)采集到病毒樣本基因,新型工具即可繪制出病毒在世界各地傳播時所發(fā)生的突變圖譜。Nextstrain的意義也正在于此。Hafield指出,“我們偽造這些自然發(fā)生的基因突變,協(xié)助生成與病毒傳播相關(guān)的可視化信息。”
Nextstrain繪制的病毒圖譜涵蓋病毒家譜以及進化時間表。對于此次新冠病毒,其家譜起源于中國武漢市,并在此后不斷衍生分支。當(dāng)新病例出現(xiàn)時,Nextstrain可以將新病毒樣本的基因與數(shù)據(jù)庫內(nèi)的原有基因進行比較,借此確定其起源區(qū)域。
例如,美國的研究人員已經(jīng)從加利福尼亞州出現(xiàn)的8起病例中讀取或測得冠狀病毒基因組序列。Hafield指出,其中至少6例在遺傳學(xué)層面存在差異,因此證明這些病例由美國之外傳播入境。
Hafield解釋道,“從基因組數(shù)據(jù)角度來看,此次調(diào)查中至少有6例病毒毒株由境外傳入加利福尼亞。當(dāng)然,這并不是說加利福尼亞州內(nèi)就不存在任何本地傳播,只是當(dāng)前的基因組數(shù)據(jù)還無法證實這一點。”
西雅圖地區(qū)傳播的冠狀病毒
相比之下,根據(jù)Nextstrain的分析,西雅圖地區(qū)已經(jīng)成為病毒的傳播溫床。該軟件比較了兩起病例,其一采樣自今年1月中旬,其二則采樣自今年2月下旬,且全部發(fā)生在西雅圖附近的斯諾霍米什縣。由于這些病毒存在遺傳相似性,因此可以證明屬于本地傳播。
弗雷德哈欽森癌癥研究中心研究員Trevor Bedford是Nextstrain項目的參與者,他表示在以上兩起病例發(fā)現(xiàn)間隔的六周之內(nèi),病毒很可能已經(jīng)在本地社區(qū)間進行大范圍傳播。他預(yù)計單西雅圖區(qū)域一地就存在約600名潛在感染者,而預(yù)計感染者上限可能多達1500人。(大多數(shù)新冠病毒病例的發(fā)病癥狀比較輕微,感染者很可能不會前往醫(yī)院就診。)
當(dāng)然,Nextstrain的成功也高度依賴于科學(xué)家們對病毒樣本的努力測序,特別是將測序結(jié)果發(fā)布至可免費訪問的網(wǎng)站之上。到目前為止,全球研究人員都在積極發(fā)布自己的測序發(fā)現(xiàn)。Hadfield表示,大多數(shù)從業(yè)者都會將測序數(shù)據(jù)上傳至公開訪問的GISAID庫當(dāng)中。感謝整個社區(qū)的貢獻,Nextstrain團隊得以在這里找到軟件開發(fā)所必需的寶貴數(shù)據(jù)。
然而,在資源相對有限的區(qū)域,科學(xué)家可能拿不到進行此類分析所需要的實驗室工具或者培訓(xùn)素材。為此,一支名為ARTIC Network的小組正在提供協(xié)議與培訓(xùn)資源,幫助全球科學(xué)家順利完成疾病監(jiān)測與基因測序。他們還開發(fā)出“案例實驗室”,引導(dǎo)用戶輕松將資源部署至遠程位置。
上周,巴西也傳出令人振奮的成功故事。在不到48小時之內(nèi),研究人員即從圣保羅的一位病患身上收集到新冠病毒樣本,利用ARTIC協(xié)議對病毒基因組完成測序,并將數(shù)據(jù)共享至GISAID庫。科學(xué)家們在這里使用的基因組測序工具為MinION。
好文章,需要你的鼓勵
騰訊ARC實驗室推出AudioStory系統(tǒng),首次實現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù),通過交錯式推理生成、解耦橋接機制和漸進式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準測試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時學(xué)習(xí)外觀和運動信息,顯著解決了當(dāng)前視頻生成模型中動作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個線性層就能大幅提升運動質(zhì)量,在多項測試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實驗室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評測基準,通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時顯著提升人性化交互水平,為AI價值觀對齊提供了可行技術(shù)路徑。
谷歌DeepMind團隊開發(fā)的GraphCast是一個革命性的AI天氣預(yù)測模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報,準確性超越傳統(tǒng)方法90%的指標。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來了效率和精度的雙重突破。