隨著致命性新冠病毒在全球范圍內的持續(xù)擴散,科學家們正利用基因測序加開源軟件工具跟蹤其具體傳播路徑。
這款名為Nextstrain的軟件工具雖然無法確切預測病毒的下一步蔓延,但卻能夠及時提醒我們新的病例來自何處。對于全球各地的衛(wèi)生官員來說,這類信息可謂至關重要。只要快速發(fā)現(xiàn)新病例,他們就能及時跟進,了解這些病例源自境外抑或是本地傳播。
Nextstarin項目成員、計算科學家James Hadfield表示,這種基因組流行病學分析“對于公共衛(wèi)生而言極具價值。這類數據的處理時間越早,后續(xù)響應補救措施的效果就越好。”
此番導致嚴重呼吸系統(tǒng)疾病的COVID-19新型冠狀病毒于去年12月首次出現(xiàn)在中國,隨后快速感染80000余人。截至目前,新冠病毒已經傳播至趤85個國家/地區(qū),且韓國、伊朗與意大利的發(fā)病率最高。到本文撰稿時,美國也已經確認超過250起病例。
隨著新病例的出現(xiàn),確定病毒來源就變得非常重要,特別是明確感染者來自本地、還是在其他地區(qū)感染到病毒。在準確把握這部分信息之后,公共衛(wèi)生官員即可立足出行限制、學校停課、疑似病例隔離以及防疫資源分配等層面做出明智決策。
利用基因測序技術為冠狀病毒“畫像”
基因組分析能夠幫助我們找到揭示病毒起源的線索。在本次疫情爆發(fā)期間,病毒的遺傳密碼會隨著傳播過程不斷發(fā)生穩(wěn)定突變。但每一次突變往往影響不大,只表現(xiàn)為基因中的單一堿基變換——例如由ATC變化為ATTC。著眼于突變,我們能夠在一定程度上把握病毒的傳播時間與地理軌跡。(目前尚無證據證明這種突變已經對新冠病毒的生物活性造成影響。)
通過比較全球范圍內采集到病毒樣本基因,新型工具即可繪制出病毒在世界各地傳播時所發(fā)生的突變圖譜。Nextstrain的意義也正在于此。Hafield指出,“我們偽造這些自然發(fā)生的基因突變,協(xié)助生成與病毒傳播相關的可視化信息。”
Nextstrain繪制的病毒圖譜涵蓋病毒家譜以及進化時間表。對于此次新冠病毒,其家譜起源于中國武漢市,并在此后不斷衍生分支。當新病例出現(xiàn)時,Nextstrain可以將新病毒樣本的基因與數據庫內的原有基因進行比較,借此確定其起源區(qū)域。
例如,美國的研究人員已經從加利福尼亞州出現(xiàn)的8起病例中讀取或測得冠狀病毒基因組序列。Hafield指出,其中至少6例在遺傳學層面存在差異,因此證明這些病例由美國之外傳播入境。
Hafield解釋道,“從基因組數據角度來看,此次調查中至少有6例病毒毒株由境外傳入加利福尼亞。當然,這并不是說加利福尼亞州內就不存在任何本地傳播,只是當前的基因組數據還無法證實這一點。”
西雅圖地區(qū)傳播的冠狀病毒
相比之下,根據Nextstrain的分析,西雅圖地區(qū)已經成為病毒的傳播溫床。該軟件比較了兩起病例,其一采樣自今年1月中旬,其二則采樣自今年2月下旬,且全部發(fā)生在西雅圖附近的斯諾霍米什縣。由于這些病毒存在遺傳相似性,因此可以證明屬于本地傳播。
弗雷德哈欽森癌癥研究中心研究員Trevor Bedford是Nextstrain項目的參與者,他表示在以上兩起病例發(fā)現(xiàn)間隔的六周之內,病毒很可能已經在本地社區(qū)間進行大范圍傳播。他預計單西雅圖區(qū)域一地就存在約600名潛在感染者,而預計感染者上限可能多達1500人。(大多數新冠病毒病例的發(fā)病癥狀比較輕微,感染者很可能不會前往醫(yī)院就診。)
當然,Nextstrain的成功也高度依賴于科學家們對病毒樣本的努力測序,特別是將測序結果發(fā)布至可免費訪問的網站之上。到目前為止,全球研究人員都在積極發(fā)布自己的測序發(fā)現(xiàn)。Hadfield表示,大多數從業(yè)者都會將測序數據上傳至公開訪問的GISAID庫當中。感謝整個社區(qū)的貢獻,Nextstrain團隊得以在這里找到軟件開發(fā)所必需的寶貴數據。
然而,在資源相對有限的區(qū)域,科學家可能拿不到進行此類分析所需要的實驗室工具或者培訓素材。為此,一支名為ARTIC Network的小組正在提供協(xié)議與培訓資源,幫助全球科學家順利完成疾病監(jiān)測與基因測序。他們還開發(fā)出“案例實驗室”,引導用戶輕松將資源部署至遠程位置。
上周,巴西也傳出令人振奮的成功故事。在不到48小時之內,研究人員即從圣保羅的一位病患身上收集到新冠病毒樣本,利用ARTIC協(xié)議對病毒基因組完成測序,并將數據共享至GISAID庫??茖W家們在這里使用的基因組測序工具為MinION。
好文章,需要你的鼓勵
新加坡國立大學研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓練AI玩簡單撲克游戲就能讓其數學推理能力提升8.6%,通用推理提升8.4%,且無需任何數學題目作為訓練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉移到數學解題中,為AI訓練提供了新思路。
同濟大學團隊開發(fā)的GIGA-ToF技術通過融合多幀圖像的"圖結構"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術利用圖像間的不變幾何關系,結合深度學習和數學優(yōu)化方法,在合成數據集上實現(xiàn)37.9%的精度提升,并在真實設備上展現(xiàn)出色泛化能力,為機器人、AR和自動駕駛等領域提供更可靠的3D視覺解決方案。
伊利諾伊大學研究團隊通過對比實驗發(fā)現(xiàn),經過強化學習訓練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實際提升推理準確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構聯(lián)合提出SparseLoRA技術,通過動態(tài)稀疏性實現(xiàn)大語言模型訓練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓練效率,已在多個任務上驗證有效性。