科技行者 2月24日 北京消息:一大批計(jì)算機(jī)科學(xué)家正在追蹤新冠病毒的動向。這種被正式定名為“COVID-19”的新型冠狀病毒,可導(dǎo)致嚴(yán)重呼吸道疾病,重癥者可致死,該病毒最初于2019年12月在武漢爆發(fā),截至目前累計(jì)感染超過75000人,死亡人數(shù)以千計(jì),盡管中國境內(nèi)的新增病例數(shù)量已經(jīng)開始下降,但人們普遍擔(dān)心這波疫情會在新加坡、日本、韓國、香港以及泰國引發(fā)新一輪動蕩。
來自波士頓東北大學(xué)(Northeastern University)計(jì)算機(jī)科學(xué)家Alessandro Vespignani已經(jīng)開發(fā)出一種針對“COVID-19”的預(yù)測模型,他的團(tuán)隊(duì)打造出EpiRisk工具,用于評估感染者將疾病傳播到世界其他地區(qū)的可能性,此外,該工具還能跟蹤各國旅行禁令,核實(shí)政府管控是否有效。為阻止這波全球流行性疾病,Alessandro Vespignani介紹了計(jì)算機(jī)行業(yè)如何抵御疫情。
Alessandro Vespignani: 過去幾天,我們看到不少振奮人心的跡象,特別是中國境內(nèi)的新增病例在減少。
Alessandro Vespignani: 可以說沒有特別的重點(diǎn),因?yàn)槲覀兊貌扇∫磺斜匾胧?。我們需要了解中國?nèi)地的疾病傳播情況,以及干預(yù)措施效果;我們需要了解,其他地區(qū)是否出現(xiàn)了疫情蔓延的信號;我們需要了解,是否已經(jīng)有某些區(qū)域成為新的流行病中心。在這一階段,每個(gè)問題都很重要,沒有輕重緩急之分。
Alessandro Vespignani:EpiRisk工具建模方案的核心,在于利用一切可用的數(shù)據(jù)源。
目前,我們主要關(guān)注來自中國及其周邊國家的監(jiān)控?cái)?shù)據(jù),當(dāng)然,社交媒體與新聞內(nèi)容也會被整理起來。
首先,我們會對這種流行病進(jìn)行建模,實(shí)現(xiàn)態(tài)勢感知,特別是建立起對中國境外的疫情態(tài)勢感知體系——因?yàn)槲覀円呀?jīng)基本掌握有多少人從中國疫情重災(zāi)區(qū)前往其他國家,所以配合目前國際上發(fā)現(xiàn)的COVID-19境外病例,就能基本推斷出其他地區(qū)的疫情規(guī)模。一般來說,這類預(yù)測通常只能由官方確認(rèn)并發(fā)布,但我們在掌握數(shù)據(jù)后往往能夠提前做出這些預(yù)測。
接下來,我們會利用模型研究出行限制等干預(yù)性措施會給疾病的實(shí)際傳播帶來哪些影響。在武漢及其周邊地區(qū),機(jī)場全面關(guān)閉、長途運(yùn)輸叫停、學(xué)校停課。我們正努力了解這些措施能夠在中國本土帶來怎樣的疫情控制效果,同時(shí)分析中國境外出現(xiàn)新增病例的可能性。
▲ 圖為EpiRisk
Alessandro Vespignani:在我們這個(gè)領(lǐng)域中,工作內(nèi)容基本分為兩種:在不存在緊急狀況或者健康威脅地,進(jìn)行正常研究——或者說和平時(shí)期研究;另外就是現(xiàn)在這種,我們可以稱其為「戰(zhàn)爭時(shí)期」。
遺憾的是,每當(dāng)發(fā)生“COVID-19”疫情這類突發(fā)情況時(shí),我們只能利用有限的數(shù)據(jù)配合一系列假設(shè),對不斷變化的形勢做出有限的預(yù)測。有時(shí)候,新的消息一到,我們就得把前一天整理出的所有結(jié)果全部推翻。很忙,確實(shí)很忙。
但在這場戰(zhàn)爭中,真正沖鋒陷陣的是那些前線醫(yī)生、護(hù)士以及公共衛(wèi)生人員,他們才是承擔(dān)起風(fēng)險(xiǎn)的群體。作為計(jì)算機(jī)科學(xué)家與計(jì)算流行病學(xué)家,我們的工作為他們提供情報(bào),幫助他們找出敵人的行動規(guī)律。
Alessandro Vespignani:我們經(jīng)常跟其他研究團(tuán)隊(duì)以及機(jī)構(gòu)進(jìn)行全球電話會議,我在電話會議里見過的團(tuán)隊(duì)至少有80到100個(gè)。這些團(tuán)隊(duì)帶來各種專業(yè)知識,有些團(tuán)隊(duì)負(fù)責(zé)進(jìn)行系統(tǒng)發(fā)育分析與遷移建模,有些人主要關(guān)注預(yù)測、即時(shí)預(yù)報(bào)以及長期投影分析等等。與以往的流行病應(yīng)對情況相比,如今各類科學(xué)團(tuán)隊(duì)與機(jī)構(gòu)之間的協(xié)作與溝通水平,明顯上了臺階。
Alessandro Vespignani:我覺得沒必要。這有點(diǎn)像天氣預(yù)報(bào)或者自然災(zāi)害預(yù)報(bào)。如果所有模型都指向同一個(gè)大體方向,而且結(jié)果基本保持統(tǒng)一,那么結(jié)果就是可信的。疾病建模也是如此,畢竟沒有哪兩套模型會完全相同。每個(gè)人都會使用不同的人口統(tǒng)計(jì)數(shù)據(jù),對于某些年齡段的相對易感性采取不同的假設(shè)。如果非要把這么多不同的模型整合起來,肯定會帶來新的問題——有新問題,就有與之對應(yīng)的處理需求,這會讓問題變得更復(fù)雜。
Alessandro Vespignani:例如,美國的疾控中心(美國疾病控制與預(yù)防中心)幾年前曾建立“FluSight”項(xiàng)目,通過引入建模研究團(tuán)隊(duì),協(xié)助預(yù)測季節(jié)性流感。這類項(xiàng)目最終建立起一個(gè)社區(qū)體系,并以為樞紐打通各機(jī)構(gòu)之間的聯(lián)系通道。世界各地的其他機(jī)構(gòu)也參與到類似的體系中來,希望將原本分散的力量統(tǒng)一,為防疫抗疫提供輔助。
Alessandro Vespignani:肯定可以,項(xiàng)目中也包含諸如計(jì)算與算法開發(fā)之類的工作,既然不了解什么是計(jì)算流行病學(xué),普通的計(jì)算機(jī)科學(xué)家也完全能夠很好地解決這些任務(wù)。另外,如果大家有意參與其中,首先應(yīng)該與已經(jīng)在傳染病建模領(lǐng)域具備一定經(jīng)驗(yàn)的老手們合作,這樣可以盡量規(guī)避最初接觸時(shí)的種種常見錯(cuò)誤,盡快投身到對抗疫情的核心工作當(dāng)中。
好文章,需要你的鼓勵
新加坡國立大學(xué)研究團(tuán)隊(duì)開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實(shí)驗(yàn)顯示,僅訓(xùn)練AI玩簡單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟(jì)大學(xué)團(tuán)隊(duì)開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機(jī)噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實(shí)現(xiàn)37.9%的精度提升,并在真實(shí)設(shè)備上展現(xiàn)出色泛化能力,為機(jī)器人、AR和自動駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團(tuán)隊(duì)通過對比實(shí)驗(yàn)發(fā)現(xiàn),經(jīng)過強(qiáng)化學(xué)習(xí)訓(xùn)練的視覺語言模型雖然表現(xiàn)出"頓悟時(shí)刻"現(xiàn)象,但這些自我糾錯(cuò)行為并不能實(shí)際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗(yàn)證差距",即生成答案的能力強(qiáng)于驗(yàn)證答案質(zhì)量的能力,且模型在自我驗(yàn)證時(shí)無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機(jī)構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動態(tài)稀疏性實(shí)現(xiàn)大語言模型訓(xùn)練加速1.6倍,計(jì)算成本降低2.2倍。該方法使用SVD稀疏性估計(jì)器智能選擇重要計(jì)算部分,在保持模型性能的同時(shí)顯著提升訓(xùn)練效率,已在多個(gè)任務(wù)上驗(yàn)證有效性。