科技行者 3月6日 北京消息 開發(fā)新藥絕不是一件容易的事。平均而言,新型藥品的開發(fā)工作需要耗時十年,且研發(fā)成本高達26億美元——只有這樣的巨額投入之下,藥物才能由實驗室真正走向市場。而由于其安全性及有效性的不確定性,最終往往只有約5%的實驗性藥品能夠被實際投放市場。
不過藥物制造商與各大科技企業(yè)正投入數十億美元以建立人工智能解決方案,希望借此加快藥物發(fā)現速度并降低藥物成本。
華盛頓州雷蒙德市微軟研究實驗室主任Eric Horvitz在近期于德克薩斯州奧斯汀市召開的美國科學促進會年會上指出,“我認為人工智能堪稱醫(yī)療衛(wèi)生領域的沉睡巨人。”他解釋稱,微軟公司正積極投資人工智能技術以推動藥物設計與藥理學研究,研究藥物如何在體當中發(fā)揮作用,并將這項技術描述為“巨大的機遇”。
微軟公司絕不是惟一在人工智能技術身上押下重注的廠商。截至2月底,位于多倫多的生物技術企業(yè)BenchSci已經發(fā)布統(tǒng)計結論,發(fā)現目前已經有16家制藥公司以及60多家初創(chuàng)企業(yè)在利用人工智能技術進行藥物開發(fā)。
最大的瓶頸
藥物開發(fā)領域最大的瓶頸通常在于研究工作的早期階段,特別是從確定潛在致病目標(通常為人體內的蛋白質)到測試候選藥物能否達成治療目的之間所需要的時間。
眾多最具發(fā)展雄心的人工智能組織——包括ATOM私營-公共財團——希望能夠將這一過程由原本的四到六年周期縮短至一年之內。
由于只有5%的實驗性藥物能夠最終被投放市場,因此人工智能技術的引入將有助于改善周期漫長且以勞動密集型為主的藥物發(fā)現過程。
當然,這項崇高的目標暫時還未能達成。不過總部位于倫敦的歐洲最大私營人工智能企業(yè)BenevolentAI公司表示,一旦確定了有望攻克的疾病目標,那么此項技術的引入將能夠顯著減少候選藥物所需試驗數量與錯誤量。到目前為止,該公司估計其能夠將相關研發(fā)成本降低60%,并將藥物的研發(fā)時間由原本的三年縮短至一年。
其它以人工智能為導向的藥物開發(fā)工作也顯示出振奮人心的早期收益,其中包括更有效地治療艾滋病、高血壓、傳染病以及癌癥等。
提前預測失敗
由于成功開發(fā)出新藥的可能性極低,因此制藥業(yè)已經習慣了這種“幾乎總是以失敗告終”的狀況。但英國葛蘭素史克公司新近于巴爾的摩建立的AI藥物發(fā)現部門負責人John Baldoni表示,人工智能檢測方法能夠有效清除部分候選藥物,同時提取其中的有價值數據以推動其它項目的發(fā)展。
舉例來說,通過對其所在公司的數據庫進行搜索,Baldoni和他的同事們發(fā)現超過23萬種用于對大腦疾病進行靶向治療的候選藥物。他指出,這些分子雖然都不適合其目前所推動的項目(專注于其它疾病),但人工智能算法仍有助于揭示這類能夠進入大腦的化學成分中的共通性結構特征。
Baldoni的團隊目前正在明智其它人工智能程序來模擬如何將這些分子以新的方式組合在一起,并預測其中哪些部分可能有助于滲透至大腦之內以達到治療疾病的目的——而哪些組合可能產生毒性。
BenevolentAI公司已經擴大了其研究規(guī)模,其中涉及20多種針對罕見型癌癥、炎癥、神經退行性疾病以及中樞神經系統(tǒng)疾病的藥物研發(fā)計劃。在接受NBC新聞的采訪時,該公司董事長Ken Mulvany表示,他們所使用的計算機經過訓練以了解生物醫(yī)學語言,并能夠在人體之內找到藥物、疾病以及蛋白質之間存在的神秘關聯(lián)。
該公司的一項臨床實驗目前正在測試一種名為bavisant的失敗藥物對帕金森患者日間過度嗜睡癥狀的治療效果。在2012年利用bavisant對患有注意力缺陷多動障礙的成年病人進行臨床實驗時,雖然藥物最終未能起到應有療效,但研究人員們發(fā)現其副作用之一正是失眠。該公司利用AI算法建模方式證實了該化合物對睡覺的潛在影響,而這也正是目前治療帕金森相關嗜睡癥狀臨床實驗的契機。
BenevolentAI公司還利用其它AI計算機算法為肌萎縮側索硬化(簡稱ALS)探索新的治療方案選項——這是一種退行性神經系統(tǒng)疾病。2016年,該公司在一周之內確定了五種假造藥物。如果沒有人工智能技術的幫助,這一過程可能需要數年時間才能完成。
前景與挑戰(zhàn)
當然,并不是所有人都相信人工智能技術會改變藥物的開發(fā)前景。
哈佛大學化學家Alan Aspuru-Guzik博士曾經開發(fā)出面向材料科學的人工智能應用,而目前其正轉向藥物研發(fā)領域。在他看來,這一領域確實充斥著大量炒作氣息。盡管如此,他認為“脾氣暴躁”的反對者們顯然忽略了他在這方面付出的努力,而真正的從業(yè)者也不會受到影響。他表示,“在不同領域之間的邊界位置,總會出現眾多令人興奮的新生事物,而摩擦也將同樣不可避免。”
目前的一大主要挑戰(zhàn),在于如何收集充足且可靠的信息來正確訓練沃森以及其它人工智能系統(tǒng)。Aspuru-Guzik指出,“人工智能的實際質量取決于數據質量。”
基于他自己設計的、用于工業(yè)類分子應用的人工智能策略,他解釋了應如何立足藥物研發(fā)領域對計算機進行更好地訓練。首先,他將數十萬種類似藥物的分子信息輸入到AI算法當中,以幫助其學習各類分子間的共通性特征。最終,計算機將變得足夠聰明,從而自行預測新藥的結構表達。
他指出,“沒錯,人工智能會無數次預測出垃圾結果。”然而,科學家們可以設計出對應方法以排除那些無用的預測,并獎勵好的預測結果,從而訓練計算機并不斷提升其準確性水平。
目前受到廣泛關注的生成對抗網絡(簡稱GAN)方法就是在兩套人工智能網絡之間建立一種競爭機制。其中的發(fā)生器網絡負責猜測藥物分子,而鑒別器網絡則對每一項猜測結果作出對錯判斷。Aspuru-Guzik表示,“剛開始,這兩套網絡都愚蠢得不忍直視。但隨著時間的推移,兩套網絡會相互學習并同時變得更加聰明。”
當然,計算機仍然會被人類所愚弄,這一點相信對于GPS導入死路或者因臨時封道而無法前進的用戶們可謂深有體會。在Aspuru-Guzik看來,人工智能會提升人類的能力,但絕不會取而代之。他總結稱,“人工智能會給我們帶來新的超能力,但最終仍將由人類對其進行控制與使用。
好文章,需要你的鼓勵
新加坡國立大學研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓練AI玩簡單撲克游戲就能讓其數學推理能力提升8.6%,通用推理提升8.4%,且無需任何數學題目作為訓練材料。研究發(fā)現游戲中的三種推理模式能成功轉移到數學解題中,為AI訓練提供了新思路。
同濟大學團隊開發(fā)的GIGA-ToF技術通過融合多幀圖像的"圖結構"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術利用圖像間的不變幾何關系,結合深度學習和數學優(yōu)化方法,在合成數據集上實現37.9%的精度提升,并在真實設備上展現出色泛化能力,為機器人、AR和自動駕駛等領域提供更可靠的3D視覺解決方案。
伊利諾伊大學研究團隊通過對比實驗發(fā)現,經過強化學習訓練的視覺語言模型雖然表現出"頓悟時刻"現象,但這些自我糾錯行為并不能實際提升推理準確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構聯(lián)合提出SparseLoRA技術,通過動態(tài)稀疏性實現大語言模型訓練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓練效率,已在多個任務上驗證有效性。