制造行業(yè)可能是世界唯一一個(gè)從基本創(chuàng)意到市場推廣,整個(gè)周期需要耗費(fèi)大約十年、總投入達(dá)數(shù)十億美元、且失敗機(jī)率高達(dá)90%的高風(fēng)險(xiǎn)領(lǐng)域。這一切顯然與IT業(yè)務(wù)截然不同——在IT領(lǐng)域,雖然偏執(zhí)狂們更加搏人眼球,但真正負(fù)責(zé)任的高管能夠規(guī)劃更多長遠(yuǎn)目標(biāo)、并一步步引導(dǎo)業(yè)務(wù)前行。因此,當(dāng)深度學(xué)習(xí)支持下的人工智能革命在2013年-2014年期間攜一大批輝煌成果席卷而來時(shí),制藥業(yè)的高管們開始快速關(guān)注,但卻沒有立即加入這股潮流。
不少制藥企業(yè)確實(shí)開始在內(nèi)部數(shù)據(jù)科學(xué)研發(fā)方面投入大量資金,但由于缺乏統(tǒng)籌協(xié)調(diào)的戰(zhàn)略指導(dǎo),這些工作更像是單一部門之內(nèi)由數(shù)據(jù)科學(xué)、數(shù)字化、AI等技術(shù)人員推動(dòng)的品牌重塑活動(dòng)。
而且雖然部分制藥企業(yè)已經(jīng)開始投資AI企業(yè),但目前為止還沒有出現(xiàn)任何大規(guī)模的收購。與AI初創(chuàng)企業(yè)的大部分討論,以“讓我們看看你的第三階段臨床資產(chǎn),證明你們怎么在其中確定目標(biāo)并使用AI技術(shù)生成分子”,或者“你們跟其他AI初創(chuàng)企業(yè)有什么區(qū)別”作為開端。很明顯,負(fù)責(zé)這方面工作的數(shù)據(jù)科學(xué)戰(zhàn)略負(fù)責(zé)人才剛剛上崗,對市場的當(dāng)前形勢并不怎么了解。
但也有一些制藥企業(yè),設(shè)法在藥物發(fā)現(xiàn)與開發(fā)等各個(gè)環(huán)節(jié)中,帶來了令人印象深刻的AI應(yīng)用結(jié)果。以阿斯利康為例,該公司從2018年開始發(fā)表合成化學(xué)文章,并在2019年拿出了幾篇真正受到社區(qū)關(guān)注的重量級論文。其他幾家制藥企業(yè)同樣建立起不錯(cuò)的內(nèi)部探索成果——禮來公司與某家初創(chuàng)企業(yè)合作,打造出令人過目難忘的AI驅(qū)動(dòng)型機(jī)器人實(shí)驗(yàn)室。
但時(shí)至今日,還沒有哪家主要制藥企業(yè)能夠在AI研究以及臨床開發(fā)層面拿出基于大數(shù)據(jù)的全面概述與成果比較。今年6月15日,論文《成長為數(shù)字化制藥企業(yè)的優(yōu)勢(The upside of being a digital pharma player)》在知名行業(yè)期刊《今日藥物發(fā)現(xiàn)》上發(fā)表。筆者收到了Google Scholar發(fā)來的相關(guān)通知,因?yàn)槠渲幸昧宋覀兊膸灼撐?。我本來打算草草瀏覽一下就算了,但在讀到作者名單部分的時(shí)候,我看到了一大群學(xué)識淵博的學(xué)者、行業(yè)領(lǐng)袖與顧問:羅伊特林根大學(xué)的Alexander Schuhmacher、索尼公司的Alexander Gatto、諾華公司的Markus Hinder、普華永道的Michael Kuss以及圣加侖大學(xué)的Oliver Gassmann等等。在認(rèn)真閱讀之后,我發(fā)現(xiàn)這不是那種灌水的綜述性論文,而是一項(xiàng)真正全面的研究,對各制藥企業(yè)在研發(fā)層面的AI嘗試進(jìn)行了一番正面對比。
此項(xiàng)研究通過內(nèi)部AI研發(fā)項(xiàng)目、與AI初創(chuàng)企業(yè)間的合作伙伴關(guān)系、對AI初創(chuàng)企業(yè)的投資以及各研發(fā)聯(lián)盟/財(cái)團(tuán)之間的評估,對各家制藥公司的AI探索情況做出比較。此外,文章還比較了各制藥企業(yè)從2014年-2019年間,在科學(xué)出版物上發(fā)表的AI相關(guān)論文數(shù)量。從下圖中可以看到,諾華在市場競爭中占據(jù)著顯著優(yōu)勢,阿斯利康的學(xué)術(shù)出版量也同樣一路領(lǐng)先。
▲ 圖:各大制藥巨頭企業(yè)2014-2018年AI相關(guān)活動(dòng)概述,摘自Schuhmacher等人在《今日藥物發(fā)現(xiàn)》上發(fā)表的《成長為數(shù)字化制藥企業(yè)的優(yōu)勢》論文。
在這篇論文發(fā)表之前,根據(jù)業(yè)內(nèi)人士定期進(jìn)行的文獻(xiàn)回顧,阿斯利康的AI相關(guān)學(xué)術(shù)成果發(fā)表量遠(yuǎn)超任何其他制藥企業(yè)。單在2019年,阿斯利康的科學(xué)家們就發(fā)表了約1300篇科學(xué)論文。另外,拜耳也有多篇不錯(cuò)的論文。但制藥巨頭們的文章發(fā)表數(shù)量仍然嚴(yán)重不足,其中發(fā)表量最大的阿斯利康在所有細(xì)分領(lǐng)域的論文總量也只有65篇。作為參考,Insilico Medicine公司同期發(fā)表了約100篇論文與約30項(xiàng)專利,其中不包括AI會議論文。其他幾家初創(chuàng)企業(yè)在領(lǐng)域中也表現(xiàn)良好,共同為整個(gè)行業(yè)的發(fā)展做出貢獻(xiàn)。
▲ 圖:2014年-2019年期間,各大制藥企業(yè)在AI領(lǐng)域發(fā)表的科學(xué)論文數(shù)量,摘自Schuhmacher等人在《今日藥物發(fā)現(xiàn)》上發(fā)表的《成長為數(shù)字化制藥企業(yè)的優(yōu)勢》論文。
筆者在自己的LinkedIn上發(fā)布了這項(xiàng)研究的截屏,轉(zhuǎn)瞬之間,來自制藥行業(yè)的同事們就給文章增加了20000次瀏覽量。令人驚訝的是,鮮有讀者給它點(diǎn)贊。我懷疑很多從業(yè)者對于制藥行業(yè)在長久的探索之后,仍在AI領(lǐng)域處于起步階段而感到沮喪。研究表明,成長為數(shù)字化制藥企業(yè)雖然優(yōu)勢多多,但目前還沒有幾家公司真正邁開步伐。
此項(xiàng)研究的作者當(dāng)然是行業(yè)內(nèi)的制藥/AI研究與開發(fā)專家,而他們做出的大量研究工作只針對行業(yè)內(nèi)三個(gè)相對簡單的數(shù)據(jù),更可怕的是,在此之前甚至不存在類似的研究。
為了解這項(xiàng)研究的更多詳細(xì)信息,我寫信給作者們,向他們詢問了關(guān)于此項(xiàng)研究及其對制藥行業(yè)未來前景的影響等問題:
Gassmann: 確實(shí),這是一項(xiàng)艱巨的任務(wù)。雖然專利與科學(xué)出版物中都有不少公開可用的內(nèi)容,但總體來講,最有價(jià)值的還是對制藥業(yè)高管的采訪。采訪的過程不怎么耗時(shí),但為了讓對方接受采訪,我們這幫人大概在業(yè)內(nèi)打拼了二十多年。
Gatto: 另外,獲得成功的另一項(xiàng)關(guān)鍵因素,在于幾位作者擁有豐富的跨學(xué)科教育背景,包括藥學(xué)策略、研發(fā)與AI能力等。
Kuss: 倒是沒什么可驚訝的。真正需要注意的是,整個(gè)行業(yè)似乎難以找到將AI技術(shù)引入藥物研發(fā)體系的初步成熟方法。
Schuhmacher: AI應(yīng)用程序的成本越來越低,再配合速度更快且更廉價(jià)的硬件,整個(gè)制藥研發(fā)領(lǐng)域都將踏上數(shù)字化轉(zhuǎn)型的道路。技術(shù)普及終歸要由需求驅(qū)動(dòng),行業(yè)對于研發(fā)效率的追求,終將令A(yù)I技術(shù)在制藥行業(yè)中獲得全面成功。
Gatto: 我們已經(jīng)確定了幾種場景,其中AI技術(shù)有望取代實(shí)際實(shí)驗(yàn)或者表現(xiàn)出超越人類的潛力。最重要的就是最近發(fā)表在《自然:生物技術(shù)》雜志上的“從零開始設(shè)計(jì)小分子”的文章,其中強(qiáng)調(diào)了人工智能在藥物發(fā)現(xiàn)中的無窮可能性。
Schuhmacher: 我們還沒有收到什么直接反饋,畢竟論文才剛剛發(fā)表不久??傮w來講,我們注意到,制藥企業(yè)的研發(fā)主管開始對我們近期在「虛擬制藥研發(fā)」方面的工作表現(xiàn)出興趣。
Gassmann: 另外,我們還觀察到,制藥行業(yè)正沿著「醫(yī)療保健的數(shù)字化」方向緩慢發(fā)展。十年前,相當(dāng)一部分制藥企業(yè)的經(jīng)理還無法相信,基于數(shù)據(jù)的公司能夠在醫(yī)療保健價(jià)值鏈中占據(jù)相當(dāng)?shù)谋壤?。但如今?strong>軟件已經(jīng)吞噬整個(gè)世界,數(shù)據(jù)改變了制藥行業(yè),這些都成為不爭的事實(shí)。
Schuhmacher: 看起來,仍有不少領(lǐng)先制藥企業(yè)沒有把AI技術(shù)視為核心戰(zhàn)略的組成部分。另外,他們?nèi)匀贿^度依賴于封閉式的創(chuàng)新模式:論文發(fā)表并不屬于其收入與研發(fā)模型中的固有環(huán)節(jié)。但這一切可能發(fā)生改變:制藥企業(yè)需要吸引更多數(shù)據(jù)科學(xué)家與其他技術(shù)專家,并通過學(xué)術(shù)成果數(shù)量,表現(xiàn)自身卓越的技術(shù)能力與競爭優(yōu)勢。
Gatto: 單從AI相關(guān)專利的數(shù)量來看,制藥企業(yè)確實(shí)無法與谷歌等IT巨頭相提并論。但是,隨著時(shí)間的推移,制藥企業(yè)可能會轉(zhuǎn)變自身研發(fā)模式以及對AI相關(guān)知識產(chǎn)權(quán)的運(yùn)用方式,屆時(shí)情況可能出現(xiàn)巨大變化。
Gassmann: 對于制藥行業(yè)來說,一兩年時(shí)間實(shí)在太短了,但AI技術(shù)本身一定會繼續(xù)發(fā)展。蘋果等消費(fèi)電子產(chǎn)品公司,以及谷歌等數(shù)據(jù)業(yè)務(wù)公司,已經(jīng)開始在美國藥監(jiān)局注冊可穿戴設(shè)備。雖然目前這類設(shè)備的可靠性還很差,但相信其性能將快速提高。未來一兩年中,老年癡呆癥、糖尿病或者癌癥等慢性疾病,將成為數(shù)字化健康方案的理想切入點(diǎn)。由此收集到的垂直數(shù)據(jù)將提供巨大價(jià)值。與之對應(yīng),制藥企業(yè)需要重新考慮自身創(chuàng)新方式,并將創(chuàng)新手段與現(xiàn)有生態(tài)系統(tǒng)統(tǒng)一起來。
Kuss: 在我看來,將「藥物研發(fā)」轉(zhuǎn)化為「眾包式生態(tài)系統(tǒng)」將成為制藥業(yè)未來成功的關(guān)鍵所在。到那時(shí),藥物研發(fā)不再局限于內(nèi)部價(jià)值創(chuàng)造,而是真正將來自內(nèi)部與外部的思維、技術(shù)(包括AI)以及資源整合成統(tǒng)一而強(qiáng)大的網(wǎng)絡(luò)。
Gassmann: 這項(xiàng)研究應(yīng)該只是個(gè)開始。在未來幾年中,我們計(jì)劃建立一處關(guān)于藥物創(chuàng)新研究的合作中心,希望在人工智能及其他新興技術(shù)的背景之下,推動(dòng)行業(yè)對于藥物及生物技術(shù)研發(fā)管理的深刻理解。
Schuhmacher: AI技術(shù)必將對未來的研發(fā)模式以及制藥研發(fā)生態(tài)系統(tǒng)產(chǎn)生巨大影響。這一切,加上相關(guān)的戰(zhàn)略與技術(shù)變革,將成為我們未來幾個(gè)月研究議程中的重點(diǎn)內(nèi)容。
Kuss: 基于分布式分類賬技術(shù)的智能合約,也將在這場變革當(dāng)中發(fā)揮關(guān)鍵作用。
<附>:如需了解論文《成長為數(shù)字化制藥企業(yè)的優(yōu)勢(The upside of being a digital pharma player)》,關(guān)注科技行者公眾號(ID:itechwalker)并回復(fù)關(guān)鍵詞“制藥”即可獲得。
好文章,需要你的鼓勵(lì)
騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng),首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù),通過交錯(cuò)式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時(shí)學(xué)習(xí)外觀和運(yùn)動(dòng)信息,顯著解決了當(dāng)前視頻生成模型中動(dòng)作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個(gè)線性層就能大幅提升運(yùn)動(dòng)質(zhì)量,在多項(xiàng)測試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評測基準(zhǔn),通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平,為AI價(jià)值觀對齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊(duì)開發(fā)的GraphCast是一個(gè)革命性的AI天氣預(yù)測模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào),準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來了效率和精度的雙重突破。