作者|周雅
在制藥界,流傳著一個殘酷的“三十定律”:一款新藥的誕生,平均需要耗費十年光陰、投入數(shù)十億美金、而最終成功率卻不足10%,這是懸在每一家藥企頭上的達摩克利斯之劍。在這個以高投入、高風險、長周期為標簽的行業(yè)里,不確定性,是永恒的主題。
然而,當生成式AI的浪潮席卷而來,一些最敏銳的玩家已經(jīng)意識到,傳統(tǒng)的規(guī)則正在被改寫。
復(fù)星醫(yī)藥,作為本土領(lǐng)先的醫(yī)藥健康產(chǎn)業(yè)集團,是這場變革中堅定的前行者之一。在2025亞馬遜云科技中國峰會期間,我們與復(fù)星醫(yī)藥總裁助理兼首席數(shù)智官林錦斌聊了聊,他篤定說道:“隨著生成式AI技術(shù)的快速演進,復(fù)星醫(yī)藥認為必須主動擁抱AI這樣的新生產(chǎn)力,特別是對于生物醫(yī)藥這種高技術(shù)投入、高不確定性的行業(yè)。”
復(fù)星醫(yī)藥總裁助理兼首席數(shù)智官林錦斌
從5分鐘搞定1周工作的“小切口”談起
宏大的敘事固然激動人心,但真正的變革,往往始于一個不起眼卻痛徹心扉的“小切口”。在復(fù)星醫(yī)藥,這個切口,是一份份讓科學(xué)家們備受折磨的臨床試驗報告。
林錦斌講了這樣的情況:“一個典型的創(chuàng)新藥臨床試驗報告,整個數(shù)據(jù)量大概會有3000多張的表格,我們叫TFL (Table, Figure, Listing),需要把這些表格整合成一個5萬多字的報告。”這份工作已經(jīng)足夠復(fù)雜,但更令人崩潰的是,“隨著臨床試驗的推進,這3000多張的表格需要被刷新兩到三次。”
每一次刷新,都意味著一場人工的、繁瑣的、極易出錯的“大家來找茬”游戲??茖W(xué)家們,這些本應(yīng)在未知領(lǐng)域探索、與疾病賽跑的寶貴大腦,卻不得不耗費長達一周的時間,去逐字逐句地核對數(shù)據(jù)與報告內(nèi)容的一致性。“科學(xué)家的時間非常寶貴,不應(yīng)該浪費在簡單枯燥、又不能出錯的工作上。”林錦斌強調(diào)。
這正是復(fù)星醫(yī)藥與亞馬遜云科技合作的第一個靶點——“臨床試驗報告一致性檢查”。雙方?jīng)]有一開始就去追逐其他場景,而是選擇了這個最具體、最痛、也最能快速見到成效的場景。
結(jié)果是驚人的。“通過與亞馬遜云科技合作,借助生成式AI技術(shù)對于文本、檢索和信息處理能力,可以把3000多張表格映射到5萬多字的報告里, 一鍵式完成報告初期的一致性檢查。最終,召回率達到90%以上,準確率超過60%,工作效率從原來的1個星期縮短至5分鐘。”
在臨床試驗報告一致性檢查方面,它覆蓋了90%場景,效率提升70%;同時在另一個高頻場景——研發(fā)文獻翻譯上,借助亞馬遜云科技生成式AI技術(shù)與智能醫(yī)學(xué)內(nèi)容生成中心,它可在6個月內(nèi)完成超過1.6億字的翻譯工作,同時降低30%的成本支出。
這些被林錦斌稱為“容易被忽略的場景”,恰恰是復(fù)星醫(yī)藥AI戰(zhàn)略智慧的體現(xiàn)。他坦言:“我們最開始的時候野心比較大,我們說能不能一次性完成臨床試驗報告的自動化撰寫?后來發(fā)現(xiàn)難度太大了。但是我們并沒有氣餒,而是跟亞馬遜云科技一起合作,把一整個大場景解構(gòu)成細顆粒度的小場景。”
“先從具體的子場景做起”這種務(wù)實,貫穿了復(fù)星醫(yī)藥的整個AI實踐。林錦斌解釋說,“因為每攻克一個子場景,就沉淀下一份能力。比如一致性檢查,讓我們沉淀了對醫(yī)學(xué)術(shù)語、醫(yī)學(xué)數(shù)據(jù)、報告文法結(jié)構(gòu)的理解;醫(yī)學(xué)文獻翻譯,又沉淀了跨語言信息處理的能力。”
就像拼圖,每一塊看似微小,但當它們被一塊塊拼接起來時,最終將構(gòu)成一幅完整的圖景——臨床試驗報告的全自動撰寫。“盡管這個過程充滿了不確定性,”林錦斌說,“但我們依托亞馬遜云科技在全球范圍內(nèi)積累的大量實踐經(jīng)驗,特別是和跨國藥企的合作,能夠助力我們快速高效地探索和前進。”
重新定義生命科學(xué)的“多模態(tài)”
如果說解決文檔工作是AI應(yīng)用的表層,那么深入到生命科學(xué)的核心,才是真正的深水區(qū)。當被問及如何處理生物醫(yī)藥領(lǐng)域復(fù)雜、海量且多模態(tài)的數(shù)據(jù)時,林錦斌指出:
“從生物醫(yī)藥的視角來看,多模態(tài)的概念更加廣泛,不只是圖像、音頻、視頻,還包括基因序列、蛋白質(zhì)編碼與結(jié)構(gòu)等等,因此復(fù)星醫(yī)藥更加關(guān)注與專注生物醫(yī)藥領(lǐng)域的語言和模態(tài)。”
將基因、蛋白質(zhì)這些生命的基本編碼,視為一種獨特的“語言”和“模態(tài)”,這意味著,AI需要學(xué)習(xí)的,不僅僅是人類的自然語言,更是生命本身的語言。這背后,隱藏著一個巨大的機遇——探索“暗知識”。
林錦斌引用了王維嘉在《暗知識》中的觀點,即人類世界有大量的知識,是難以傳遞的體系,也就是“暗知識”。而人體,同樣極端復(fù)雜,還未被完全了解,也是“暗知識”。“運用生成式AI技術(shù)則為我們提供了一條比較好的探索路徑,即用生成式AI技術(shù),以機器認知的方式,我們有很大機會去吸收這些暗知識的能力。”他說道。
雖然這是一條通往新藥發(fā)現(xiàn)的路徑,但它同樣布滿了荊棘,首當其沖的挑戰(zhàn)就是「數(shù)據(jù)」。林錦斌坦言,“現(xiàn)在生物醫(yī)藥領(lǐng)域的數(shù)據(jù)體系建設(shè)要進一步提升,因為沒有一個系統(tǒng)化的體系告訴我們,應(yīng)該如何處理多方面的數(shù)據(jù)。”原因在于:
第一,基因庫、蛋白質(zhì)結(jié)構(gòu)等數(shù)據(jù)類型的整合,從標準化和整合的角度來看,目前還不能整合到一起辦大事。
第二,臨床試驗過程中的數(shù)據(jù)標準化和一體化問題,各個企業(yè)、醫(yī)院、診療機構(gòu)、研究團隊等,他們的臨床試驗數(shù)據(jù)是否愿意拿出來?以及如何進行標準化?
如何改變該現(xiàn)狀?林錦斌發(fā)出一個極具前瞻性的呼吁:“未來在整個生物醫(yī)藥行業(yè),至少對中國來說,需要有一個聯(lián)盟的數(shù)據(jù)體系來推動標準化、一體化、整合式的數(shù)據(jù),從而為生物醫(yī)藥面向AI時代的未來打下堅實基礎(chǔ)。”
這番話的背后,是一個清醒的認知:單靠一家企業(yè)的數(shù)據(jù),無法喂養(yǎng)出真正強大的行業(yè)大模型,所以這需要超越企業(yè)邊界的合作與遠見,整合社會和行業(yè)的數(shù)據(jù)共同孵化,或許能達到應(yīng)用層的百花齊放。
而對于大模型廣受詬病的“幻覺”問題,林錦斌的看法與眾不同。他認為,如果數(shù)據(jù)質(zhì)量足夠高,“幻覺”未必是負面詞,“它可能代表了創(chuàng)造力。如果幻覺是以高質(zhì)量的數(shù)據(jù)作為基座來引導(dǎo),甚至能給我們的創(chuàng)新帶來不一樣的思路。”
AI的“皇冠明珠”
在復(fù)星醫(yī)藥的AI戰(zhàn)略中,到底AI的生產(chǎn)力用在哪些領(lǐng)域?復(fù)星醫(yī)藥確定了兩條核心主線:一個是研發(fā),另一個是營銷。
“在研發(fā)方面,我們每年投入50多億。AI帶給我們兩方面的價值:其一,大量的數(shù)據(jù)檢索、萃取、分析、匯聚的能力,通過生成式AI我們的效率得到極大提升;其二,我們對大模型的推理和規(guī)劃能力更加認可和期待,因為這解決了一直困擾我們的問題——如何達成方向大致正確的選擇。”
林錦斌強調(diào)了第二點,這才是他眼中AI的“皇冠明珠”,因為它關(guān)乎制藥企業(yè)慎之又慎的地方——決策。
他用了一個比喻來解釋這個過程。過去,研發(fā)決策更像是一場“豪賭”,依賴于少數(shù)專家的經(jīng)驗和直覺。而現(xiàn)在,復(fù)星醫(yī)藥希望借助AI,將決策過程從豪賭變?yōu)榭茖W(xué)。
第一步,是全覆蓋全量的信息輸入,讓AI成為一個“信息情報官”。面對關(guān)鍵抉擇,比如“某一個管線到底最后做還是不做”,AI要能做到全覆蓋,確保決策者沒有漏掉任何關(guān)鍵的市場信息、競爭信息、專利信息或政策信息。
第二步,是全要素的評估模式,讓AI成為一個嚴謹?shù)?ldquo;分析師”。通過AI智能體(Agentic AI)的框架,將影響決策的專利、市場、法規(guī)、集采等所有要素“分門別類羅列清楚”,進行“全要素的評估模式”。
“我們先作為一個裁判員,給它評分。隨著AI技術(shù)的深度應(yīng)用,我們的知識體系、數(shù)據(jù)積累的進步深化,后面可以把它轉(zhuǎn)變?yōu)榻叹殕T,我們可以通過對于某一個管線的分析給出建議,這樣就能夠確保我們真正的決策是可靠的。”林錦斌總結(jié)說。
除了「研發(fā)端」之外,復(fù)星醫(yī)藥在「營銷端」的做法,就比較普適化了。
第一步是“練兵”:對于客戶數(shù)據(jù)、市場數(shù)據(jù)的匯總,AI系統(tǒng)就像一個不知疲倦的陪練教練。銷售團隊可以跟它進行模擬對話,反復(fù)練習(xí)推銷技巧,直到滾瓜爛熟。
第二步是“上戰(zhàn)場”:當銷售人員真正去見客戶時,這個AI就從“教練”變成了他們的“全能軍師”和“超級裝備”。它會立刻把這位客戶的詳細資料、過往合作記錄、甚至連這次會談的策略建議都直接推送到銷售人員眼前,讓他們胸有成竹。“這是我們未來要推進的方向,我們內(nèi)部在用AI首先整合數(shù)據(jù),然后嘗試打造整個智慧化、智能化的商業(yè)物流和渠道管理。”
“快贏”與“詩和遠方”的平衡術(shù)
不過,現(xiàn)在大家談到AI,尤其是生成式AI,大家都普遍關(guān)心投資回報率(ROI),或者是實用性問題,當被問及如何評估“AI的ROI”時,林錦斌坦誠,這是他作為數(shù)字化決策者時刻需要思考的問題。他給出了一套清晰的戰(zhàn)略打法:
第一,Quick Win(快贏)。他解釋道,“Quick Win的確定性要高,且會有明確的量化價值結(jié)果,從ROI角度來看,我會對它的價值創(chuàng)造的指標量化,并提前要求。比如初期達到0.5,后期可能要達到1。”
這些“快贏”項目,不僅能沉淀團隊自身對于AI生產(chǎn)力的應(yīng)用能力,更能將創(chuàng)造出來的價值“反哺”給更宏大的目標。
第二,要瞄準詩和遠方。“比如決策智能體,不可能是一蹴而就的,一個個決策智能體,要拼成一個有機的整體,這個過程要持續(xù)投入,不過這也是因為Quick Win打下了地基。”林錦斌解釋說,“換言之,在Quick Win這塊,我們盡可能鋪開。首先,把果實摘下來儲備好;然后,再對平臺能力進行投資。最后,把它打包成一個完整的、決策層能夠接受的整體戰(zhàn)略方案。”
這是一種高明的平衡術(shù):用一個個看得見、摸得著的“快贏”項目,為那些關(guān)乎未來的“詩和遠方”積蓄糧草和彈藥,確保創(chuàng)新既不因急功近利而迷失方向,也不因好高騖遠而無以為繼。
“相信,才能看見”
技術(shù)和戰(zhàn)略的背后,終究是人與文化。當被問及為何在眾多合作方中選擇亞馬遜云科技時,林錦斌的回答超越了技術(shù)和商業(yè)層面,直指一個更深層次的詞——“相信”。
“對于創(chuàng)新文化,我們與亞馬遜云科技同頻共振,而以下這種創(chuàng)新文化的導(dǎo)入對復(fù)星醫(yī)藥來說非常重要。” 他提到了一個細節(jié):在前一段時間,雙方曾共同組織工作坊,核心阻力就是創(chuàng)新的方法論——“大家對于AI技術(shù)應(yīng)用的認知要達成幾個共識:首先,不能極度保守,要保持開放的心態(tài);其次,不能認為它是一個神器,對結(jié)果不能過于樂觀。”
具體的做法是:首先,從認知和預(yù)期上,跟科學(xué)家達成共識;然后,根據(jù)具體的創(chuàng)新方法論,找準問題并設(shè)定相應(yīng)的指標,它應(yīng)該是可量化、可跟蹤、可動員的,一步一步地往前推進,碰到問題之后以混合團隊的方式進行討論,得出一個大家有共識的結(jié)論,再往下一步進行。
這種“同頻共振”,體現(xiàn)在對試錯文化的擁抱上。林錦斌深知,生成式AI項目落地后,會產(chǎn)生大量“不理想的案例”,這需要持續(xù)的運營和迭代。“比如碰到企業(yè)知識資產(chǎn)的逐步迭代、生成式AI的幻覺問題等,我們需要持續(xù)跟蹤和運營這些不理想的案例,擁抱試錯的文化,才能確保業(yè)務(wù)能夠持久地跑下去,并越跑越好。”
而亞馬遜云科技愿意在這種“不確定”中投入,與復(fù)星醫(yī)藥共同探索,而非僅僅追求短期的大額訂單,這在林錦斌看來至關(guān)重要。“有的時候,相信才能看見,”他感慨道,“我覺得亞馬遜云科技屬于后者,所以說我們能夠快速達成共識,往前推進。”
當然,光有文化和方法論還不夠,必須要有好用的工具。林錦斌表示,復(fù)星醫(yī)藥正在雙管齊下:
“第一,對于我們的技術(shù)人員,他應(yīng)該要有一個好用的工程化的開發(fā)平臺。”他透露,團隊正在全球范圍內(nèi)尋找最佳方案,包括基于亞馬遜云科技的和優(yōu)秀的開源軟件。
“第二,對于業(yè)務(wù)人員,我們希望構(gòu)建一個低門檻的、便捷的眾創(chuàng)平臺,支撐我們的科學(xué)家能夠自主去搭建符合他們個性化需求的AI系統(tǒng)。”
在這方面,亞馬遜云科技提供堅實的幫助,這家公司表示其一直是醫(yī)療與生命科學(xué)行業(yè)數(shù)字化轉(zhuǎn)型和創(chuàng)新的推動者和支持者。早在2013年,亞馬遜云科技就組建了全球醫(yī)療和生命科學(xué)專業(yè)團隊,服務(wù)著數(shù)千家行業(yè)客戶,比如輝瑞、拜爾、羅氏、默沙東等。在中國,他們與數(shù)十家本地伙伴合作,服務(wù)超過400家客戶。除了通用AI服務(wù)Amazon Bedrock、Amazon SageMaker等,他們還針對行業(yè)特性,構(gòu)建了如Amazon HealthOmics、Amazon Comprehend Medical等專用服務(wù),并進一步結(jié)合中國市場需求,推出了醫(yī)學(xué)內(nèi)容生成中心(Medical Insights Hub)、蛋白質(zhì)結(jié)構(gòu)預(yù)測工作臺(Protein Folding Workbench)等本地化解決方案。
看向未來,復(fù)星醫(yī)藥的AI戰(zhàn)略將如何演進?林錦斌表達了“開放”的心態(tài):“我們對于所有能夠給我們帶來價值創(chuàng)造的合作伙伴,都是非常歡迎的。”
好文章,需要你的鼓勵
騰訊ARC實驗室推出AudioStory系統(tǒng),首次實現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù),通過交錯式推理生成、解耦橋接機制和漸進式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準測試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時學(xué)習(xí)外觀和運動信息,顯著解決了當前視頻生成模型中動作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個線性層就能大幅提升運動質(zhì)量,在多項測試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實驗室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評測基準,通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時顯著提升人性化交互水平,為AI價值觀對齊提供了可行技術(shù)路徑。
谷歌DeepMind團隊開發(fā)的GraphCast是一個革命性的AI天氣預(yù)測模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報,準確性超越傳統(tǒng)方法90%的指標。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來了效率和精度的雙重突破。
關(guān)注科技創(chuàng)新、技術(shù)投資。
以文會友,左手硬核科技,右手浪漫主義。