在上海舉辦的2023世界人工智能大會上,AI大模型對醫(yī)療、制藥行業(yè)帶來的創(chuàng)新想象,成為一個熱點話題,大模型時代后,多模態(tài)AI通用化成為醫(yī)療領(lǐng)域未來趨勢,而醫(yī)療與每個人息息相關(guān),AI賦能醫(yī)療創(chuàng)新,更是每個人的呼聲,在這樣的背景下,至頂科技采訪了復旦大學復雜體系多尺度研究院院長馬劍鵬,馬劍鵬提醒,AI賦能了醫(yī)藥創(chuàng)新,但AI不是萬能的,不要過分迷信AI。
圖:復旦大學復雜體系多尺度研究院院長 馬劍鵬
至頂科技:復雜體系多尺度研究究竟是什么樣的研究,AI為這一研究起到了什么樣的作用?
馬劍鵬:我們是做生物計算的研究,復雜體系多尺度研究院致力于發(fā)展全新而有效的、貫通微觀分子結(jié)構(gòu)直至宏觀醫(yī)學成像的多尺度影像分析技術(shù),為解析生命奧秘提供前所未有的,囊括分子、細胞、組織、器官乃至整個生物體的時空影像數(shù)據(jù)。面向國際前沿,研究院利用用人工智能、大數(shù)據(jù)方法結(jié)合傳統(tǒng)實驗手段展開分子生物學、化學、物理學等交叉領(lǐng)域的研究。
我們是做分子層面的研究,AI賦能醫(yī)藥的創(chuàng)新,不管是宏觀的醫(yī)學問題,還是微觀的制藥問題,都在發(fā)揮作用。比如說,制藥,AI可以幫助加快醫(yī)藥研發(fā)的速度和安全性,這是毋庸置疑的。無論是實驗,還是計算,AI都在起賦能作用,比如今天的醫(yī)學創(chuàng)新,在宏觀層面上AI在賦能。說到藥物又是一個微觀問題,不管是大分子,還是小分子,抑或是中藥,也有有效成分問題,在制藥這樣的微觀層面,AI也在賦能。
在今天AI發(fā)展的這個拐點時刻,技術(shù)的長處和短處都要被看到、被看請。
至頂科技:AI的哪些負面影響需要讓我們引起注意?
馬劍鵬:AI大模型訓練是平均的,在某些應用場景,可以做的比大多數(shù)人好,可能在頭腦風暴的時候,會需要這樣的訓練結(jié)果,但在大部分場景里,是需要精準答案的。如果正兒八經(jīng)的胡說八道,在人命關(guān)天的時候,還是不是可信,這就是一個很嚴肅的問題。
針對某個問題時候,在人群里是大平均,但針對某個人的健康問題,又是個性化的。每個人都不一樣,每個人又要隨著時間變化來看??赡芙裉炷愕闹笜耸钦5?,但是隨著時間的推移,也會發(fā)生變化。
更重要的是,以人的個體為單位來看,每個人天生稟賦不同,會有很大差距。有的人經(jīng)常會喝酒吃肉,這不是一個好的生活習慣,他可能很長壽,有的人過得謹小慎微,卻不能長壽。有些人血壓高的兩百,他工作、生活都很正常,有些人血壓一百五,可能就渾身不自在。這些都決定了,每個人都是不一樣的個體,是縱向的個體,而大模型是橫向思維,每個人是大模型中的平均數(shù)。
在醫(yī)學領(lǐng)域,特別是在今天精準醫(yī)療的背景之下,大家去醫(yī)院,檢查完,要么是生病,要么就是健健康康的,但其實在健康和生病之間,還存在一個亞健康的狀態(tài)。有些提示的指標,顯示亞健康問題,會在大模型的人群里被打了平均分,但有些問題是針對一個個個性化的。
類似這樣的問題,就是縱向問題,這些縱向問題問題,就需要個性化的解決,就是AI所不能的。
至頂科技:大模型對科研的最大幫助在哪里?
馬劍鵬:作為一個AI的用戶,用AI來獲取知識的速度很快,學一個專業(yè),可以很快掌握。如果把通用模型訓練成一個科研助理,那會對科研有很大幫助;抑或是訓練成一個競爭對手,尋求去打敗這個對手,AI可以發(fā)揮很好的作用。
不只是在西醫(yī)、制藥的層面,在中醫(yī)的范疇里,中醫(yī)的望、聞、問、切的逐漸智能化也是可及的。
好文章,需要你的鼓勵
騰訊ARC實驗室推出AudioStory系統(tǒng),首次實現(xiàn)AI根據(jù)復雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù),通過交錯式推理生成、解耦橋接機制和漸進式訓練,能夠?qū)碗s指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準測試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時學習外觀和運動信息,顯著解決了當前視頻生成模型中動作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個線性層就能大幅提升運動質(zhì)量,在多項測試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實用化應用奠定了重要基礎(chǔ)。
上海AI實驗室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓練數(shù)據(jù)集和MM-AlignBench評測基準,通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時顯著提升人性化交互水平,為AI價值觀對齊提供了可行技術(shù)路徑。
谷歌DeepMind團隊開發(fā)的GraphCast是一個革命性的AI天氣預測模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預報,準確性超越傳統(tǒng)方法90%的指標。該模型采用圖神經(jīng)網(wǎng)絡技術(shù),通過學習40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預測方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學領(lǐng)域帶來了效率和精度的雙重突破。
琢磨技術(shù)發(fā)展史,關(guān)注算力產(chǎn)業(yè),關(guān)注數(shù)字經(jīng)濟。
參與編寫了《開源法則》(人民郵電出版社),《人類計算簡史:從中國算盤到數(shù)字經(jīng)濟》(中共中央黨校出版社)。