在上海舉辦的2023世界人工智能大會上,AI大模型對醫(yī)療、制藥行業(yè)帶來的創(chuàng)新想象,成為一個熱點話題,大模型時代后,多模態(tài)AI通用化成為醫(yī)療領域未來趨勢,而醫(yī)療與每個人息息相關,AI賦能醫(yī)療創(chuàng)新,更是每個人的呼聲,在這樣的背景下,至頂科技采訪了復旦大學復雜體系多尺度研究院院長馬劍鵬,馬劍鵬提醒,AI賦能了醫(yī)藥創(chuàng)新,但AI不是萬能的,不要過分迷信AI。
圖:復旦大學復雜體系多尺度研究院院長 馬劍鵬
至頂科技:復雜體系多尺度研究究竟是什么樣的研究,AI為這一研究起到了什么樣的作用?
馬劍鵬:我們是做生物計算的研究,復雜體系多尺度研究院致力于發(fā)展全新而有效的、貫通微觀分子結構直至宏觀醫(yī)學成像的多尺度影像分析技術,為解析生命奧秘提供前所未有的,囊括分子、細胞、組織、器官乃至整個生物體的時空影像數(shù)據(jù)。面向國際前沿,研究院利用用人工智能、大數(shù)據(jù)方法結合傳統(tǒng)實驗手段展開分子生物學、化學、物理學等交叉領域的研究。
我們是做分子層面的研究,AI賦能醫(yī)藥的創(chuàng)新,不管是宏觀的醫(yī)學問題,還是微觀的制藥問題,都在發(fā)揮作用。比如說,制藥,AI可以幫助加快醫(yī)藥研發(fā)的速度和安全性,這是毋庸置疑的。無論是實驗,還是計算,AI都在起賦能作用,比如今天的醫(yī)學創(chuàng)新,在宏觀層面上AI在賦能。說到藥物又是一個微觀問題,不管是大分子,還是小分子,抑或是中藥,也有有效成分問題,在制藥這樣的微觀層面,AI也在賦能。
在今天AI發(fā)展的這個拐點時刻,技術的長處和短處都要被看到、被看請。
至頂科技:AI的哪些負面影響需要讓我們引起注意?
馬劍鵬:AI大模型訓練是平均的,在某些應用場景,可以做的比大多數(shù)人好,可能在頭腦風暴的時候,會需要這樣的訓練結果,但在大部分場景里,是需要精準答案的。如果正兒八經(jīng)的胡說八道,在人命關天的時候,還是不是可信,這就是一個很嚴肅的問題。
針對某個問題時候,在人群里是大平均,但針對某個人的健康問題,又是個性化的。每個人都不一樣,每個人又要隨著時間變化來看。可能今天你的指標是正常的,但是隨著時間的推移,也會發(fā)生變化。
更重要的是,以人的個體為單位來看,每個人天生稟賦不同,會有很大差距。有的人經(jīng)常會喝酒吃肉,這不是一個好的生活習慣,他可能很長壽,有的人過得謹小慎微,卻不能長壽。有些人血壓高的兩百,他工作、生活都很正常,有些人血壓一百五,可能就渾身不自在。這些都決定了,每個人都是不一樣的個體,是縱向的個體,而大模型是橫向思維,每個人是大模型中的平均數(shù)。
在醫(yī)學領域,特別是在今天精準醫(yī)療的背景之下,大家去醫(yī)院,檢查完,要么是生病,要么就是健健康康的,但其實在健康和生病之間,還存在一個亞健康的狀態(tài)。有些提示的指標,顯示亞健康問題,會在大模型的人群里被打了平均分,但有些問題是針對一個個個性化的。
類似這樣的問題,就是縱向問題,這些縱向問題問題,就需要個性化的解決,就是AI所不能的。
至頂科技:大模型對科研的最大幫助在哪里?
馬劍鵬:作為一個AI的用戶,用AI來獲取知識的速度很快,學一個專業(yè),可以很快掌握。如果把通用模型訓練成一個科研助理,那會對科研有很大幫助;抑或是訓練成一個競爭對手,尋求去打敗這個對手,AI可以發(fā)揮很好的作用。
不只是在西醫(yī)、制藥的層面,在中醫(yī)的范疇里,中醫(yī)的望、聞、問、切的逐漸智能化也是可及的。
好文章,需要你的鼓勵
新加坡國立大學研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓練AI玩簡單撲克游戲就能讓其數(shù)學推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學題目作為訓練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉移到數(shù)學解題中,為AI訓練提供了新思路。
同濟大學團隊開發(fā)的GIGA-ToF技術通過融合多幀圖像的"圖結構"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術利用圖像間的不變幾何關系,結合深度學習和數(shù)學優(yōu)化方法,在合成數(shù)據(jù)集上實現(xiàn)37.9%的精度提升,并在真實設備上展現(xiàn)出色泛化能力,為機器人、AR和自動駕駛等領域提供更可靠的3D視覺解決方案。
伊利諾伊大學研究團隊通過對比實驗發(fā)現(xiàn),經(jīng)過強化學習訓練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實際提升推理準確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構聯(lián)合提出SparseLoRA技術,通過動態(tài)稀疏性實現(xiàn)大語言模型訓練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓練效率,已在多個任務上驗證有效性。
琢磨技術發(fā)展史,關注算力產(chǎn)業(yè),關注數(shù)字經(jīng)濟。
參與編寫了《開源法則》(人民郵電出版社),《人類計算簡史:從中國算盤到數(shù)字經(jīng)濟》(中共中央黨校出版社)。