av天堂久久天堂色综合,最近中文字幕mv免费高清在线,在线a级毛片免费视频,av动漫,中文字幕精品亚洲无线码一区

微信掃一掃，關(guān)注公眾號

科技行者
算力行者

見證連接與計算的「力量」

韓國大學(xué)團隊推出CoTox：讓AI像毒理學(xué)專家一樣思考藥物毒性

人工智能毒性預(yù)測思維鏈推理

韓國大學(xué)團隊推出CoTox：讓AI像毒理學(xué)專家一樣思考藥物毒性

作者：科技行者

2025-08-11 14:28

分享至：

韓國大學(xué)研究團隊開發(fā)的CoTox框架通過整合化學(xué)結(jié)構(gòu)、生物通路和基因本體論信息，讓AI能夠像毒理學(xué)專家一樣進行逐步推理，預(yù)測藥物的多器官毒性。該方法在六種毒性類型預(yù)測中平均F1分?jǐn)?shù)達(dá)到0.663，顯著超越傳統(tǒng)機器學(xué)習(xí)和深度學(xué)習(xí)方法，并能提供詳細(xì)的毒性機制解釋。

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

2025-08-11 14:28 ? 科技行者

在現(xiàn)代藥物研發(fā)的漫長旅程中，藥物毒性一直是讓制藥公司頭疼不已的"攔路虎"。據(jù)統(tǒng)計，高達(dá)90%的候選藥物會在開發(fā)過程中失敗，而毒性問題正是其中的主要元兇。更令人擔(dān)憂的是，一些藥物即便成功上市，也可能因為后續(xù)發(fā)現(xiàn)的嚴(yán)重副作用而被迫召回，給患者安全和制藥公司都帶來巨大損失。

這項由韓國大學(xué)計算機科學(xué)與工程系的樸珠言（Jueon Park）領(lǐng)導(dǎo)的研究團隊開發(fā)的創(chuàng)新框架，發(fā)表于2024年8月的arXiv預(yù)印本（arXiv:2508.03159v1），為這一難題提供了全新的解決思路。有興趣深入了解的讀者可以通過https://github.com/dmis-lab/CoTox訪問完整的代碼和實驗細(xì)節(jié)。

傳統(tǒng)的藥物毒性預(yù)測就像是盲人摸象，機器學(xué)習(xí)模型往往只能從分子結(jié)構(gòu)的表面特征中尋找規(guī)律，卻無法真正理解藥物在人體內(nèi)發(fā)生的復(fù)雜生物機制。更糟糕的是，這些模型需要大量的實驗數(shù)據(jù)進行訓(xùn)練，而且給出預(yù)測結(jié)果時就像"黑盒子"一樣，無法解釋為什么某個藥物會產(chǎn)生毒性，這讓研究人員很難相信和應(yīng)用這些預(yù)測結(jié)果。

近年來，隨著ChatGPT等大語言模型的興起，研究人員開始探索用AI來預(yù)測藥物毒性。就像讓一個博學(xué)的助手閱讀藥物的化學(xué)結(jié)構(gòu)式，然后判斷這個藥物是否有害。然而，現(xiàn)有的方法存在三個關(guān)鍵問題。首先，這些方法主要使用SMILES字符串來表示分子結(jié)構(gòu)，這就像用一串密碼來描述一個復(fù)雜的建筑物，對于主要處理自然語言的AI來說實在太難理解了。其次，它們只關(guān)注藥物的化學(xué)結(jié)構(gòu)，完全忽略了藥物進入人體后與各種生物通路的復(fù)雜互動，這就像只看汽車的外形就想預(yù)測它的性能一樣不靠譜。最后，雖然大語言模型具備逐步推理的能力，但現(xiàn)有方法并沒有充分利用這一優(yōu)勢來提供可解釋的預(yù)測過程。

為了解決這些問題，研究團隊開發(fā)了CoTox框架，這就像培養(yǎng)了一位既懂化學(xué)又懂生物學(xué)的AI毒理學(xué)專家。CoTox的創(chuàng)新之處在于三個方面的突破。

首先，CoTox摒棄了難以理解的SMILES字符串，改用IUPAC名稱來表示化學(xué)分子。IUPAC名稱是國際純粹與應(yīng)用化學(xué)聯(lián)合會制定的標(biāo)準(zhǔn)化學(xué)命名法，就像給每個化學(xué)分子起了一個既科學(xué)又容易理解的"學(xué)名"。比如，阿司匹林的IUPAC名稱是"2-乙酰氧基苯甲酸"，從這個名字就能看出它含有乙?；⒘u基和苯環(huán)等重要結(jié)構(gòu)特征，這比一串無意義的字符代碼要直觀得多。

其次，CoTox不僅考慮藥物的化學(xué)結(jié)構(gòu)，還整合了生物通路（Pathway）和基因本體論（GO）信息。生物通路就像細(xì)胞內(nèi)的"工作流程圖"，描述了蛋白質(zhì)、基因等生物分子如何協(xié)同工作來完成特定功能。基因本體論則是一個標(biāo)準(zhǔn)化的生物學(xué)術(shù)語體系，用來描述基因和蛋白質(zhì)的功能。通過整合這些信息，CoTox能夠理解藥物進入人體后可能影響哪些生物過程，就像一個經(jīng)驗豐富的醫(yī)生能夠預(yù)判藥物可能產(chǎn)生的連鎖反應(yīng)一樣。

第三，CoTox采用了"思維鏈"（Chain-of-Thought）推理策略，讓AI像人類專家一樣一步步分析問題。當(dāng)面對一個新藥物時，CoTox會按照系統(tǒng)性的步驟進行分析：首先檢查相關(guān)的生物通路，判斷它們與毒性機制的關(guān)聯(lián)性；然后分析基因本體論信息，理解可能受影響的生物過程和分子功能；接著從IUPAC名稱中提取化學(xué)結(jié)構(gòu)特征，識別可能導(dǎo)致毒性的結(jié)構(gòu)元素；最后綜合所有信息，給出詳細(xì)的推理過程和毒性預(yù)測結(jié)果。

一、數(shù)據(jù)準(zhǔn)備：搭建AI毒理學(xué)專家的知識庫

就像培養(yǎng)一個優(yōu)秀的毒理學(xué)專家需要扎實的知識基礎(chǔ)一樣，CoTox的成功運作需要高質(zhì)量的數(shù)據(jù)支撐。研究團隊從比較毒物基因組學(xué)數(shù)據(jù)庫（CTD）中提取了豐富的生物學(xué)信息。CTD數(shù)據(jù)庫就像一個巨大的"毒性百科全書"，收錄了化學(xué)物質(zhì)、基因、通路和基因本體論術(shù)語之間的精心整理的關(guān)聯(lián)關(guān)系。

然而，CTD數(shù)據(jù)庫包含的信息過于龐雜，其中許多生物過程與毒性并無直接關(guān)系。為了篩選出真正有用的信息，研究團隊讓GPT-4o充當(dāng)"智能篩選器"，通過語義分析來保留那些與毒性相關(guān)的通路和基因本體論術(shù)語。這個過程就像讓一個經(jīng)驗豐富的圖書管理員從海量文獻中挑選出與特定主題最相關(guān)的資料。

在化學(xué)信息方面，團隊使用PubChemPy工具從PubChem數(shù)據(jù)庫中獲取每個化合物的IUPAC名稱。PubChem是全球最大的化學(xué)信息數(shù)據(jù)庫之一，包含了數(shù)百萬種化學(xué)物質(zhì)的詳細(xì)信息。通過這種方式，每個待分析的藥物都獲得了標(biāo)準(zhǔn)化、人類可讀的化學(xué)名稱，為后續(xù)的AI分析奠定了基礎(chǔ)。

最終，每個化合物的分析提示都包含三個核心要素：IUPAC化學(xué)名稱、篩選后的毒性相關(guān)通路列表，以及相關(guān)的基因本體論術(shù)語。這種多維度的信息整合為AI提供了全面理解藥物毒性的必要背景。

二、AI推理過程：模擬專家級毒性分析

CoTox的核心創(chuàng)新在于其精心設(shè)計的提示系統(tǒng)，這個系統(tǒng)就像為AI制定了一套專業(yè)的毒理學(xué)分析流程。整個推理過程分為系統(tǒng)提示和用戶提示兩個部分，共同引導(dǎo)AI進行專家級的毒性分析。

在系統(tǒng)提示中，AI被明確定義為化學(xué)信息學(xué)和毒理學(xué)專家的角色。系統(tǒng)要求AI基于三類關(guān)鍵信息進行分析：通路與毒性機制的關(guān)聯(lián)、基因本體論術(shù)語的生物學(xué)含義，以及IUPAC名稱反映的化學(xué)結(jié)構(gòu)特征。為了確保輸出的一致性和可用性，AI被要求嚴(yán)格按照J(rèn)SON格式返回結(jié)果，避免任何額外的評論或解釋。

用戶提示則更加具體和實用，指導(dǎo)AI對六種器官特異性毒性進行預(yù)測：心臟毒性、血液系統(tǒng)毒性、生殖毒性、肝臟毒性、肺部毒性和腎臟毒性。每種毒性類型的分析都遵循標(biāo)準(zhǔn)化的四步流程。

第一步是通路分析，AI需要審視輸入的生物通路信息，判斷這些通路與特定毒性機制的相關(guān)程度。比如，如果分析心臟毒性，AI會特別關(guān)注與心肌功能、心律調(diào)節(jié)、心臟發(fā)育等相關(guān)的信號通路。

第二步是基因本體論分析，AI需要解讀相關(guān)的生物過程和分子功能術(shù)語，理解它們?nèi)绾斡绊懠?xì)胞的正常運作。例如，"氧化應(yīng)激調(diào)節(jié)"這樣的術(shù)語可能暗示化合物會干擾細(xì)胞的抗氧化防御系統(tǒng)。

第三步是結(jié)構(gòu)特征分析，AI通過IUPAC名稱識別化學(xué)結(jié)構(gòu)中可能導(dǎo)致毒性的關(guān)鍵元素。某些化學(xué)基團，如鹵素、芳香環(huán)或金屬離子，往往與特定類型的毒性相關(guān)。

第四步是綜合推理，AI需要將前三步的發(fā)現(xiàn)整合成連貫的毒性機制解釋，就像一個經(jīng)驗豐富的毒理學(xué)家綜合各種證據(jù)得出最終結(jié)論一樣。

三、實驗設(shè)計：全面評估AI專家的能力

為了驗證CoTox框架的有效性，研究團隊設(shè)計了全面而嚴(yán)謹(jǐn)?shù)膶Ρ葘嶒?。他們選擇了UniTox數(shù)據(jù)集作為評估基準(zhǔn)，這個數(shù)據(jù)集包含了2418種FDA批準(zhǔn)藥物的多器官毒性信息，是通過讓GPT-4o分析FDA藥物標(biāo)簽而構(gòu)建的高質(zhì)量數(shù)據(jù)集。

在模型對比方面，團隊既包括了傳統(tǒng)的機器學(xué)習(xí)和深度學(xué)習(xí)方法，也涵蓋了各種大語言模型的應(yīng)用策略。傳統(tǒng)方法中，XGBoost代表了基于梯度提升的決策樹方法，在表格數(shù)據(jù)處理上表現(xiàn)優(yōu)異。Chemprop則是專門設(shè)計用于分子性質(zhì)預(yù)測的深度學(xué)習(xí)模型，基于圖神經(jīng)網(wǎng)絡(luò)架構(gòu)，能夠直接從SMILES字符串學(xué)習(xí)分子表示。

在大語言模型的應(yīng)用策略上，團隊對比了四種不同的提示方法。零樣本學(xué)習(xí)讓模型僅基于分子輸入直接預(yù)測毒性，沒有任何示例或推理指導(dǎo)。少樣本學(xué)習(xí)則提供四個輸入輸出示例，幫助模型通過上下文學(xué)習(xí)理解任務(wù)要求。思維鏈推理要求模型在給出預(yù)測前進行逐步分析，鼓勵對結(jié)構(gòu)特征的深入解讀。而CoTox方法則在思維鏈基礎(chǔ)上進一步整合了生物通路和基因本體論信息。

為了公平比較不同提示策略的效果，所有基于大語言模型的實驗都使用GPT-4o進行，從而排除了模型架構(gòu)差異的影響。評估指標(biāo)方面，團隊選擇了F1分?jǐn)?shù)作為主要評估標(biāo)準(zhǔn)，因為它能很好地平衡精確率和召回率，特別適合二分類任務(wù)的評估。

四、實驗結(jié)果：AI專家展現(xiàn)出色表現(xiàn)

實驗結(jié)果充分證明了CoTox框架的有效性和先進性。在所有對比方法中，CoTox取得了最高的平均F1分?jǐn)?shù)0.663，明顯超過了傳統(tǒng)機器學(xué)習(xí)方法XGBoost的0.576和深度學(xué)習(xí)方法Chemprop的0.619。

更詳細(xì)的分析顯示，僅使用化學(xué)結(jié)構(gòu)信息的各種提示策略表現(xiàn)都比較有限。零樣本學(xué)習(xí)的表現(xiàn)最差，SMILES和IUPAC輸入的平均F1分?jǐn)?shù)分別只有0.370和0.368，說明在沒有示例或推理指導(dǎo)的情況下，大語言模型難以有效地從分子結(jié)構(gòu)推斷毒性。少樣本學(xué)習(xí)通過提供示例略有改善，但提升幅度有限。有趣的是，在純結(jié)構(gòu)信息的情況下，SMILES和IUPAC格式的性能差異微乎其微，說明結(jié)構(gòu)表示格式的選擇在缺乏生物學(xué)背景時并不關(guān)鍵。

然而，當(dāng)引入生物過程信息后，情況發(fā)生了顯著變化。僅使用生物通路和基因本體論信息的BioProcess-CoT方法就達(dá)到了0.624的F1分?jǐn)?shù)，超過了所有基于純結(jié)構(gòu)信息的方法。這個結(jié)果有力地證明了生物學(xué)背景信息在毒性預(yù)測中的重要作用，特別是對于理解器官特異性毒性機制而言。

CoTox的成功在于巧妙地結(jié)合了化學(xué)結(jié)構(gòu)和生物學(xué)信息。與僅基于結(jié)構(gòu)的思維鏈方法相比，CoTox的性能提升超過0.25個F1分?jǐn)?shù)點，這在機器學(xué)習(xí)評估中是相當(dāng)顯著的改進。在具體的毒性類型上，血液系統(tǒng)毒性和肝臟毒性的預(yù)測效果最好，F(xiàn)1分?jǐn)?shù)分別達(dá)到0.817和0.768，而肺部毒性和腎臟毒性相對較難預(yù)測，F(xiàn)1分?jǐn)?shù)均低于0.57。

五、不同AI模型的表現(xiàn)：各有千秋的智能專家

為了全面評估CoTox框架的通用性，研究團隊在多種不同類型的大語言模型上進行了測試，結(jié)果展現(xiàn)了各個模型的獨特優(yōu)勢和局限性。

在通用大語言模型中，Gemini-2.5-Pro表現(xiàn)最為出色，平均F1分?jǐn)?shù)達(dá)到0.700，在心臟毒性、生殖毒性和腎臟毒性預(yù)測方面都取得了最高分?jǐn)?shù)。這個結(jié)果表明Gemini-2.5-Pro具有優(yōu)秀的多領(lǐng)域推理能力，能夠有效整合化學(xué)和生物學(xué)信息。GPT-4o和Llama3.1-8B也表現(xiàn)不俗，平均F1分?jǐn)?shù)分別為0.663和0.685，在血液系統(tǒng)毒性和肝臟毒性預(yù)測方面尤其擅長。

值得注意的是，參數(shù)規(guī)模更大的Llama3.1-70B并沒有表現(xiàn)出明顯優(yōu)勢，反而在某些毒性類型上表現(xiàn)不穩(wěn)定。雖然它在血液系統(tǒng)毒性預(yù)測上取得了最高分0.835，但在生殖毒性和肺部毒性預(yù)測上的表現(xiàn)卻相對較差，導(dǎo)致整體平均分只有0.615。這個現(xiàn)象提醒我們，模型規(guī)模并不總是性能的決定因素，模型架構(gòu)和訓(xùn)練方式同樣重要。

特別有趣的是專門針對生物醫(yī)學(xué)領(lǐng)域優(yōu)化的TxGemma模型表現(xiàn)。盡管這個模型在大規(guī)模生物醫(yī)學(xué)數(shù)據(jù)上進行了精心調(diào)優(yōu)，但在CoTox任務(wù)上的表現(xiàn)卻最為遜色，平均F1分?jǐn)?shù)只有0.421。研究團隊推測，這可能是因為TxGemma主要被訓(xùn)練來從化學(xué)結(jié)構(gòu)推斷分子性質(zhì)，而CoTox框架要求模型同時理解和整合生物通路、基因本體論等多層次信息，超出了該模型的設(shè)計預(yù)期。

推理專門化的模型展現(xiàn)了獨特的特點。OpenAI的o3、DeepSeek-R1和Qwen3-32B等模型在使用IUPAC輸入時相比SMILES輸入都有顯著提升，改進幅度分別達(dá)到15.6%、10.24%和15.02%。這個結(jié)果強烈暗示，人類可讀的化學(xué)命名格式更適合這些專門優(yōu)化推理能力的模型，它們能夠更好地從IUPAC名稱中提取結(jié)構(gòu)信息并與生物學(xué)背景相關(guān)聯(lián)。

相比之下，Gemini-2.5-Pro在IUPAC和SMILES輸入之間只有微小的性能差異，這表明該模型可能已經(jīng)具備了較強的化學(xué)結(jié)構(gòu)理解能力，能夠有效處理不同格式的分子表示。

六、化學(xué)表示格式的影響：IUPAC名稱的優(yōu)勢

CoTox框架的一個重要創(chuàng)新是使用IUPAC名稱而非傳統(tǒng)的SMILES字符串來表示化學(xué)分子。實驗結(jié)果清晰地證明了這一選擇的明智性，特別是對于具備推理能力的AI模型而言。

SMILES字符串雖然緊湊且便于計算機處理，但對于主要在自然語言上訓(xùn)練的大語言模型來說，理解起來相當(dāng)困難。SMILES使用特殊符號和簡化規(guī)則來編碼分子結(jié)構(gòu)，就像一種專門的"化學(xué)密碼"，缺乏語義上的直觀性。相比之下，IUPAC名稱采用標(biāo)準(zhǔn)化的化學(xué)命名規(guī)則，用自然語言描述分子的結(jié)構(gòu)特征，包含了關(guān)于環(huán)系、官能團和位置信息等化學(xué)上有意義的信息。

研究團隊通過具體的案例分析展示了這種差異。以藥物依托度酸（Etodolac）為例，其SMILES表示是一串復(fù)雜的字符編碼，而IUPAC名稱明確描述了"吲哚吡喃融合環(huán)"和"羧酸基團"等關(guān)鍵結(jié)構(gòu)特征。當(dāng)AI基于SMILES進行推理時，只能做一些模糊的結(jié)構(gòu)描述，而基于IUPAC名稱時，它能夠準(zhǔn)確識別具體的化學(xué)基團，并將這些結(jié)構(gòu)特征與潛在的毒性機制聯(lián)系起來。

對于另一個藥物依那普利（Enalapril），IUPAC格式讓AI能夠識別出"苯基丁酸"和"二肽"結(jié)構(gòu)，從而更準(zhǔn)確地將結(jié)構(gòu)特征映射到可能的毒性通路。這種精確的結(jié)構(gòu)識別能力直接轉(zhuǎn)化為更可靠的毒性預(yù)測和更有說服力的機制解釋。

這些發(fā)現(xiàn)不僅驗證了IUPAC名稱在CoTox框架中的有效性，也為未來的AI化學(xué)應(yīng)用提供了重要啟示。當(dāng)AI需要理解和推理化學(xué)結(jié)構(gòu)時，選擇更接近自然語言的表示格式可能比傳統(tǒng)的機器可讀格式更有優(yōu)勢。

七、案例分析：AI專家的推理過程

為了深入理解CoTox的工作機制，研究團隊詳細(xì)分析了AI對普萘洛爾（Propranolol）這一經(jīng)典β阻滯劑的毒性推理過程。這個案例生動地展示了CoTox如何像人類毒理學(xué)專家一樣進行系統(tǒng)性分析。

在心臟毒性分析中，Gemini-2.5-Pro展現(xiàn)出了令人印象深刻的專業(yè)推理能力。AI首先從生物通路角度分析，識別出"內(nèi)在凋亡通路"和"氧化應(yīng)激"等關(guān)鍵機制。這些推理是有堅實科學(xué)基礎(chǔ)的，因為已有研究證實普萘洛爾等β阻滯劑確實可以激活心肌細(xì)胞的線粒體凋亡途徑，并增加活性氧水平。

從基因本體論角度，AI關(guān)注到"氧化應(yīng)激誘導(dǎo)細(xì)胞死亡的正調(diào)節(jié)"等術(shù)語，這與心臟毒性的已知機制高度一致。在結(jié)構(gòu)分析方面，AI準(zhǔn)確識別出普萘洛爾的"丙胺側(cè)鏈"結(jié)構(gòu)，并正確關(guān)聯(lián)到其與β腎上腺素能受體的結(jié)合能力。AI進一步推理出，作為β阻滯劑，該化合物會降低心率和收縮力，在某些情況下可能觸發(fā)心肌細(xì)胞的凋亡途徑。

在肝臟毒性分析中，AI的推理同樣精確專業(yè)。它強調(diào)了"CYP2E1反應(yīng)"和"異生素代謝"等通路的重要性，這些正是藥物性肝損傷的經(jīng)典機制。AI從IUPAC名稱中識別出"萘環(huán)"結(jié)構(gòu)，并準(zhǔn)確推斷出這種多環(huán)芳香烴結(jié)構(gòu)可能通過P450酶系統(tǒng)代謝產(chǎn)生反應(yīng)性環(huán)氧化物中間體。

這種分析的準(zhǔn)確性令人驚嘆。萘環(huán)結(jié)構(gòu)確實容易被CYP450酶氧化形成環(huán)氧化物和醌類化合物，這些活性代謝產(chǎn)物能夠引起氧化應(yīng)激、脂質(zhì)過氧化和肝細(xì)胞損傷。AI還正確關(guān)聯(lián)了"異生素分解過程"等基因本體論術(shù)語，準(zhǔn)確描述了藥物性肝損傷的生化事件。

對于腎臟毒性，AI的推理展現(xiàn)了合理的保守性。它指出缺乏腎功能特異性通路和基因本體論術(shù)語，并從結(jié)構(gòu)角度分析認(rèn)為普萘洛爾不具備典型的腎毒性結(jié)構(gòu)特征。這個判斷與臨床經(jīng)驗一致，普萘洛爾確實不是已知的腎毒性藥物，不會對主要的腎臟通路造成顯著影響。

這個案例清楚地展示了CoTox框架的強大之處：它不僅能給出準(zhǔn)確的毒性預(yù)測，更重要的是能提供科學(xué)合理的推理過程，這對于藥物安全評估具有重要的實用價值。

八、細(xì)胞實驗引導(dǎo)的創(chuàng)新應(yīng)用

CoTox框架的另一個創(chuàng)新應(yīng)用是整合細(xì)胞實驗數(shù)據(jù)來進行器官特異性毒性預(yù)測。這個方法特別適用于全新化合物的早期安全評估，因為這些化合物往往缺乏公共數(shù)據(jù)庫中的生物學(xué)注釋信息。

研究團隊以恩替卡韋（Entecavir）這一抗病毒藥物為例，展示了這種應(yīng)用模式的可行性。他們利用L1000基因表達(dá)圖譜數(shù)據(jù)，分別使用肝臟細(xì)胞系HEPG2、肺部細(xì)胞系A(chǔ)549和腎臟細(xì)胞系HA1E來模擬藥物處理效應(yīng)。通過基因集富集分析（GSEA），研究團隊從差異表達(dá)基因中提取出統(tǒng)計學(xué)顯著的生物通路和基因本體論術(shù)語。

這個過程就像讓不同器官的細(xì)胞"試用"這個藥物，然后觀察它們的基因表達(dá)變化，從而推斷藥物可能對相應(yīng)器官產(chǎn)生的影響。GSEA分析使用了嚴(yán)格的統(tǒng)計閾值（FDR q值 < 0.25 且 p值 < 0.01），確保提取出的生物學(xué)信息具有統(tǒng)計學(xué)意義。

在肝臟毒性預(yù)測中，CoTox通過分析HEPG2細(xì)胞的表達(dá)變化，識別出了"跨膜受體蛋白酪氨酸磷酸酶活性"和"蛋白質(zhì)絲氨酸/蘇氨酸/酪氨酸激酶活性"等關(guān)鍵的基因本體論術(shù)語。AI推理認(rèn)為，這些磷酸化和去磷酸化過程的失調(diào)是藥物性肝損傷的已知機制，因為它們會破壞細(xì)胞生長、增殖和存活的精細(xì)平衡，最終導(dǎo)致肝細(xì)胞凋亡和炎癥。

從化學(xué)結(jié)構(gòu)角度，AI識別出恩替卡韋是一個"鳥苷類似物"，需要通過宿主細(xì)胞激酶進行磷酸化才能發(fā)揮治療作用。這個生物激活過程可能產(chǎn)生脫靶效應(yīng)，干擾細(xì)胞內(nèi)激酶和磷酸酶信號網(wǎng)絡(luò)的微妙平衡，從而引起肝臟毒性。CoTox最終正確預(yù)測了恩替卡韋的肝臟毒性，與已知的臨床安全性資料一致。

在肺部毒性方面，由于A549細(xì)胞處理后沒有檢測到顯著的通路變化，AI合理地得出了"無毒性"的結(jié)論。這個預(yù)測同樣與臨床觀察相符，恩替卡韋確實不是已知的肺毒性藥物。

最有趣的是腎臟毒性的預(yù)測。盡管FDA標(biāo)簽顯示恩替卡韋為"無腎毒性"，但CoTox基于HA1E細(xì)胞的表達(dá)變化預(yù)測了"有毒性"。AI的推理依據(jù)是檢測到的"p53依賴性G1/S DNA損傷檢查點"和"p53依賴性G1 DNA損傷反應(yīng)"通路的激活，這表明藥物可能在腎細(xì)胞中引起DNA損傷。

令人驚訝的是，最新的臨床研究似乎支持了CoTox的這一"預(yù)測"。2022年發(fā)表的一項臨床研究發(fā)現(xiàn)，與使用替諾福韋alafenamide治療的患者相比，接受恩替卡韋治療的慢性乙肝患者出現(xiàn)腎功能下降的風(fēng)險顯著更高（調(diào)整風(fēng)險比4.05，p < 0.001）。這個發(fā)現(xiàn)表明，CoTox可能捕捉到了尚未在監(jiān)管文件中完全體現(xiàn)的潛在毒性信號，展示了其在早期毒性風(fēng)險評估中的潛在價值。

這個案例不僅驗證了CoTox整合實驗數(shù)據(jù)的能力，也展示了AI在發(fā)現(xiàn)潛在安全風(fēng)險方面的獨特優(yōu)勢。通過分析細(xì)胞水平的分子變化，CoTox能夠在傳統(tǒng)方法可能遺漏的地方識別出重要的毒性信號。

九、技術(shù)優(yōu)勢與局限性分析

CoTox框架在藥物毒性預(yù)測領(lǐng)域取得的成就是顯著的，但任何技術(shù)方法都有其優(yōu)勢和局限性，需要客觀地進行評估。

CoTox最突出的優(yōu)勢在于其出色的可解釋性。與傳統(tǒng)的"黑盒"機器學(xué)習(xí)模型不同，CoTox能夠提供詳細(xì)的推理過程，解釋為什么某個藥物會產(chǎn)生特定的毒性。這種透明度對于藥物開發(fā)具有重要價值，因為監(jiān)管機構(gòu)和制藥公司都需要理解毒性預(yù)測的科學(xué)依據(jù)。AI提供的推理過程不僅包含預(yù)測結(jié)果，還詳細(xì)分析了相關(guān)的生物學(xué)機制，這為進一步的實驗驗證和藥物優(yōu)化提供了明確的方向。

在性能方面，CoTox在多個毒性類型上都超越了傳統(tǒng)方法。相比于需要大量訓(xùn)練數(shù)據(jù)的監(jiān)督學(xué)習(xí)方法，CoTox利用預(yù)訓(xùn)練的大語言模型和結(jié)構(gòu)化提示，能夠在相對較少的標(biāo)注數(shù)據(jù)下取得良好的預(yù)測效果。這種優(yōu)勢在處理新化合物時尤其明顯，因為新化合物往往缺乏足夠的歷史毒性數(shù)據(jù)。

CoTox對多模態(tài)信息的整合能力也值得稱道。通過同時考慮化學(xué)結(jié)構(gòu)、生物通路和基因功能信息，該框架能夠從多個角度理解藥物的潛在毒性機制。這種綜合性分析比單一維度的方法更接近人類專家的思維過程，因此能夠捕捉到更復(fù)雜和微妙的毒性模式。

然而，CoTox也存在一些需要注意的局限性。首先是對高質(zhì)量生物學(xué)注釋的依賴。該方法需要準(zhǔn)確的通路和基因本體論信息才能有效工作，而對于全新的化合物類別，這些信息可能并不完整或不夠準(zhǔn)確。雖然研究團隊展示了通過細(xì)胞實驗獲取這些信息的方法，但這增加了實際應(yīng)用的復(fù)雜性和成本。

其次是預(yù)測性能在不同毒性類型間的不平衡。實驗結(jié)果顯示，肺部毒性和腎臟毒性的預(yù)測效果明顯不如心臟毒性和肝臟毒性。這可能反映了不同器官毒性機制的復(fù)雜程度差異，也可能與訓(xùn)練數(shù)據(jù)中不同毒性類型的樣本分布不平衡有關(guān)。

第三個局限性是對大語言模型能力的依賴。CoTox的表現(xiàn)在很大程度上取決于底層語言模型的推理能力和生物醫(yī)學(xué)知識水平。雖然目前的實驗使用了最先進的模型，但隨著模型技術(shù)的快速發(fā)展，方法的有效性可能會因為模型選擇而產(chǎn)生顯著變化。

最后，CoTox目前主要關(guān)注二元毒性分類（有毒或無毒），而在實際藥物開發(fā)中，毒性程度的量化評估往往同樣重要。未來的改進可能需要擴展到多級毒性預(yù)測或劑量-反應(yīng)關(guān)系的建模。

盡管存在這些局限性，CoTox仍然代表了藥物毒性預(yù)測領(lǐng)域的重要進展。其創(chuàng)新的多模態(tài)整合策略和可解釋的推理過程為該領(lǐng)域的未來發(fā)展指明了有前景的方向。

說到底，CoTox這項研究為我們展示了AI在藥物安全評估中的巨大潛力。通過巧妙地結(jié)合化學(xué)結(jié)構(gòu)、生物學(xué)機制和推理能力，這個框架讓計算機具備了類似人類毒理學(xué)專家的分析能力。雖然目前還存在一些技術(shù)挑戰(zhàn)需要克服，但CoTox已經(jīng)在多個方面超越了傳統(tǒng)方法，特別是在提供可解釋的預(yù)測結(jié)果方面取得了突破性進展。

對于普通人來說，這項研究的意義在于未來我們可能會有更安全的藥物。通過在藥物研發(fā)的早期階段就能準(zhǔn)確預(yù)測和理解毒性風(fēng)險，制藥公司可以避免將有害藥物推進臨床試驗，從而保護患者安全，同時也能節(jié)省大量的研發(fā)成本和時間。更重要的是，CoTox提供的詳細(xì)推理過程能夠幫助科學(xué)家理解毒性產(chǎn)生的具體機制，為設(shè)計更安全的藥物分子提供指導(dǎo)。

隨著AI技術(shù)的不斷進步和生物醫(yī)學(xué)數(shù)據(jù)的日益豐富，我們有理由相信類似CoTox這樣的智能系統(tǒng)將在未來的藥物研發(fā)中發(fā)揮越來越重要的作用。這不僅會加速新藥的發(fā)現(xiàn)和開發(fā)，更會讓每一個需要藥物治療的患者都能獲得更安全、更有效的治療選擇。對于那些希望深入了解這項技術(shù)細(xì)節(jié)的讀者，完整的研究代碼和數(shù)據(jù)已經(jīng)在GitHub上開源，為進一步的研究和應(yīng)用提供了寶貴的資源。

Q&A

Q1：CoTox是什么？它是如何工作的？

A：CoTox是由韓國大學(xué)開發(fā)的AI藥物毒性預(yù)測框架，它就像培養(yǎng)了一位既懂化學(xué)又懂生物學(xué)的AI毒理學(xué)專家。CoTox通過三步工作：首先用IUPAC名稱（而非難懂的化學(xué)代碼）來表示藥物分子，然后整合生物通路和基因功能信息來理解藥物在人體內(nèi)的作用機制，最后采用"思維鏈"推理讓AI一步步分析，給出詳細(xì)的毒性預(yù)測和解釋過程。

Q2：CoTox相比傳統(tǒng)的毒性預(yù)測方法有什么優(yōu)勢？

A：CoTox最大的優(yōu)勢是能像人類專家一樣提供詳細(xì)的推理過程和解釋，而不是像"黑盒子"一樣只給結(jié)果不講原因。在預(yù)測準(zhǔn)確性方面，CoTox的平均F1分?jǐn)?shù)達(dá)到0.663，明顯超過傳統(tǒng)機器學(xué)習(xí)方法的0.576和深度學(xué)習(xí)方法的0.619。更重要的是，CoTox不僅看化學(xué)結(jié)構(gòu)，還考慮藥物在人體內(nèi)的生物學(xué)作用機制，能夠預(yù)測心臟、肝臟、腎臟等不同器官的特異性毒性。

Q3：普通人如何從CoTox技術(shù)中受益？

A：CoTox最直接的益處是幫助開發(fā)更安全的藥物。通過在藥物研發(fā)早期就準(zhǔn)確預(yù)測毒性風(fēng)險，制藥公司可以避免將有害藥物推進人體試驗，既保護了患者安全，也節(jié)省了研發(fā)成本。對患者而言，這意味著未來能獲得副作用更少、更安全的藥物治療。此外，CoTox提供的詳細(xì)機制解釋還能幫助醫(yī)生更好地理解藥物的潛在風(fēng)險，制定更個性化的治療方案。

人工智能毒性預(yù)測思維鏈推理

分享至

0贊

好文章，需要你的鼓勵

推薦文章

音頻生成
大語言模型
多模態(tài)AI

2025-09-10 09:47

如何讓AI像電影配樂師一樣創(chuàng)作完整的長篇音頻故事——騰訊ARC實驗室團隊AudioStory突破性進展

騰訊ARC實驗室推出AudioStory系統(tǒng)，首次實現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù)，通過交錯式推理生成、解耦橋接機制和漸進式訓(xùn)練，能夠?qū)?fù)雜指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測試中表現(xiàn)優(yōu)異，為AI音頻創(chuàng)作開辟新方向。
視頻生成
深度學(xué)習(xí)
多模態(tài)學(xué)習(xí)

2025-09-09 13:57

Meta與特拉維夫大學(xué)聯(lián)手打造VideoJAM：讓AI生成的視頻動起來不再是奢望

Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù)，通過讓AI同時學(xué)習(xí)外觀和運動信息，顯著解決了當(dāng)前視頻生成模型中動作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個線性層就能大幅提升運動質(zhì)量，在多項測試中超越包括Sora在內(nèi)的商業(yè)模型，為AI視頻生成的實用化應(yīng)用奠定了重要基礎(chǔ)。
多模態(tài)AI
人類價值觀對齊
數(shù)據(jù)集構(gòu)建

2025-09-09 13:56

上海AI實驗室重磅發(fā)布：讓AI看圖"說人話"的神奇訓(xùn)練法，解決多模態(tài)AI與人類價值觀對齊難題

上海AI實驗室發(fā)布OmniAlign-V研究，首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評測基準(zhǔn)，通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法，讓AI在保持技術(shù)能力的同時顯著提升人性化交互水平，為AI價值觀對齊提供了可行技術(shù)路徑。
人工智能
圖神經(jīng)網(wǎng)絡(luò)
天氣預(yù)報

2025-09-09 10:56

谷歌研究團隊發(fā)布超級預(yù)測模型：讓AI像天氣預(yù)報員一樣預(yù)測全球大氣變化

谷歌DeepMind團隊開發(fā)的GraphCast是一個革命性的AI天氣預(yù)測模型，能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報，準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù)，通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律，在極端天氣預(yù)測方面表現(xiàn)卓越，能耗僅為傳統(tǒng)方法的千分之一，為氣象學(xué)領(lǐng)域帶來了效率和精度的雙重突破。

如何讓AI像電影配樂師一樣創(chuàng)作完整的長篇音頻故事——騰訊ARC實驗室團隊AudioStory突破性進展

如何讓AI像電影配樂師一樣創(chuàng)作完整的長篇音頻故事——騰訊ARC實驗室團隊AudioStory突破性進展

2025-09-10 09:47

Meta與特拉維夫大學(xué)聯(lián)手打造VideoJAM：讓AI生成的視頻動起來不再是奢望

Meta與特拉維夫大學(xué)聯(lián)手打造VideoJAM：讓AI生成的視頻動起來不再是奢望

2025-09-09 13:57

上海AI實驗室重磅發(fā)布：讓AI看圖"說人話"的神奇訓(xùn)練法，解決多模態(tài)AI與人類價值觀對齊難題

上海AI實驗室重磅發(fā)布：讓AI看圖"說人話"的神奇訓(xùn)練法，解決多模態(tài)AI與人類價值觀對齊難題

2025-09-09 13:56

谷歌研究團隊發(fā)布超級預(yù)測模型：讓AI像天氣預(yù)報員一樣預(yù)測全球大氣變化

谷歌研究團隊發(fā)布超級預(yù)測模型：讓AI像天氣預(yù)報員一樣預(yù)測全球大氣變化

2025-09-09 10:56

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

友情鏈接

至頂網(wǎng)
管理現(xiàn)代化
和訊IT
TechWeb
第三媒體
速途網(wǎng)
51CTO傳媒
投資界
科技訊
智者新時代

京ICP證15039648號京ICP備15039648號-9 京公網(wǎng)安備 11010802021500號

北京第二十六維信息技術(shù)有限公司（至頂網(wǎng)）版權(quán)所有。 | 聯(lián)絡(luò)我們

舉報電話：010-62641205　涉未成年人舉報專線：010-62641208 舉報郵箱: jubao@zhiding.cn 　網(wǎng)上有害信息舉報專區(qū)：https://www.12377.cn

<cite id="tirfo"><fieldset id="tirfo"></fieldset></cite>