這項(xiàng)由MIT計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(CSAIL)的洪銀洛(Hongyin Luo)教授團(tuán)隊(duì)聯(lián)合Subconscious Systems Technologies公司、普林斯頓大學(xué)和特拉維夫大學(xué)共同完成的突破性研究,發(fā)表于2025年7月22日的arXiv預(yù)印本平臺(tái)。有興趣深入了解的讀者可以通過論文編號(hào)arXiv:2507.16784v1訪問完整研究?jī)?nèi)容。
現(xiàn)在的人工智能就像一個(gè)記憶力有限的學(xué)生,無(wú)論多么聰明,一旦需要處理的信息超過了它的"工作記憶"容量,就會(huì)開始遺忘重要內(nèi)容,導(dǎo)致推理錯(cuò)誤或者干脆"卡機(jī)"。這個(gè)問題就像你試圖在腦海中同時(shí)記住一本厚厚電話簿的所有號(hào)碼一樣困難。當(dāng)前最先進(jìn)的大語(yǔ)言模型,比如Deepseek R1,雖然能處理多達(dá)12.8萬(wàn)個(gè)詞匯的輸入,但在面對(duì)需要長(zhǎng)時(shí)間深度思考的復(fù)雜任務(wù)時(shí),仍然會(huì)因?yàn)?記憶溢出"而表現(xiàn)不佳。
研究團(tuán)隊(duì)發(fā)現(xiàn)了一個(gè)關(guān)鍵洞察:人類在解決復(fù)雜問題時(shí),并不是把所有細(xì)節(jié)都保存在大腦的工作記憶中,而是會(huì)自動(dòng)"忘記"那些已經(jīng)完成的子任務(wù)的具體過程,只保留最終結(jié)果和當(dāng)前任務(wù)相關(guān)的信息。就像你在做菜時(shí),一旦完成了切菜這個(gè)步驟,你的大腦就不會(huì)繼續(xù)占用寶貴的注意力去記住每一刀是怎么切下去的,而是專注于下一步的炒制過程。
基于這個(gè)觀察,MIT團(tuán)隊(duì)開發(fā)了一套名為TIM(Thread Inference Model,線程推理模型)的全新AI系統(tǒng),配合專門設(shè)計(jì)的運(yùn)行引擎TIMRUN。這套系統(tǒng)的核心創(chuàng)新在于讓AI學(xué)會(huì)了"聰明地遺忘"——它會(huì)將復(fù)雜任務(wù)分解成一棵"推理樹",每個(gè)分支代表一個(gè)子任務(wù),當(dāng)某個(gè)分支完成后,系統(tǒng)會(huì)自動(dòng)清理掉這個(gè)分支的詳細(xì)過程,只保留結(jié)論供后續(xù)推理使用。
一、化繁為簡(jiǎn)的"推理樹魔法"
TIM系統(tǒng)的工作原理可以比作一位經(jīng)驗(yàn)豐富的項(xiàng)目經(jīng)理處理復(fù)雜工程項(xiàng)目的方式。當(dāng)面對(duì)一個(gè)龐大的任務(wù)時(shí),這位項(xiàng)目經(jīng)理不會(huì)試圖同時(shí)處理所有細(xì)節(jié),而是會(huì)將大任務(wù)分解成若干個(gè)小任務(wù),每個(gè)小任務(wù)又可以進(jìn)一步分解,直到每個(gè)最小任務(wù)都能夠在短時(shí)間內(nèi)完成。
具體來(lái)說(shuō),TIM將每個(gè)推理任務(wù)設(shè)計(jì)成包含四個(gè)關(guān)鍵組成部分的結(jié)構(gòu)化單元。第一部分是"思考過程"(thought),AI在這里分析當(dāng)前情況,檢查之前步驟是否有錯(cuò)誤,并制定下一步計(jì)劃。第二部分是"工具使用"(tooluse),當(dāng)任務(wù)需要外部信息或計(jì)算時(shí),AI會(huì)調(diào)用相應(yīng)的工具,比如搜索引擎或者計(jì)算器。第三部分是"子任務(wù)列表"(subtasks),如果當(dāng)前任務(wù)太復(fù)雜,AI會(huì)將其分解成更小的子任務(wù)。最后是"結(jié)論"(conclusion),AI會(huì)處理工具返回的結(jié)果,整合子任務(wù)的輸出,并給出當(dāng)前任務(wù)的最終答案。
這種設(shè)計(jì)的巧妙之處在于,每個(gè)任務(wù)單元都遵循相同的模式,就像俄羅斯套娃一樣,大任務(wù)包含小任務(wù),小任務(wù)包含更小的任務(wù),直到最基礎(chǔ)的層面。而且,當(dāng)一個(gè)子任務(wù)完成后,系統(tǒng)會(huì)自動(dòng)"遺忘"這個(gè)子任務(wù)的具體執(zhí)行過程,只記住最終結(jié)論,從而為處理新任務(wù)騰出寶貴的計(jì)算資源。
研究團(tuán)隊(duì)將這種新的推理框架稱為"Thread-2",它相比之前的版本有了顯著改進(jìn)。最重要的改進(jìn)是解決了信息傳遞的問題——在舊版本中,每個(gè)子任務(wù)都需要重新獲得完整的指令信息,這不僅效率低下,還容易造成信息丟失。新版本通過維持一個(gè)"工作記憶"系統(tǒng),讓所有任務(wù)都能訪問系統(tǒng)提示、用戶輸入和所有未被清理的任務(wù)信息,實(shí)現(xiàn)了更加高效和準(zhǔn)確的推理過程。
二、智能"健忘"的記憶管理藝術(shù)
TIMRUN引擎的核心功能就像一位高效的圖書管理員,它知道什么時(shí)候該把哪些書籍歸還到庫(kù)房,什么時(shí)候該把重要資料放在手邊。這個(gè)過程被稱為"子任務(wù)修剪"(subtask pruning),它是整個(gè)系統(tǒng)能夠突破傳統(tǒng)AI記憶限制的關(guān)鍵技術(shù)。
傳統(tǒng)的AI模型在處理長(zhǎng)文本時(shí),需要將所有信息都保存在顯存中,就像一個(gè)學(xué)生試圖在桌面上同時(shí)攤開所有教科書一樣,很快就會(huì)發(fā)現(xiàn)桌子不夠用了。TIMRUN的創(chuàng)新在于引入了一個(gè)"修剪緩沖區(qū)"的概念,這就像是桌邊的一個(gè)小抽屜,可以臨時(shí)存放一些剛完成但可能還需要參考的材料。
當(dāng)系統(tǒng)完成一個(gè)子任務(wù)時(shí),它會(huì)將這個(gè)子任務(wù)的詳細(xì)信息移入修剪緩沖區(qū)。如果緩沖區(qū)滿了,最早的子任務(wù)信息就會(huì)被徹底清除,為新的任務(wù)騰出空間。研究團(tuán)隊(duì)發(fā)現(xiàn),將緩沖區(qū)大小設(shè)置為1-2個(gè)子任務(wù)是最優(yōu)的平衡點(diǎn)——既保證了必要的信息冗余,又最大化了內(nèi)存使用效率。
這種動(dòng)態(tài)內(nèi)存管理策略帶來(lái)了驚人的效果。在實(shí)際測(cè)試中,TIM系統(tǒng)能夠在使用不到50%原始內(nèi)存的情況下,完成與傳統(tǒng)系統(tǒng)相同復(fù)雜度的推理任務(wù)。更令人印象深刻的是,這種"健忘"不僅沒有損害推理準(zhǔn)確性,反而在某些任務(wù)上提高了性能,因?yàn)锳I能夠更專注于當(dāng)前任務(wù),而不會(huì)被無(wú)關(guān)的歷史信息干擾。
系統(tǒng)還采用了一種巧妙的內(nèi)存重用技術(shù)。當(dāng)某些子任務(wù)被清理后,它們?cè)菊加玫膬?nèi)存位置可以被新的任務(wù)內(nèi)容重新利用,就像在文檔中刪除一段文字后,新內(nèi)容可以填補(bǔ)空白位置一樣。這種技術(shù)讓AI能夠處理幾乎無(wú)限長(zhǎng)的推理鏈,而不會(huì)耗盡計(jì)算資源。
三、一站式工具調(diào)用的集成革命
傳統(tǒng)的AI助手在需要使用外部工具時(shí),就像一個(gè)需要不斷向老板匯報(bào)的員工——每次使用計(jì)算器、搜索引擎或其他工具時(shí),都需要停下來(lái),將結(jié)果匯報(bào)給開發(fā)者,等待下一步指示,然后再繼續(xù)工作。這種工作模式不僅效率低下,還會(huì)產(chǎn)生巨額的重復(fù)計(jì)算成本。
TIM系統(tǒng)徹底改變了這種工作模式,它更像是一位擁有完全自主權(quán)的高級(jí)助理。當(dāng)TIM需要使用某個(gè)工具時(shí),它會(huì)直接調(diào)用工具,獲取結(jié)果,并將結(jié)果無(wú)縫整合到推理過程中,整個(gè)過程無(wú)需人工干預(yù)或外部協(xié)調(diào)。這種端到端的工具集成不僅大大提高了效率,還顯著降低了成本。
具體來(lái)說(shuō),TIMRUN引擎在檢測(cè)到TIM輸出工具調(diào)用指令時(shí),會(huì)自動(dòng)提取工具參數(shù),調(diào)用相應(yīng)的外部服務(wù),然后將工具返回的結(jié)果直接附加到正在進(jìn)行的推理過程中。這個(gè)過程就像是AI有了一雙能夠自主操作各種設(shè)備的手,而不需要每次都通過人類中介來(lái)完成操作。
這種設(shè)計(jì)帶來(lái)的成本節(jié)約是巨大的。在傳統(tǒng)系統(tǒng)中,如果一個(gè)復(fù)雜任務(wù)需要調(diào)用20個(gè)工具,開發(fā)者可能需要為初始輸入支付20次費(fèi)用,因?yàn)槊看喂ぞ哒{(diào)用都需要重新發(fā)送完整的上下文信息。而TIM系統(tǒng)中,每個(gè)詞匯只需要處理一次,大大降低了使用成本。
研究團(tuán)隊(duì)還發(fā)現(xiàn),這種集成方式特別適合處理需要多步驟信息檢索和推理的復(fù)雜任務(wù)。在實(shí)際測(cè)試中,TIM能夠在單次推理過程中處理超過30次工具調(diào)用,而傳統(tǒng)系統(tǒng)通常在幾次工具調(diào)用后就會(huì)因?yàn)樯舷挛墓芾韽?fù)雜性而出現(xiàn)問題。
四、訓(xùn)練數(shù)據(jù)的精心調(diào)制
為了讓TIM學(xué)會(huì)這種結(jié)構(gòu)化推理方式,研究團(tuán)隊(duì)采用了一種創(chuàng)新的訓(xùn)練策略。他們沒有從零開始訓(xùn)練一個(gè)全新的大模型,而是選擇了Qwen3-8b這個(gè)相對(duì)較小但性能優(yōu)秀的開源模型作為基礎(chǔ),通過精心設(shè)計(jì)的合成數(shù)據(jù)集對(duì)其進(jìn)行專門訓(xùn)練。
訓(xùn)練數(shù)據(jù)的構(gòu)建過程就像是為AI準(zhǔn)備一本特殊的教科書。研究團(tuán)隊(duì)收集了來(lái)自不同領(lǐng)域的46000個(gè)問題,包括20000個(gè)數(shù)學(xué)問題、20000個(gè)研究問題和6000個(gè)工具使用問題。對(duì)于每種類型的問題,他們都設(shè)計(jì)了相應(yīng)的工具配置:數(shù)學(xué)問題禁用外部工具,鼓勵(lì)A(yù)I進(jìn)行純推理;研究問題配備搜索工具和網(wǎng)頁(yè)閱讀工具,模擬真實(shí)的信息收集過程。
特別有趣的是,為了節(jié)省訓(xùn)練成本,研究團(tuán)隊(duì)并沒有實(shí)際調(diào)用這些工具來(lái)生成真實(shí)的工具響應(yīng),而是讓大語(yǔ)言模型"想象"工具會(huì)返回什么結(jié)果。雖然這種方法產(chǎn)生的訓(xùn)練數(shù)據(jù)質(zhì)量可能不夠完美,但配合后續(xù)的強(qiáng)化學(xué)習(xí)訓(xùn)練,仍然能夠讓模型學(xué)會(huì)正確的推理模式。
強(qiáng)化學(xué)習(xí)階段采用了GRPO(Group Relative Policy Optimization)算法,通過比較模型預(yù)測(cè)答案與標(biāo)準(zhǔn)答案來(lái)提供獎(jiǎng)勵(lì)信號(hào)。即使訓(xùn)練數(shù)據(jù)質(zhì)量有限,這種強(qiáng)化學(xué)習(xí)方法仍然能夠顯著提升模型在數(shù)學(xué)推理任務(wù)上的表現(xiàn),證明了結(jié)構(gòu)化推理框架的有效性。
五、令人印象深刻的實(shí)驗(yàn)成果
研究團(tuán)隊(duì)在多個(gè)具有挑戰(zhàn)性的基準(zhǔn)測(cè)試中驗(yàn)證了TIM系統(tǒng)的能力,結(jié)果顯示這套系統(tǒng)在保持高推理準(zhǔn)確性的同時(shí),實(shí)現(xiàn)了顯著的效率提升。
在數(shù)學(xué)推理能力測(cè)試中,TIM在多個(gè)標(biāo)準(zhǔn)數(shù)據(jù)集上都表現(xiàn)出色。特別值得注意的是,在AIME 2024這個(gè)高難度數(shù)學(xué)競(jìng)賽題目上,TIM的準(zhǔn)確率從40%提升到了46.7%,在GPQA Diamond科學(xué)問題數(shù)據(jù)集上從44.9%提升到了48.5%。這些提升證明了子任務(wù)修剪不僅沒有損害推理能力,反而通過幫助模型更好地聚焦于相關(guān)信息,提高了推理質(zhì)量。
更令人驚訝的是內(nèi)存使用效率的提升。實(shí)驗(yàn)數(shù)據(jù)顯示,TIM系統(tǒng)在所有測(cè)試任務(wù)中都能夠?qū)V緩存使用量控制在輸出長(zhǎng)度的50%以下。在某些復(fù)雜任務(wù)中,這個(gè)比例甚至低至35%,意味著系統(tǒng)用不到原本一半的內(nèi)存就完成了相同的推理任務(wù)。
在信息檢索和研究任務(wù)測(cè)試中,TIM的表現(xiàn)同樣令人印象深刻。在Datacommons QA基準(zhǔn)測(cè)試中,TIM達(dá)到了67.9%的準(zhǔn)確率,與使用復(fù)雜提示工程和多智能體框架的THREAD系統(tǒng)性能相當(dāng),但TIM只需要簡(jiǎn)單的系統(tǒng)消息就能實(shí)現(xiàn)這樣的性能,大大簡(jiǎn)化了部署復(fù)雜度。
在更具挑戰(zhàn)性的BrowseComp深度研究任務(wù)中,TIM雖然基于相對(duì)較小的8B參數(shù)模型,但其成功率達(dá)到了2.3%,這在沒有經(jīng)過專門任務(wù)訓(xùn)練的情況下是一個(gè)相當(dāng)不錯(cuò)的成績(jī)。更重要的是,TIM-large版本(基于GPT-4構(gòu)建)的成功率達(dá)到了7.8%,顯著超過了GPT-4o的1.9%,證明了結(jié)構(gòu)化推理方法的有效性。
六、吞吐量和擴(kuò)展性的雙重突破
TIMRUN引擎在保持高推理質(zhì)量的同時(shí),還實(shí)現(xiàn)了令人矚目的性能優(yōu)化。研究團(tuán)隊(duì)通過精心設(shè)計(jì)的實(shí)驗(yàn)驗(yàn)證了系統(tǒng)在實(shí)際部署環(huán)境中的優(yōu)勢(shì)。
在吞吐量測(cè)試中,研究團(tuán)隊(duì)發(fā)現(xiàn)了一個(gè)有趣的平衡點(diǎn)。雖然頻繁的內(nèi)存管理操作會(huì)帶來(lái)一定的計(jì)算開銷,但這種開銷被注意力機(jī)制計(jì)算量的減少所抵消。當(dāng)修剪緩沖區(qū)大小設(shè)置為2時(shí),系統(tǒng)達(dá)到了最佳的性能平衡點(diǎn),吞吐量甚至超過了強(qiáng)大的SGLang基線系統(tǒng)。
特別令人印象深刻的是系統(tǒng)在多工具調(diào)用場(chǎng)景下的表現(xiàn)。傳統(tǒng)系統(tǒng)的吞吐量會(huì)隨著工具調(diào)用次數(shù)的增加而急劇下降,因?yàn)槊看喂ぞ哒{(diào)用都會(huì)帶來(lái)額外的上下文管理負(fù)擔(dān)。而TIMRUN由于其自動(dòng)上下文管理機(jī)制,即使在處理超過30次工具調(diào)用的復(fù)雜任務(wù)時(shí),仍能保持相對(duì)穩(wěn)定的吞吐量。
這種性能優(yōu)勢(shì)在實(shí)際應(yīng)用中具有重要意義。對(duì)于需要長(zhǎng)時(shí)間推理或大量工具交互的任務(wù),TIM系統(tǒng)不僅能夠提供更準(zhǔn)確的結(jié)果,還能以更高的效率完成任務(wù),這對(duì)于資源受限的部署環(huán)境特別有價(jià)值。
七、技術(shù)實(shí)現(xiàn)的精妙細(xì)節(jié)
TIMRUN引擎的技術(shù)實(shí)現(xiàn)體現(xiàn)了系統(tǒng)設(shè)計(jì)的巧思。為了實(shí)現(xiàn)高效的內(nèi)存管理,系統(tǒng)采用了基于頁(yè)面的注意力機(jī)制,并將頁(yè)面大小設(shè)置為1,這樣每個(gè)請(qǐng)求都可以有獨(dú)立的修剪策略。這種設(shè)計(jì)雖然看起來(lái)可能會(huì)帶來(lái)額外開銷,但通過使用Triton編譯器優(yōu)化和FlashInfer加速庫(kù),實(shí)際性能反而得到了提升。
系統(tǒng)還實(shí)現(xiàn)了一種創(chuàng)新的位置編碼重用機(jī)制。當(dāng)某些子任務(wù)被修剪后,它們?cè)菊加玫奈恢镁幋a可以被后續(xù)的任務(wù)內(nèi)容重新使用,這就像是在一個(gè)有限長(zhǎng)度的紙條上,通過巧妙的編排,寫下無(wú)限長(zhǎng)的內(nèi)容。這種技術(shù)讓AI能夠突破傳統(tǒng)的輸出長(zhǎng)度限制,處理任意長(zhǎng)度的推理任務(wù)。
結(jié)構(gòu)化生成是另一個(gè)重要的技術(shù)創(chuàng)新。TIM使用JSON格式來(lái)組織推理過程,這不僅提高了輸出的可解釋性,還使得TIMRUN能夠精確識(shí)別推理結(jié)構(gòu),實(shí)現(xiàn)精準(zhǔn)的內(nèi)存管理。這種方法比傳統(tǒng)的特殊符號(hào)標(biāo)記方法更加穩(wěn)定和高效。
八、實(shí)際應(yīng)用中的無(wú)限可能
TIM系統(tǒng)的出現(xiàn)為AI應(yīng)用開發(fā)帶來(lái)了全新的可能性。開發(fā)者不再需要設(shè)計(jì)復(fù)雜的多智能體系統(tǒng)來(lái)處理需要長(zhǎng)時(shí)間推理的任務(wù),只需要給TIM提供合適的工具集合,就能獲得一個(gè)能夠自主管理上下文、高效使用工具的智能助手。
在教育領(lǐng)域,TIM可以成為一個(gè)真正理解復(fù)雜問題解決過程的AI導(dǎo)師,能夠?qū)?fù)雜的數(shù)學(xué)或科學(xué)問題分解成學(xué)生容易理解的步驟,并在每個(gè)步驟中提供恰當(dāng)?shù)闹笇?dǎo)。在科研領(lǐng)域,TIM可以協(xié)助研究人員進(jìn)行文獻(xiàn)調(diào)研、數(shù)據(jù)分析和假設(shè)驗(yàn)證,其強(qiáng)大的信息整合能力能夠顯著提高研究效率。
商業(yè)應(yīng)用方面,TIM可以處理復(fù)雜的業(yè)務(wù)流程,比如供應(yīng)鏈優(yōu)化、風(fēng)險(xiǎn)評(píng)估或客戶服務(wù)等需要多步驟推理和決策的任務(wù)。其成本效益優(yōu)勢(shì)使得即使是資源有限的中小企業(yè)也能享受到高質(zhì)量的AI服務(wù)。
更重要的是,TIM系統(tǒng)的開源特性和模塊化設(shè)計(jì)為AI技術(shù)的普及和創(chuàng)新提供了良好的基礎(chǔ)。研究人員和開發(fā)者可以基于這個(gè)框架開發(fā)針對(duì)特定領(lǐng)域的專用系統(tǒng),推動(dòng)AI技術(shù)在更多領(lǐng)域的應(yīng)用和發(fā)展。
說(shuō)到底,MIT團(tuán)隊(duì)的這項(xiàng)研究解決了困擾AI領(lǐng)域多年的一個(gè)根本問題:如何讓機(jī)器像人類一樣進(jìn)行長(zhǎng)期、復(fù)雜的推理思考。TIM系統(tǒng)通過模仿人類的認(rèn)知過程——分解復(fù)雜任務(wù)、聚焦關(guān)鍵信息、適時(shí)遺忘無(wú)關(guān)細(xì)節(jié)——成功突破了傳統(tǒng)AI的記憶限制,開啟了通向更智能、更高效AI系統(tǒng)的大門。
這項(xiàng)技術(shù)的意義遠(yuǎn)不止于提高計(jì)算效率,它代表了AI發(fā)展的一個(gè)重要方向轉(zhuǎn)變:從簡(jiǎn)單的模式匹配和信息檢索,轉(zhuǎn)向真正的推理和問題解決。雖然目前TIM還是一個(gè)相對(duì)較小規(guī)模的原型系統(tǒng),但其展現(xiàn)的潛力讓我們有理由相信,未來(lái)的AI將能夠處理更加復(fù)雜和開放的現(xiàn)實(shí)世界問題。
對(duì)于普通用戶來(lái)說(shuō),這意味著我們可能很快就能擁有真正智能的AI助手,它們不僅能回答簡(jiǎn)單問題,還能幫助我們解決需要深度思考和多步推理的復(fù)雜挑戰(zhàn)。無(wú)論是學(xué)習(xí)新知識(shí)、規(guī)劃復(fù)雜項(xiàng)目,還是分析復(fù)雜數(shù)據(jù),這樣的AI系統(tǒng)都將成為我們強(qiáng)有力的思維伙伴。當(dāng)然,如有興趣深入了解這項(xiàng)研究的技術(shù)細(xì)節(jié),讀者可以通過arXiv:2507.16784v1獲取完整的研究論文。
Q&A
Q1:TIM系統(tǒng)的"健忘"功能會(huì)不會(huì)影響推理的準(zhǔn)確性? A:不會(huì),反而會(huì)提高準(zhǔn)確性。TIM的"健忘"是智能的——它只遺忘已完成子任務(wù)的執(zhí)行細(xì)節(jié),保留重要結(jié)論。這就像做數(shù)學(xué)題時(shí),你不需要記住每一步計(jì)算的具體過程,只需要記住中間結(jié)果。實(shí)驗(yàn)顯示,這種方法讓AI更專注于當(dāng)前任務(wù),在多個(gè)基準(zhǔn)測(cè)試中準(zhǔn)確率都有提升。
Q2:普通開發(fā)者能使用TIM系統(tǒng)嗎?使用門檻高不高? A:相對(duì)簡(jiǎn)單。與傳統(tǒng)需要復(fù)雜多智能體框架的系統(tǒng)不同,TIM只需要提供工具描述和簡(jiǎn)單系統(tǒng)消息就能工作。開發(fā)者無(wú)需設(shè)計(jì)復(fù)雜的上下文管理邏輯,系統(tǒng)會(huì)自動(dòng)處理記憶管理和工具調(diào)用。目前代碼已在GitHub開源(github.com/subconscious-systems/TIMRUN),技術(shù)門檻大大降低。
Q3:TIM系統(tǒng)在成本方面有什么優(yōu)勢(shì)? A:成本優(yōu)勢(shì)巨大。傳統(tǒng)系統(tǒng)每次工具調(diào)用都需要重新發(fā)送完整上下文,如果任務(wù)需要20次工具調(diào)用,就要為同樣的輸入支付20次費(fèi)用。TIM系統(tǒng)中每個(gè)詞匯只處理一次,且通過智能內(nèi)存管理,使用的計(jì)算資源不到傳統(tǒng)系統(tǒng)的50%,大幅降低了部署和運(yùn)行成本。
好文章,需要你的鼓勵(lì)
騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng),首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長(zhǎng)篇音頻故事。該系統(tǒng)結(jié)合大語(yǔ)言模型的敘事推理能力與音頻生成技術(shù),通過交錯(cuò)式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場(chǎng)景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時(shí)學(xué)習(xí)外觀和運(yùn)動(dòng)信息,顯著解決了當(dāng)前視頻生成模型中動(dòng)作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個(gè)線性層就能大幅提升運(yùn)動(dòng)質(zhì)量,在多項(xiàng)測(cè)試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語(yǔ)言模型人性化對(duì)話問題。該研究創(chuàng)建了包含20萬(wàn)高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評(píng)測(cè)基準(zhǔn),通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平,為AI價(jià)值觀對(duì)齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊(duì)開發(fā)的GraphCast是一個(gè)革命性的AI天氣預(yù)測(cè)模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào),準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測(cè)方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來(lái)了效率和精度的雙重突破。