av天堂久久天堂色综合,最近中文字幕mv免费高清在线,在线a级毛片免费视频,av动漫,中文字幕精品亚洲无线码一区

<pre id="lazsg"></pre>

<sub id="lazsg"></sub>

首頁(yè)
對(duì)話創(chuàng)新
對(duì)話科技行者
機(jī)器人新紀(jì)元
AI論文解讀
聯(lián)系我們

微信掃一掃，關(guān)注公眾號(hào)

科技行者
算力行者

見(jiàn)證連接與計(jì)算的「力量」

AI推理新突破：Zoom團(tuán)隊(duì)發(fā)現(xiàn)的"寫少想快"秘密讓ChatGPT效率飆升80%

人工智能推理優(yōu)化效率提升

AI推理新突破：Zoom團(tuán)隊(duì)發(fā)現(xiàn)的"寫少想快"秘密讓ChatGPT效率飆升80%

作者：科技行者

2025-07-31 11:27

分享至：

Zoom研究團(tuán)隊(duì)發(fā)現(xiàn)了讓AI"寫少想快"的新方法——思維草稿法，通過(guò)模仿人類簡(jiǎn)潔思考方式，讓AI只記錄關(guān)鍵信息而非詳細(xì)解釋。實(shí)驗(yàn)顯示這種方法在保持90%以上準(zhǔn)確率的同時(shí)，只需使用傳統(tǒng)方法7.6%的文字量，大幅提升處理速度并降低成本，為AI應(yīng)用的普及和可持續(xù)發(fā)展開(kāi)辟了新路徑。

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

2025-07-31 11:27 ? 科技行者

這項(xiàng)突破性研究來(lái)自Zoom通信公司的四位研究員——徐思蕾、謝文浩、趙凌霄和何鵬程，于2025年3月發(fā)表在計(jì)算機(jī)科學(xué)預(yù)印本平臺(tái)arXiv上。有興趣深入了解的讀者可以通過(guò)論文編號(hào)arXiv:2502.18600v2訪問(wèn)完整研究報(bào)告。

當(dāng)我們解決復(fù)雜問(wèn)題時(shí)，比如算數(shù)學(xué)題或者分析復(fù)雜情況，大腦通常會(huì)在紙上快速記錄關(guān)鍵信息——幾個(gè)數(shù)字、一個(gè)公式、幾個(gè)要點(diǎn)，而不是寫出完整的句子和詳細(xì)解釋。然而，目前最先進(jìn)的AI系統(tǒng)如GPT和Claude在處理問(wèn)題時(shí)，卻像一個(gè)過(guò)分詳細(xì)的學(xué)生，每一步都要寫出完整的解釋和冗長(zhǎng)的推理過(guò)程。這種做法雖然看起來(lái)很"聰明"，但實(shí)際上浪費(fèi)了大量時(shí)間和計(jì)算資源。

Zoom研究團(tuán)隊(duì)的這項(xiàng)發(fā)現(xiàn)徹底顛覆了我們對(duì)AI推理的認(rèn)知。他們發(fā)現(xiàn)，如果讓AI模仿人類的簡(jiǎn)化思考方式——只記錄最關(guān)鍵的信息點(diǎn)而不是冗長(zhǎng)的解釋——不僅能保持同樣的準(zhǔn)確性，還能將處理速度提升數(shù)倍，同時(shí)大幅降低使用成本。這就好比把一個(gè)啰嗦的顧問(wèn)變成了一個(gè)簡(jiǎn)潔高效的專家，既快又準(zhǔn)。

研究團(tuán)隊(duì)將這種新方法命名為"思維草稿法"（Chain of Draft，簡(jiǎn)稱CoD），與目前廣泛使用的"思維鏈法"（Chain of Thought，簡(jiǎn)稱CoT）形成鮮明對(duì)比。傳統(tǒng)的思維鏈法就像讓AI寫詳細(xì)的作文，而思維草稿法則像讓AI只寫要點(diǎn)和關(guān)鍵步驟。實(shí)驗(yàn)結(jié)果令人震撼：在保持幾乎相同準(zhǔn)確率的情況下，新方法只使用了傳統(tǒng)方法7.6%的文字量，大幅減少了處理時(shí)間和計(jì)算成本。

**一、從"話癆AI"到"簡(jiǎn)潔專家"的轉(zhuǎn)變**

目前的AI推理系統(tǒng)存在一個(gè)有趣的矛盾。當(dāng)你問(wèn)ChatGPT或Claude一個(gè)數(shù)學(xué)問(wèn)題時(shí)，它們會(huì)像剛學(xué)會(huì)說(shuō)話的小孩一樣，把每個(gè)步驟都解釋得非常詳細(xì)。比如解決"小明原來(lái)有20個(gè)糖果，給了小紅一些，現(xiàn)在還剩12個(gè)，問(wèn)給了多少個(gè)？"這樣的簡(jiǎn)單問(wèn)題，傳統(tǒng)AI會(huì)寫出一長(zhǎng)串解釋：先說(shuō)小明原來(lái)有多少個(gè)，再說(shuō)現(xiàn)在有多少個(gè)，然后解釋為什么要用減法，最后才給出答案。

這種詳細(xì)解釋在某些教學(xué)場(chǎng)景下確實(shí)有用，但在大多數(shù)實(shí)際應(yīng)用中卻是不必要的負(fù)擔(dān)。就像你在超市買東西時(shí)，不需要收銀員詳細(xì)解釋每一步計(jì)算過(guò)程，你只需要知道總價(jià)是多少。

研究團(tuán)隊(duì)通過(guò)對(duì)比發(fā)現(xiàn)，傳統(tǒng)的思維鏈方法雖然提高了AI的推理準(zhǔn)確性，但代價(jià)是生成了大量冗余信息。以Claude 3.5 Sonnet為例，在處理數(shù)學(xué)問(wèn)題時(shí)，傳統(tǒng)方法平均需要生成190個(gè)詞匯單位才能給出答案，而新的思維草稿法只需要40個(gè)詞匯單位就能達(dá)到幾乎相同的準(zhǔn)確率。這相當(dāng)于把一篇800字的文章壓縮成160字的摘要，但保持了所有重要信息。

更令人驚訝的是，這種簡(jiǎn)化不僅沒(méi)有損害AI的推理能力，在某些情況下甚至提高了準(zhǔn)確性。這是因?yàn)檫^(guò)多的冗余信息有時(shí)會(huì)讓AI"迷失"在自己的解釋中，而簡(jiǎn)潔的要點(diǎn)能幫助AI更好地專注于核心問(wèn)題。

**二、人類智慧的啟發(fā)：為什么少即是多**

這項(xiàng)研究的核心洞察來(lái)自對(duì)人類思維過(guò)程的觀察。當(dāng)我們面對(duì)復(fù)雜問(wèn)題時(shí)，大腦實(shí)際上采用的是一種高度優(yōu)化的信息處理策略。以解數(shù)學(xué)題為例，我們通常會(huì)在紙上快速寫下關(guān)鍵數(shù)字和符號(hào)，比如"20-x=12"，然后直接得出"x=8"，而不會(huì)寫"首先，我注意到小明原來(lái)有20個(gè)糖果，這是我們的起始數(shù)量..."這樣的完整句子。

研究團(tuán)隊(duì)意識(shí)到，人類的這種"草稿式思考"實(shí)際上是經(jīng)過(guò)數(shù)千年進(jìn)化優(yōu)化的信息處理方式。我們的大腦天然傾向于提取和保留最關(guān)鍵的信息，同時(shí)舍棄不必要的細(xì)節(jié)。這種能力讓人類能夠在有限的認(rèn)知資源下處理復(fù)雜問(wèn)題。

將這種思維模式應(yīng)用到AI系統(tǒng)中，研究團(tuán)隊(duì)發(fā)現(xiàn)了令人興奮的結(jié)果。通過(guò)指導(dǎo)AI只生成最必要的中間步驟，而不是詳細(xì)的解釋文字，AI不僅能更快地找到答案，還能避免被自己生成的冗長(zhǎng)文字"繞糊涂"。這就像給一個(gè)容易跑題的學(xué)生提供了一個(gè)簡(jiǎn)潔的提綱，幫助他們保持專注。

研究還發(fā)現(xiàn)，這種方法特別適合那些有明確邏輯結(jié)構(gòu)的問(wèn)題。在數(shù)學(xué)計(jì)算、邏輯推理和符號(hào)操作等任務(wù)中，關(guān)鍵信息往往可以用簡(jiǎn)單的符號(hào)和數(shù)字表達(dá)，而不需要冗長(zhǎng)的自然語(yǔ)言描述。

**三、實(shí)戰(zhàn)效果：三大領(lǐng)域的驚人表現(xiàn)**

為了驗(yàn)證思維草稿法的實(shí)際效果，研究團(tuán)隊(duì)在三個(gè)不同的認(rèn)知領(lǐng)域進(jìn)行了全面測(cè)試：數(shù)學(xué)推理、常識(shí)推理和符號(hào)推理。這些領(lǐng)域代表了AI系統(tǒng)需要處理的主要思維類型，從具體的計(jì)算到抽象的邏輯操作。

在數(shù)學(xué)推理測(cè)試中，研究團(tuán)隊(duì)使用了GSM8K數(shù)據(jù)集，這是一個(gè)包含8500道小學(xué)數(shù)學(xué)應(yīng)用題的標(biāo)準(zhǔn)測(cè)試集。結(jié)果顯示，GPT-4o使用傳統(tǒng)詳細(xì)解釋方法的準(zhǔn)確率為95.4%，每個(gè)回答平均需要205個(gè)詞匯單位，處理時(shí)間為4.2秒。而使用思維草稿法時(shí)，準(zhǔn)確率達(dá)到91.1%，只需要44個(gè)詞匯單位，處理時(shí)間縮短到1.0秒。Claude 3.5 Sonnet的表現(xiàn)更加出色，準(zhǔn)確率從95.8%下降到91.4%，但詞匯使用量從190個(gè)減少到40個(gè)，處理時(shí)間從3.1秒降至1.6秒。

這種差異在實(shí)際應(yīng)用中意味著什么呢？假設(shè)你運(yùn)營(yíng)一個(gè)在線教育平臺(tái)，每天需要處理10萬(wàn)個(gè)學(xué)生的數(shù)學(xué)問(wèn)題。使用傳統(tǒng)方法，每個(gè)問(wèn)題的處理成本和時(shí)間都很高，而使用思維草稿法，不僅能將成本降低80%以上，還能讓學(xué)生幾乎立即得到答案，極大提升用戶體驗(yàn)。

在常識(shí)推理測(cè)試中，研究團(tuán)隊(duì)評(píng)估了AI理解日期和體育知識(shí)的能力。這類問(wèn)題需要AI調(diào)用背景知識(shí)并進(jìn)行邏輯推理，比如"如果今天是星期三，三天后是星期幾？"在日期理解任務(wù)中，GPT-4o使用思維草稿法的準(zhǔn)確率為88.1%，詞匯使用量只有傳統(tǒng)方法的40%。更有趣的是，Claude 3.5 Sonnet在體育知識(shí)問(wèn)答中使用思維草稿法時(shí)，準(zhǔn)確率從93.2%提升到97.3%，同時(shí)詞匯使用量從189個(gè)驟降至14個(gè)，降幅達(dá)到92.4%。

符號(hào)推理測(cè)試使用了拋硬幣任務(wù)，這類問(wèn)題需要AI追蹤一系列操作的結(jié)果。比如"硬幣開(kāi)始是正面朝上，小明翻了一次，小紅翻了一次，小李沒(méi)有翻，請(qǐng)問(wèn)現(xiàn)在是正面還是背面朝上？"在這個(gè)測(cè)試中，兩種AI系統(tǒng)使用思維草稿法都達(dá)到了100%的準(zhǔn)確率，但GPT-4o的詞匯使用量從52個(gè)減少到17個(gè)，Claude 3.5 Sonnet從135個(gè)減少到19個(gè)，效率提升令人矚目。

**四、方法的核心：如何教會(huì)AI"寫草稿"**

思維草稿法的實(shí)現(xiàn)原理其實(shí)相當(dāng)簡(jiǎn)單，但需要精心設(shè)計(jì)。研究團(tuán)隊(duì)的核心策略是改變AI的"寫作指令"，讓它像人類做筆記一樣思考，而不是像寫正式報(bào)告一樣詳細(xì)解釋每個(gè)步驟。

具體來(lái)說(shuō)，傳統(tǒng)的思維鏈方法會(huì)給AI這樣的指令："請(qǐng)逐步思考以下問(wèn)題，在回答結(jié)尾用四個(gè)井號(hào)標(biāo)記最終答案。"而思維草稿法的指令則是："請(qǐng)逐步思考，但每個(gè)思考步驟最多只用5個(gè)詞，在回答結(jié)尾用四個(gè)井號(hào)標(biāo)記最終答案。"

這個(gè)看似微小的改變產(chǎn)生了巨大的效果。當(dāng)面對(duì)"小明有20個(gè)糖果，給了小紅一些，現(xiàn)在剩12個(gè)，給了多少個(gè)？"這個(gè)問(wèn)題時(shí)，傳統(tǒng)方法會(huì)生成類似這樣的回答："讓我們逐步分析這個(gè)問(wèn)題。首先，小明最初有20個(gè)糖果。然后，他給了小紅一些糖果后，還剩下12個(gè)糖果。為了找出給了多少個(gè)糖果，我們需要計(jì)算初始數(shù)量和剩余數(shù)量的差值..."

而思維草稿法的回答則簡(jiǎn)潔得多："20-x=12；x=20-12=8。####8"

這種差異不僅體現(xiàn)在文字?jǐn)?shù)量上，更重要的是思維方式的轉(zhuǎn)變。傳統(tǒng)方法像是讓AI扮演一個(gè)耐心的老師，需要詳細(xì)解釋每個(gè)步驟的邏輯和原因。而思維草稿法讓AI更像一個(gè)熟練的專家，直接抓住問(wèn)題的核心，用最簡(jiǎn)潔的方式表達(dá)關(guān)鍵步驟。

研究團(tuán)隊(duì)還發(fā)現(xiàn)，這種方法需要通過(guò)示例來(lái)"訓(xùn)練"AI的行為模式。他們?yōu)槊糠N任務(wù)類型手工編寫了草稿式的示例，讓AI學(xué)習(xí)這種簡(jiǎn)潔的表達(dá)方式。這就像教一個(gè)學(xué)生如何做筆記——不是告訴他們做筆記的理論，而是展示什么樣的筆記是有效的。

**五、局限性：并非萬(wàn)能的解決方案**

盡管思維草稿法展現(xiàn)出了令人印象深刻的效果，但研究團(tuán)隊(duì)也誠(chéng)實(shí)地指出了這種方法的局限性。最主要的問(wèn)題是，這種方法高度依賴于示例引導(dǎo)，如果沒(méi)有恰當(dāng)?shù)睦?，AI往往無(wú)法自發(fā)地采用草稿式思維。

當(dāng)研究團(tuán)隊(duì)測(cè)試"零示例"情況時(shí)，也就是不給AI任何草稿式思維的例子，直接要求它用簡(jiǎn)潔方式思考時(shí)，效果大打折扣。在數(shù)學(xué)問(wèn)題測(cè)試中，GPT-4o的準(zhǔn)確率從標(biāo)準(zhǔn)的56.9%只提升到84.4%，遠(yuǎn)低于有示例指導(dǎo)時(shí)的91.1%。Claude 3.5 Sonnet的表現(xiàn)更差，準(zhǔn)確率只從61.9%輕微提升到65.5%。

這個(gè)現(xiàn)象反映了一個(gè)深層問(wèn)題：目前的AI系統(tǒng)在訓(xùn)練過(guò)程中接觸的主要是詳細(xì)、完整的文本，很少見(jiàn)到草稿式的簡(jiǎn)潔推理過(guò)程。這就像一個(gè)從小只讀過(guò)正式文學(xué)作品的人，突然被要求寫筆記或做摘要，會(huì)感到不知所措。

另一個(gè)重要局限是在小型AI模型上的表現(xiàn)。研究團(tuán)隊(duì)測(cè)試了幾個(gè)參數(shù)量少于30億的小型模型，包括Qwen2.5、Llama 3.2和Zoom自研的SLM模型。結(jié)果顯示，這些模型使用思維草稿法時(shí)，雖然能減少詞匯使用量，但準(zhǔn)確率下降更為明顯。比如Qwen2.5-3B模型使用傳統(tǒng)方法的準(zhǔn)確率為59.1%，使用思維草稿法時(shí)降至43.1%。

研究團(tuán)隊(duì)分析認(rèn)為，這是因?yàn)樾⌒湍Ｐ偷?理解能力"相對(duì)有限，需要更多的中間步驟來(lái)"想清楚"問(wèn)題。就像一個(gè)剛學(xué)會(huì)解題的學(xué)生，如果強(qiáng)制要求他們簡(jiǎn)化步驟，可能會(huì)導(dǎo)致思路混亂。而大型模型由于"經(jīng)驗(yàn)"更豐富，能夠在簡(jiǎn)化表達(dá)的同時(shí)保持思維的連貫性。

**六、實(shí)際應(yīng)用：改變AI使用的游戲規(guī)則**

思維草稿法的意義遠(yuǎn)遠(yuǎn)超出了學(xué)術(shù)研究的范圍，它可能會(huì)根本性地改變我們使用AI的方式，特別是在成本和效率至關(guān)重要的商業(yè)應(yīng)用中。

在客服系統(tǒng)中，這種方法能夠顯著降低運(yùn)營(yíng)成本。傳統(tǒng)的AI客服在處理復(fù)雜查詢時(shí)，往往會(huì)生成冗長(zhǎng)的內(nèi)部推理過(guò)程，雖然用戶看不到這些過(guò)程，但每個(gè)字符都需要計(jì)算資源。使用思維草稿法，AI可以用更少的計(jì)算資源得出同樣準(zhǔn)確的答案，這意味著同樣的服務(wù)器可以同時(shí)處理更多用戶請(qǐng)求。

在教育技術(shù)領(lǐng)域，這種方法特別有價(jià)值。當(dāng)學(xué)生提交數(shù)學(xué)或邏輯問(wèn)題時(shí)，AI家教不需要生成冗長(zhǎng)的解釋過(guò)程來(lái)"思考"答案，而可以快速給出準(zhǔn)確回應(yīng)，然后將節(jié)省的計(jì)算資源用于生成更個(gè)性化的教學(xué)內(nèi)容。這就像把一個(gè)反應(yīng)慢但最終很準(zhǔn)確的老師，變成了一個(gè)反應(yīng)敏捷且同樣準(zhǔn)確的老師。

在金融分析、醫(yī)療診斷輔助等對(duì)實(shí)時(shí)性要求很高的專業(yè)領(lǐng)域，思維草稿法能夠讓AI系統(tǒng)更快地處理大量信息并給出初步判斷。雖然這些領(lǐng)域仍需要人類專家的最終確認(rèn)，但AI的快速預(yù)處理可以大大提高整體工作效率。

研究團(tuán)隊(duì)還指出，這種方法可以與其他效率優(yōu)化技術(shù)結(jié)合使用。比如與并行處理、智能緩存等技術(shù)配合，進(jìn)一步提升AI系統(tǒng)的整體性能。這種組合效應(yīng)可能會(huì)讓AI服務(wù)的成本降低到目前的十分之一甚至更少。

從更宏觀的角度看，思維草稿法代表了AI發(fā)展的一個(gè)重要方向：不僅要讓AI更聰明，還要讓AI更高效。隨著AI應(yīng)用的普及，計(jì)算資源和能源消耗已經(jīng)成為不可忽視的問(wèn)題。通過(guò)優(yōu)化AI的"思維方式"，我們可以在保持智能水平的同時(shí)，大幅降低資源消耗。

研究團(tuán)隊(duì)建議，未來(lái)的AI訓(xùn)練過(guò)程應(yīng)該專門包含草稿式推理的數(shù)據(jù)，讓AI從"幼兒期"就學(xué)會(huì)這種高效的思維模式。這可能需要重新設(shè)計(jì)訓(xùn)練數(shù)據(jù)集，加入更多簡(jiǎn)潔而準(zhǔn)確的推理示例。同時(shí)，他們也在探索如何讓AI自動(dòng)學(xué)會(huì)在不同情況下選擇合適的詳細(xì)程度——在需要解釋時(shí)詳細(xì)，在只需要答案時(shí)簡(jiǎn)潔。

說(shuō)到底，Zoom團(tuán)隊(duì)的這項(xiàng)研究揭示了一個(gè)簡(jiǎn)單而深刻的道理：有時(shí)候，說(shuō)得少反而能想得更好。就像人類在解決問(wèn)題時(shí)依靠簡(jiǎn)潔的草稿和要點(diǎn)一樣，AI也可以通過(guò)減少不必要的"話語(yǔ)"來(lái)提高思維效率。這不僅僅是技術(shù)上的改進(jìn)，更是對(duì)智能本質(zhì)的重新理解——真正的智能不是能說(shuō)多少話，而是能用最少的信息達(dá)到最準(zhǔn)確的結(jié)果。

這項(xiàng)研究的影響可能會(huì)持續(xù)很多年。隨著越來(lái)越多的開(kāi)發(fā)者和企業(yè)開(kāi)始采用思維草稿法，我們可能會(huì)看到AI服務(wù)變得更便宜、更快速，同時(shí)保持同樣的可靠性。對(duì)于普通用戶而言，這意味著更好的AI體驗(yàn)；對(duì)于企業(yè)而言，這意味著更低的運(yùn)營(yíng)成本；對(duì)于整個(gè)社會(huì)而言，這意味著更可持續(xù)的AI發(fā)展模式。

當(dāng)然，這種方法還需要進(jìn)一步的完善和驗(yàn)證，特別是在更多復(fù)雜場(chǎng)景下的應(yīng)用。但研究團(tuán)隊(duì)已經(jīng)為我們打開(kāi)了一扇新的大門，讓我們看到了AI效率優(yōu)化的巨大潛力。有興趣深入了解技術(shù)細(xì)節(jié)的讀者，可以通過(guò)arXiv:2502.18600v2訪問(wèn)完整的研究論文，其中包含了詳細(xì)的實(shí)驗(yàn)數(shù)據(jù)和技術(shù)實(shí)現(xiàn)方案。

Q&A

Q1：思維草稿法是什么？它是如何工作的？ A：思維草稿法是一種讓AI模仿人類簡(jiǎn)潔思考的新方法。不像傳統(tǒng)AI需要詳細(xì)解釋每個(gè)步驟，這種方法讓AI只記錄最關(guān)鍵的信息點(diǎn)，就像我們做筆記時(shí)只寫要點(diǎn)一樣。通過(guò)限制每個(gè)思考步驟最多用5個(gè)詞，AI能更快地找到答案。

Q2：使用思維草稿法會(huì)不會(huì)影響AI回答的準(zhǔn)確性？ A：研究顯示準(zhǔn)確性基本不受影響，有時(shí)甚至更準(zhǔn)確。以數(shù)學(xué)問(wèn)題為例，GPT-4o的準(zhǔn)確率只從95.4%下降到91.1%，但處理速度快了4倍多。在某些任務(wù)中，簡(jiǎn)潔的思維反而幫助AI避免被冗長(zhǎng)信息"繞糊涂"，提高了準(zhǔn)確性。

Q3：普通用戶什么時(shí)候能體驗(yàn)到這種技術(shù)帶來(lái)的改進(jìn)？ A：這種方法可以立即應(yīng)用到現(xiàn)有的AI系統(tǒng)中，不需要重新訓(xùn)練模型。目前主要限制是需要為不同任務(wù)設(shè)計(jì)合適的示例。隨著更多企業(yè)采用這種方法，用戶很快就能享受到更快、更便宜的AI服務(wù)，特別是在客服、教育和專業(yè)咨詢等領(lǐng)域。

人工智能推理優(yōu)化效率提升

分享至

0贊

好文章，需要你的鼓勵(lì)

推薦文章

音頻生成
大語(yǔ)言模型
多模態(tài)AI

2025-09-10 09:47

如何讓AI像電影配樂(lè)師一樣創(chuàng)作完整的長(zhǎng)篇音頻故事——騰訊ARC實(shí)驗(yàn)室團(tuán)隊(duì)AudioStory突破性進(jìn)展

騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng)，首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長(zhǎng)篇音頻故事。該系統(tǒng)結(jié)合大語(yǔ)言模型的敘事推理能力與音頻生成技術(shù)，通過(guò)交錯(cuò)式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練，能夠?qū)?fù)雜指令分解為連續(xù)音頻場(chǎng)景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異，為AI音頻創(chuàng)作開(kāi)辟新方向。
視頻生成
深度學(xué)習(xí)
多模態(tài)學(xué)習(xí)

2025-09-09 13:57

Meta與特拉維夫大學(xué)聯(lián)手打造VideoJAM：讓AI生成的視頻動(dòng)起來(lái)不再是奢望

Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù)，通過(guò)讓AI同時(shí)學(xué)習(xí)外觀和運(yùn)動(dòng)信息，顯著解決了當(dāng)前視頻生成模型中動(dòng)作不連貫、違反物理定律的核心問(wèn)題。該技術(shù)僅需添加兩個(gè)線性層就能大幅提升運(yùn)動(dòng)質(zhì)量，在多項(xiàng)測(cè)試中超越包括Sora在內(nèi)的商業(yè)模型，為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
多模態(tài)AI
人類價(jià)值觀對(duì)齊
數(shù)據(jù)集構(gòu)建

2025-09-09 13:56

上海AI實(shí)驗(yàn)室重磅發(fā)布：讓AI看圖"說(shuō)人話"的神奇訓(xùn)練法，解決多模態(tài)AI與人類價(jià)值觀對(duì)齊難題

上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究，首次系統(tǒng)性解決多模態(tài)大語(yǔ)言模型人性化對(duì)話問(wèn)題。該研究創(chuàng)建了包含20萬(wàn)高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評(píng)測(cè)基準(zhǔn)，通過(guò)創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法，讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平，為AI價(jià)值觀對(duì)齊提供了可行技術(shù)路徑。
人工智能
圖神經(jīng)網(wǎng)絡(luò)
天氣預(yù)報(bào)

2025-09-09 10:56

谷歌研究團(tuán)隊(duì)發(fā)布超級(jí)預(yù)測(cè)模型：讓AI像天氣預(yù)報(bào)員一樣預(yù)測(cè)全球大氣變化

谷歌DeepMind團(tuán)隊(duì)開(kāi)發(fā)的GraphCast是一個(gè)革命性的AI天氣預(yù)測(cè)模型，能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào)，準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù)，通過(guò)學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律，在極端天氣預(yù)測(cè)方面表現(xiàn)卓越，能耗僅為傳統(tǒng)方法的千分之一，為氣象學(xué)領(lǐng)域帶來(lái)了效率和精度的雙重突破。

如何讓AI像電影配樂(lè)師一樣創(chuàng)作完整的長(zhǎng)篇音頻故事——騰訊ARC實(shí)驗(yàn)室團(tuán)隊(duì)AudioStory突破性進(jìn)展

如何讓AI像電影配樂(lè)師一樣創(chuàng)作完整的長(zhǎng)篇音頻故事——騰訊ARC實(shí)驗(yàn)室團(tuán)隊(duì)AudioStory突破性進(jìn)展

2025-09-10 09:47

Meta與特拉維夫大學(xué)聯(lián)手打造VideoJAM：讓AI生成的視頻動(dòng)起來(lái)不再是奢望

Meta與特拉維夫大學(xué)聯(lián)手打造VideoJAM：讓AI生成的視頻動(dòng)起來(lái)不再是奢望

2025-09-09 13:57

上海AI實(shí)驗(yàn)室重磅發(fā)布：讓AI看圖"說(shuō)人話"的神奇訓(xùn)練法，解決多模態(tài)AI與人類價(jià)值觀對(duì)齊難題

上海AI實(shí)驗(yàn)室重磅發(fā)布：讓AI看圖"說(shuō)人話"的神奇訓(xùn)練法，解決多模態(tài)AI與人類價(jià)值觀對(duì)齊難題

2025-09-09 13:56

谷歌研究團(tuán)隊(duì)發(fā)布超級(jí)預(yù)測(cè)模型：讓AI像天氣預(yù)報(bào)員一樣預(yù)測(cè)全球大氣變化

谷歌研究團(tuán)隊(duì)發(fā)布超級(jí)預(yù)測(cè)模型：讓AI像天氣預(yù)報(bào)員一樣預(yù)測(cè)全球大氣變化

2025-09-09 10:56

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

友情鏈接

至頂網(wǎng)
管理現(xiàn)代化
和訊IT
TechWeb
第三媒體
速途網(wǎng)
51CTO傳媒
投資界
科技訊
智者新時(shí)代

京ICP證15039648號(hào) 京ICP備15039648號(hào)-9 京公網(wǎng)安備 11010802021500號(hào)

北京第二十六維信息技術(shù)有限公司（至頂網(wǎng)）版權(quán)所有。 | 聯(lián)絡(luò)我們

舉報(bào)電話：010-62641205　涉未成年人舉報(bào)專線：010-62641208 舉報(bào)郵箱: jubao@zhiding.cn 　網(wǎng)上有害信息舉報(bào)專區(qū)：https://www.12377.cn