av天堂久久天堂色综合,最近中文字幕mv免费高清在线,在线a级毛片免费视频,av动漫,中文字幕精品亚洲无线码一区

微信掃一掃,關(guān)注公眾號(hào)

  • 科技行者

  • 算力行者

見(jiàn)證連接與計(jì)算的「力量」

首頁(yè) AI推理新突破:Zoom團(tuán)隊(duì)發(fā)現(xiàn)的"寫少想快"秘密讓ChatGPT效率飆升80%

AI推理新突破:Zoom團(tuán)隊(duì)發(fā)現(xiàn)的"寫少想快"秘密讓ChatGPT效率飆升80%

2025-07-31 11:27
分享至:
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-
2025-07-31 11:27 ? 科技行者

這項(xiàng)突破性研究來(lái)自Zoom通信公司的四位研究員——徐思蕾、謝文浩、趙凌霄和何鵬程,于2025年3月發(fā)表在計(jì)算機(jī)科學(xué)預(yù)印本平臺(tái)arXiv上。有興趣深入了解的讀者可以通過(guò)論文編號(hào)arXiv:2502.18600v2訪問(wèn)完整研究報(bào)告。

當(dāng)我們解決復(fù)雜問(wèn)題時(shí),比如算數(shù)學(xué)題或者分析復(fù)雜情況,大腦通常會(huì)在紙上快速記錄關(guān)鍵信息——幾個(gè)數(shù)字、一個(gè)公式、幾個(gè)要點(diǎn),而不是寫出完整的句子和詳細(xì)解釋。然而,目前最先進(jìn)的AI系統(tǒng)如GPT和Claude在處理問(wèn)題時(shí),卻像一個(gè)過(guò)分詳細(xì)的學(xué)生,每一步都要寫出完整的解釋和冗長(zhǎng)的推理過(guò)程。這種做法雖然看起來(lái)很"聰明",但實(shí)際上浪費(fèi)了大量時(shí)間和計(jì)算資源。

Zoom研究團(tuán)隊(duì)的這項(xiàng)發(fā)現(xiàn)徹底顛覆了我們對(duì)AI推理的認(rèn)知。他們發(fā)現(xiàn),如果讓AI模仿人類的簡(jiǎn)化思考方式——只記錄最關(guān)鍵的信息點(diǎn)而不是冗長(zhǎng)的解釋——不僅能保持同樣的準(zhǔn)確性,還能將處理速度提升數(shù)倍,同時(shí)大幅降低使用成本。這就好比把一個(gè)啰嗦的顧問(wèn)變成了一個(gè)簡(jiǎn)潔高效的專家,既快又準(zhǔn)。

研究團(tuán)隊(duì)將這種新方法命名為"思維草稿法"(Chain of Draft,簡(jiǎn)稱CoD),與目前廣泛使用的"思維鏈法"(Chain of Thought,簡(jiǎn)稱CoT)形成鮮明對(duì)比。傳統(tǒng)的思維鏈法就像讓AI寫詳細(xì)的作文,而思維草稿法則像讓AI只寫要點(diǎn)和關(guān)鍵步驟。實(shí)驗(yàn)結(jié)果令人震撼:在保持幾乎相同準(zhǔn)確率的情況下,新方法只使用了傳統(tǒng)方法7.6%的文字量,大幅減少了處理時(shí)間和計(jì)算成本。

**一、從"話癆AI"到"簡(jiǎn)潔專家"的轉(zhuǎn)變**

目前的AI推理系統(tǒng)存在一個(gè)有趣的矛盾。當(dāng)你問(wèn)ChatGPT或Claude一個(gè)數(shù)學(xué)問(wèn)題時(shí),它們會(huì)像剛學(xué)會(huì)說(shuō)話的小孩一樣,把每個(gè)步驟都解釋得非常詳細(xì)。比如解決"小明原來(lái)有20個(gè)糖果,給了小紅一些,現(xiàn)在還剩12個(gè),問(wèn)給了多少個(gè)?"這樣的簡(jiǎn)單問(wèn)題,傳統(tǒng)AI會(huì)寫出一長(zhǎng)串解釋:先說(shuō)小明原來(lái)有多少個(gè),再說(shuō)現(xiàn)在有多少個(gè),然后解釋為什么要用減法,最后才給出答案。

這種詳細(xì)解釋在某些教學(xué)場(chǎng)景下確實(shí)有用,但在大多數(shù)實(shí)際應(yīng)用中卻是不必要的負(fù)擔(dān)。就像你在超市買東西時(shí),不需要收銀員詳細(xì)解釋每一步計(jì)算過(guò)程,你只需要知道總價(jià)是多少。

研究團(tuán)隊(duì)通過(guò)對(duì)比發(fā)現(xiàn),傳統(tǒng)的思維鏈方法雖然提高了AI的推理準(zhǔn)確性,但代價(jià)是生成了大量冗余信息。以Claude 3.5 Sonnet為例,在處理數(shù)學(xué)問(wèn)題時(shí),傳統(tǒng)方法平均需要生成190個(gè)詞匯單位才能給出答案,而新的思維草稿法只需要40個(gè)詞匯單位就能達(dá)到幾乎相同的準(zhǔn)確率。這相當(dāng)于把一篇800字的文章壓縮成160字的摘要,但保持了所有重要信息。

更令人驚訝的是,這種簡(jiǎn)化不僅沒(méi)有損害AI的推理能力,在某些情況下甚至提高了準(zhǔn)確性。這是因?yàn)檫^(guò)多的冗余信息有時(shí)會(huì)讓AI"迷失"在自己的解釋中,而簡(jiǎn)潔的要點(diǎn)能幫助AI更好地專注于核心問(wèn)題。

**二、人類智慧的啟發(fā):為什么少即是多**

這項(xiàng)研究的核心洞察來(lái)自對(duì)人類思維過(guò)程的觀察。當(dāng)我們面對(duì)復(fù)雜問(wèn)題時(shí),大腦實(shí)際上采用的是一種高度優(yōu)化的信息處理策略。以解數(shù)學(xué)題為例,我們通常會(huì)在紙上快速寫下關(guān)鍵數(shù)字和符號(hào),比如"20-x=12",然后直接得出"x=8",而不會(huì)寫"首先,我注意到小明原來(lái)有20個(gè)糖果,這是我們的起始數(shù)量..."這樣的完整句子。

研究團(tuán)隊(duì)意識(shí)到,人類的這種"草稿式思考"實(shí)際上是經(jīng)過(guò)數(shù)千年進(jìn)化優(yōu)化的信息處理方式。我們的大腦天然傾向于提取和保留最關(guān)鍵的信息,同時(shí)舍棄不必要的細(xì)節(jié)。這種能力讓人類能夠在有限的認(rèn)知資源下處理復(fù)雜問(wèn)題。

將這種思維模式應(yīng)用到AI系統(tǒng)中,研究團(tuán)隊(duì)發(fā)現(xiàn)了令人興奮的結(jié)果。通過(guò)指導(dǎo)AI只生成最必要的中間步驟,而不是詳細(xì)的解釋文字,AI不僅能更快地找到答案,還能避免被自己生成的冗長(zhǎng)文字"繞糊涂"。這就像給一個(gè)容易跑題的學(xué)生提供了一個(gè)簡(jiǎn)潔的提綱,幫助他們保持專注。

研究還發(fā)現(xiàn),這種方法特別適合那些有明確邏輯結(jié)構(gòu)的問(wèn)題。在數(shù)學(xué)計(jì)算、邏輯推理和符號(hào)操作等任務(wù)中,關(guān)鍵信息往往可以用簡(jiǎn)單的符號(hào)和數(shù)字表達(dá),而不需要冗長(zhǎng)的自然語(yǔ)言描述。

**三、實(shí)戰(zhàn)效果:三大領(lǐng)域的驚人表現(xiàn)**

為了驗(yàn)證思維草稿法的實(shí)際效果,研究團(tuán)隊(duì)在三個(gè)不同的認(rèn)知領(lǐng)域進(jìn)行了全面測(cè)試:數(shù)學(xué)推理、常識(shí)推理和符號(hào)推理。這些領(lǐng)域代表了AI系統(tǒng)需要處理的主要思維類型,從具體的計(jì)算到抽象的邏輯操作。

在數(shù)學(xué)推理測(cè)試中,研究團(tuán)隊(duì)使用了GSM8K數(shù)據(jù)集,這是一個(gè)包含8500道小學(xué)數(shù)學(xué)應(yīng)用題的標(biāo)準(zhǔn)測(cè)試集。結(jié)果顯示,GPT-4o使用傳統(tǒng)詳細(xì)解釋方法的準(zhǔn)確率為95.4%,每個(gè)回答平均需要205個(gè)詞匯單位,處理時(shí)間為4.2秒。而使用思維草稿法時(shí),準(zhǔn)確率達(dá)到91.1%,只需要44個(gè)詞匯單位,處理時(shí)間縮短到1.0秒。Claude 3.5 Sonnet的表現(xiàn)更加出色,準(zhǔn)確率從95.8%下降到91.4%,但詞匯使用量從190個(gè)減少到40個(gè),處理時(shí)間從3.1秒降至1.6秒。

這種差異在實(shí)際應(yīng)用中意味著什么呢?假設(shè)你運(yùn)營(yíng)一個(gè)在線教育平臺(tái),每天需要處理10萬(wàn)個(gè)學(xué)生的數(shù)學(xué)問(wèn)題。使用傳統(tǒng)方法,每個(gè)問(wèn)題的處理成本和時(shí)間都很高,而使用思維草稿法,不僅能將成本降低80%以上,還能讓學(xué)生幾乎立即得到答案,極大提升用戶體驗(yàn)。

在常識(shí)推理測(cè)試中,研究團(tuán)隊(duì)評(píng)估了AI理解日期和體育知識(shí)的能力。這類問(wèn)題需要AI調(diào)用背景知識(shí)并進(jìn)行邏輯推理,比如"如果今天是星期三,三天后是星期幾?"在日期理解任務(wù)中,GPT-4o使用思維草稿法的準(zhǔn)確率為88.1%,詞匯使用量只有傳統(tǒng)方法的40%。更有趣的是,Claude 3.5 Sonnet在體育知識(shí)問(wèn)答中使用思維草稿法時(shí),準(zhǔn)確率從93.2%提升到97.3%,同時(shí)詞匯使用量從189個(gè)驟降至14個(gè),降幅達(dá)到92.4%。

符號(hào)推理測(cè)試使用了拋硬幣任務(wù),這類問(wèn)題需要AI追蹤一系列操作的結(jié)果。比如"硬幣開(kāi)始是正面朝上,小明翻了一次,小紅翻了一次,小李沒(méi)有翻,請(qǐng)問(wèn)現(xiàn)在是正面還是背面朝上?"在這個(gè)測(cè)試中,兩種AI系統(tǒng)使用思維草稿法都達(dá)到了100%的準(zhǔn)確率,但GPT-4o的詞匯使用量從52個(gè)減少到17個(gè),Claude 3.5 Sonnet從135個(gè)減少到19個(gè),效率提升令人矚目。

**四、方法的核心:如何教會(huì)AI"寫草稿"**

思維草稿法的實(shí)現(xiàn)原理其實(shí)相當(dāng)簡(jiǎn)單,但需要精心設(shè)計(jì)。研究團(tuán)隊(duì)的核心策略是改變AI的"寫作指令",讓它像人類做筆記一樣思考,而不是像寫正式報(bào)告一樣詳細(xì)解釋每個(gè)步驟。

具體來(lái)說(shuō),傳統(tǒng)的思維鏈方法會(huì)給AI這樣的指令:"請(qǐng)逐步思考以下問(wèn)題,在回答結(jié)尾用四個(gè)井號(hào)標(biāo)記最終答案。"而思維草稿法的指令則是:"請(qǐng)逐步思考,但每個(gè)思考步驟最多只用5個(gè)詞,在回答結(jié)尾用四個(gè)井號(hào)標(biāo)記最終答案。"

這個(gè)看似微小的改變產(chǎn)生了巨大的效果。當(dāng)面對(duì)"小明有20個(gè)糖果,給了小紅一些,現(xiàn)在剩12個(gè),給了多少個(gè)?"這個(gè)問(wèn)題時(shí),傳統(tǒng)方法會(huì)生成類似這樣的回答:"讓我們逐步分析這個(gè)問(wèn)題。首先,小明最初有20個(gè)糖果。然后,他給了小紅一些糖果后,還剩下12個(gè)糖果。為了找出給了多少個(gè)糖果,我們需要計(jì)算初始數(shù)量和剩余數(shù)量的差值..."

而思維草稿法的回答則簡(jiǎn)潔得多:"20-x=12;x=20-12=8。####8"

這種差異不僅體現(xiàn)在文字?jǐn)?shù)量上,更重要的是思維方式的轉(zhuǎn)變。傳統(tǒng)方法像是讓AI扮演一個(gè)耐心的老師,需要詳細(xì)解釋每個(gè)步驟的邏輯和原因。而思維草稿法讓AI更像一個(gè)熟練的專家,直接抓住問(wèn)題的核心,用最簡(jiǎn)潔的方式表達(dá)關(guān)鍵步驟。

研究團(tuán)隊(duì)還發(fā)現(xiàn),這種方法需要通過(guò)示例來(lái)"訓(xùn)練"AI的行為模式。他們?yōu)槊糠N任務(wù)類型手工編寫了草稿式的示例,讓AI學(xué)習(xí)這種簡(jiǎn)潔的表達(dá)方式。這就像教一個(gè)學(xué)生如何做筆記——不是告訴他們做筆記的理論,而是展示什么樣的筆記是有效的。

**五、局限性:并非萬(wàn)能的解決方案**

盡管思維草稿法展現(xiàn)出了令人印象深刻的效果,但研究團(tuán)隊(duì)也誠(chéng)實(shí)地指出了這種方法的局限性。最主要的問(wèn)題是,這種方法高度依賴于示例引導(dǎo),如果沒(méi)有恰當(dāng)?shù)睦?,AI往往無(wú)法自發(fā)地采用草稿式思維。

當(dāng)研究團(tuán)隊(duì)測(cè)試"零示例"情況時(shí),也就是不給AI任何草稿式思維的例子,直接要求它用簡(jiǎn)潔方式思考時(shí),效果大打折扣。在數(shù)學(xué)問(wèn)題測(cè)試中,GPT-4o的準(zhǔn)確率從標(biāo)準(zhǔn)的56.9%只提升到84.4%,遠(yuǎn)低于有示例指導(dǎo)時(shí)的91.1%。Claude 3.5 Sonnet的表現(xiàn)更差,準(zhǔn)確率只從61.9%輕微提升到65.5%。

這個(gè)現(xiàn)象反映了一個(gè)深層問(wèn)題:目前的AI系統(tǒng)在訓(xùn)練過(guò)程中接觸的主要是詳細(xì)、完整的文本,很少見(jiàn)到草稿式的簡(jiǎn)潔推理過(guò)程。這就像一個(gè)從小只讀過(guò)正式文學(xué)作品的人,突然被要求寫筆記或做摘要,會(huì)感到不知所措。

另一個(gè)重要局限是在小型AI模型上的表現(xiàn)。研究團(tuán)隊(duì)測(cè)試了幾個(gè)參數(shù)量少于30億的小型模型,包括Qwen2.5、Llama 3.2和Zoom自研的SLM模型。結(jié)果顯示,這些模型使用思維草稿法時(shí),雖然能減少詞匯使用量,但準(zhǔn)確率下降更為明顯。比如Qwen2.5-3B模型使用傳統(tǒng)方法的準(zhǔn)確率為59.1%,使用思維草稿法時(shí)降至43.1%。

研究團(tuán)隊(duì)分析認(rèn)為,這是因?yàn)樾⌒湍P偷?理解能力"相對(duì)有限,需要更多的中間步驟來(lái)"想清楚"問(wèn)題。就像一個(gè)剛學(xué)會(huì)解題的學(xué)生,如果強(qiáng)制要求他們簡(jiǎn)化步驟,可能會(huì)導(dǎo)致思路混亂。而大型模型由于"經(jīng)驗(yàn)"更豐富,能夠在簡(jiǎn)化表達(dá)的同時(shí)保持思維的連貫性。

**六、實(shí)際應(yīng)用:改變AI使用的游戲規(guī)則**

思維草稿法的意義遠(yuǎn)遠(yuǎn)超出了學(xué)術(shù)研究的范圍,它可能會(huì)根本性地改變我們使用AI的方式,特別是在成本和效率至關(guān)重要的商業(yè)應(yīng)用中。

在客服系統(tǒng)中,這種方法能夠顯著降低運(yùn)營(yíng)成本。傳統(tǒng)的AI客服在處理復(fù)雜查詢時(shí),往往會(huì)生成冗長(zhǎng)的內(nèi)部推理過(guò)程,雖然用戶看不到這些過(guò)程,但每個(gè)字符都需要計(jì)算資源。使用思維草稿法,AI可以用更少的計(jì)算資源得出同樣準(zhǔn)確的答案,這意味著同樣的服務(wù)器可以同時(shí)處理更多用戶請(qǐng)求。

在教育技術(shù)領(lǐng)域,這種方法特別有價(jià)值。當(dāng)學(xué)生提交數(shù)學(xué)或邏輯問(wèn)題時(shí),AI家教不需要生成冗長(zhǎng)的解釋過(guò)程來(lái)"思考"答案,而可以快速給出準(zhǔn)確回應(yīng),然后將節(jié)省的計(jì)算資源用于生成更個(gè)性化的教學(xué)內(nèi)容。這就像把一個(gè)反應(yīng)慢但最終很準(zhǔn)確的老師,變成了一個(gè)反應(yīng)敏捷且同樣準(zhǔn)確的老師。

在金融分析、醫(yī)療診斷輔助等對(duì)實(shí)時(shí)性要求很高的專業(yè)領(lǐng)域,思維草稿法能夠讓AI系統(tǒng)更快地處理大量信息并給出初步判斷。雖然這些領(lǐng)域仍需要人類專家的最終確認(rèn),但AI的快速預(yù)處理可以大大提高整體工作效率。

研究團(tuán)隊(duì)還指出,這種方法可以與其他效率優(yōu)化技術(shù)結(jié)合使用。比如與并行處理、智能緩存等技術(shù)配合,進(jìn)一步提升AI系統(tǒng)的整體性能。這種組合效應(yīng)可能會(huì)讓AI服務(wù)的成本降低到目前的十分之一甚至更少。

從更宏觀的角度看,思維草稿法代表了AI發(fā)展的一個(gè)重要方向:不僅要讓AI更聰明,還要讓AI更高效。隨著AI應(yīng)用的普及,計(jì)算資源和能源消耗已經(jīng)成為不可忽視的問(wèn)題。通過(guò)優(yōu)化AI的"思維方式",我們可以在保持智能水平的同時(shí),大幅降低資源消耗。

研究團(tuán)隊(duì)建議,未來(lái)的AI訓(xùn)練過(guò)程應(yīng)該專門包含草稿式推理的數(shù)據(jù),讓AI從"幼兒期"就學(xué)會(huì)這種高效的思維模式。這可能需要重新設(shè)計(jì)訓(xùn)練數(shù)據(jù)集,加入更多簡(jiǎn)潔而準(zhǔn)確的推理示例。同時(shí),他們也在探索如何讓AI自動(dòng)學(xué)會(huì)在不同情況下選擇合適的詳細(xì)程度——在需要解釋時(shí)詳細(xì),在只需要答案時(shí)簡(jiǎn)潔。

說(shuō)到底,Zoom團(tuán)隊(duì)的這項(xiàng)研究揭示了一個(gè)簡(jiǎn)單而深刻的道理:有時(shí)候,說(shuō)得少反而能想得更好。就像人類在解決問(wèn)題時(shí)依靠簡(jiǎn)潔的草稿和要點(diǎn)一樣,AI也可以通過(guò)減少不必要的"話語(yǔ)"來(lái)提高思維效率。這不僅僅是技術(shù)上的改進(jìn),更是對(duì)智能本質(zhì)的重新理解——真正的智能不是能說(shuō)多少話,而是能用最少的信息達(dá)到最準(zhǔn)確的結(jié)果。

這項(xiàng)研究的影響可能會(huì)持續(xù)很多年。隨著越來(lái)越多的開(kāi)發(fā)者和企業(yè)開(kāi)始采用思維草稿法,我們可能會(huì)看到AI服務(wù)變得更便宜、更快速,同時(shí)保持同樣的可靠性。對(duì)于普通用戶而言,這意味著更好的AI體驗(yàn);對(duì)于企業(yè)而言,這意味著更低的運(yùn)營(yíng)成本;對(duì)于整個(gè)社會(huì)而言,這意味著更可持續(xù)的AI發(fā)展模式。

當(dāng)然,這種方法還需要進(jìn)一步的完善和驗(yàn)證,特別是在更多復(fù)雜場(chǎng)景下的應(yīng)用。但研究團(tuán)隊(duì)已經(jīng)為我們打開(kāi)了一扇新的大門,讓我們看到了AI效率優(yōu)化的巨大潛力。有興趣深入了解技術(shù)細(xì)節(jié)的讀者,可以通過(guò)arXiv:2502.18600v2訪問(wèn)完整的研究論文,其中包含了詳細(xì)的實(shí)驗(yàn)數(shù)據(jù)和技術(shù)實(shí)現(xiàn)方案。

Q&A

Q1:思維草稿法是什么?它是如何工作的? A:思維草稿法是一種讓AI模仿人類簡(jiǎn)潔思考的新方法。不像傳統(tǒng)AI需要詳細(xì)解釋每個(gè)步驟,這種方法讓AI只記錄最關(guān)鍵的信息點(diǎn),就像我們做筆記時(shí)只寫要點(diǎn)一樣。通過(guò)限制每個(gè)思考步驟最多用5個(gè)詞,AI能更快地找到答案。

Q2:使用思維草稿法會(huì)不會(huì)影響AI回答的準(zhǔn)確性? A:研究顯示準(zhǔn)確性基本不受影響,有時(shí)甚至更準(zhǔn)確。以數(shù)學(xué)問(wèn)題為例,GPT-4o的準(zhǔn)確率只從95.4%下降到91.1%,但處理速度快了4倍多。在某些任務(wù)中,簡(jiǎn)潔的思維反而幫助AI避免被冗長(zhǎng)信息"繞糊涂",提高了準(zhǔn)確性。

Q3:普通用戶什么時(shí)候能體驗(yàn)到這種技術(shù)帶來(lái)的改進(jìn)? A:這種方法可以立即應(yīng)用到現(xiàn)有的AI系統(tǒng)中,不需要重新訓(xùn)練模型。目前主要限制是需要為不同任務(wù)設(shè)計(jì)合適的示例。隨著更多企業(yè)采用這種方法,用戶很快就能享受到更快、更便宜的AI服務(wù),特別是在客服、教育和專業(yè)咨詢等領(lǐng)域。

分享至
0贊

好文章,需要你的鼓勵(lì)

推薦文章
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-