av天堂久久天堂色综合,最近中文字幕mv免费高清在线,在线a级毛片免费视频,av动漫,中文字幕精品亚洲无线码一区

微信掃一掃,關(guān)注公眾號(hào)

  • 科技行者

  • 算力行者

見證連接與計(jì)算的「力量」

首頁 UC伯克利用"邊生成邊驗(yàn)證"新技術(shù)讓AI視覺模型告別"睜眼說瞎話"

UC伯克利用"邊生成邊驗(yàn)證"新技術(shù)讓AI視覺模型告別"睜眼說瞎話"

2025-07-14 09:51
分享至:
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-
2025-07-14 09:51 ? 科技行者

這項(xiàng)由加州大學(xué)伯克利分校(UC Berkeley)和韓國(guó)浦項(xiàng)科技大學(xué)(POSTECH)的研究團(tuán)隊(duì)于2025年5月發(fā)表的研究,為解決人工智能視覺模型的"幻覺"問題提供了突破性方案。該論文題為《Generate, but Verify: Reducing Hallucination in Vision-Language Models with Retrospective Resampling》,有興趣深入了解的讀者可以通過arXiv:2504.13169v2訪問完整論文。研究團(tuán)隊(duì)由UC伯克利的吳宗翰(Tsung-Han Wu)、李熙京(Heekyung Lee)、葛嘉欣(Jiaxin Ge)、Joseph E. Gonzalez、Trevor Darrell和David M. Chan等人組成。

當(dāng)前的視覺語言模型雖然在理解圖像內(nèi)容方面表現(xiàn)出色,但經(jīng)常出現(xiàn)一個(gè)令人頭疼的問題:它們會(huì)"看到"實(shí)際并不存在的東西,就像一個(gè)過度想象的人,明明圖片里只有一只貓,卻非要說還有一只狗在旁邊。這種現(xiàn)象被稱為"視覺幻覺",在自動(dòng)駕駛汽車、醫(yī)療診斷等安全關(guān)鍵領(lǐng)域可能帶來嚴(yán)重后果。

現(xiàn)有的解決方案主要分為兩類:一類是在生成過程中調(diào)整AI的行為,就像給一個(gè)愛夸大其詞的朋友提前打預(yù)防針;另一類是生成內(nèi)容后再請(qǐng)外部"專家"來檢查糾錯(cuò),類似于寫完作文后找老師批改。然而,前者一旦說錯(cuò)就無法糾正,后者則需要復(fù)雜的多重驗(yàn)證流程,往往只能選擇拒絕回答而非主動(dòng)改正。

研究團(tuán)隊(duì)開發(fā)的REVERSE系統(tǒng)(全稱"REtrospective VERification and SElf-correction",即"回顧性驗(yàn)證與自我糾正")首次將兩種方法完美融合,讓AI模型能夠在生成內(nèi)容的同時(shí)監(jiān)控自己是否在"胡說八道",一旦發(fā)現(xiàn)問題就立即回退重新思考,就像一個(gè)會(huì)自我反省的聰明學(xué)生。

一、讓AI學(xué)會(huì)自我懷疑:打造"幻覺感知"模型

傳統(tǒng)的AI模型就像一個(gè)過分自信的學(xué)生,無論說什么都很肯定,從不懷疑自己可能出錯(cuò)。REVERSE系統(tǒng)的第一個(gè)創(chuàng)新是教會(huì)AI模型學(xué)會(huì)"自我懷疑",讓它能夠識(shí)別自己可能在胡說八道的時(shí)刻。

研究團(tuán)隊(duì)構(gòu)建了一個(gè)包含130萬個(gè)樣本的特殊訓(xùn)練數(shù)據(jù)集,這個(gè)數(shù)據(jù)集的巧妙之處在于既包含正確的描述,也包含錯(cuò)誤的描述,并且用特殊標(biāo)記來區(qū)分它們。具體來說,他們引入了三個(gè)特殊的標(biāo)記符號(hào):``標(biāo)記重要短語的開始,``標(biāo)記可信內(nèi)容的結(jié)束,``標(biāo)記不可信內(nèi)容的結(jié)束。

這就好比教一個(gè)孩子看圖說話時(shí),不僅要告訴他"這是正確的說法",還要展示"這是錯(cuò)誤的說法",并且明確標(biāo)注哪些是對(duì)的哪些是錯(cuò)的。通過這種方式,AI模型學(xué)會(huì)了在生成內(nèi)容時(shí)自動(dòng)評(píng)估每個(gè)短語的可信度。

在訓(xùn)練過程中,研究團(tuán)隊(duì)采用了一種巧妙的損失函數(shù)設(shè)計(jì)。對(duì)于標(biāo)記為不可信的內(nèi)容,模型在訓(xùn)練時(shí)不會(huì)受到"懲罰",這樣避免了模型學(xué)會(huì)胡亂猜測(cè)的壞習(xí)慣。同時(shí),模型被鼓勵(lì)在遇到不確定內(nèi)容時(shí)生成``標(biāo)記,相當(dāng)于教會(huì)它說"我不確定這個(gè)"。

這種訓(xùn)練方法的效果相當(dāng)顯著。經(jīng)過訓(xùn)練的模型不再是那個(gè)盲目自信的"學(xué)霸",而是變成了一個(gè)懂得質(zhì)疑自己的"謹(jǐn)慎學(xué)生"。當(dāng)它描述圖片內(nèi)容時(shí),會(huì)在內(nèi)心給每個(gè)短語打分,判斷這個(gè)描述是否靠譜。

二、實(shí)時(shí)"回頭看":創(chuàng)新的回溯重采樣機(jī)制

REVERSE系統(tǒng)的第二個(gè)核心創(chuàng)新是"回溯重采樣"技術(shù),這就像給AI模型裝上了一個(gè)實(shí)時(shí)的"良心檢測(cè)器"。當(dāng)模型正在生成描述時(shí),系統(tǒng)會(huì)持續(xù)監(jiān)控生成``標(biāo)記的概率。一旦這個(gè)概率超過預(yù)設(shè)閾值,就像警報(bào)器響起一樣,系統(tǒng)立即觸發(fā)自我糾錯(cuò)流程。

這個(gè)過程可以用開車導(dǎo)航來類比。普通的導(dǎo)航系統(tǒng)一旦選定路線就會(huì)一直走下去,即使前方堵車也不會(huì)改變。而REVERSE系統(tǒng)就像一個(gè)智能導(dǎo)航,會(huì)實(shí)時(shí)監(jiān)控路況,一旦發(fā)現(xiàn)前方有問題,立即回到最近的安全路口重新選擇路線。

具體的回溯策略采用了分層設(shè)計(jì)。系統(tǒng)首先會(huì)回到最近的一個(gè)"可信檢查點(diǎn)"(標(biāo)記為``的位置),嘗試從那里重新生成內(nèi)容。如果在同一個(gè)位置多次失敗,系統(tǒng)會(huì)判斷問題可能出現(xiàn)得更早,于是回退到上一個(gè)句號(hào)位置重新開始。這種設(shè)計(jì)確保了即使遇到復(fù)雜的錯(cuò)誤情況,系統(tǒng)也能找到合適的回退點(diǎn)。

回溯后的重新生成過程使用了兩種互補(bǔ)策略。第一種是"拒絕采樣",通過提高生成溫度增加輸出的多樣性,然后從多個(gè)候選中選擇最可信的版本。第二種是"查詢重寫",系統(tǒng)會(huì)修改原始問題,添加類似"注意:可能的錯(cuò)誤短語包括..."這樣的提示信息,幫助模型避免重復(fù)犯錯(cuò)。

這種實(shí)時(shí)監(jiān)控和糾錯(cuò)機(jī)制的優(yōu)勢(shì)在于它是完全自主的。不需要外部的檢查程序,模型自己就能發(fā)現(xiàn)和糾正錯(cuò)誤,就像一個(gè)具備自我修正能力的智能助手。

三、從數(shù)據(jù)制作到模型訓(xùn)練:構(gòu)建可信AI的完整流程

為了訓(xùn)練出具備自我驗(yàn)證能力的模型,研究團(tuán)隊(duì)精心設(shè)計(jì)了數(shù)據(jù)制作流程。他們從現(xiàn)有的LLaVA-v1.5數(shù)據(jù)集出發(fā),這個(gè)數(shù)據(jù)集包含約66.5萬個(gè)圖像-問答對(duì),但都是"正確"的樣本。

研究團(tuán)隊(duì)的創(chuàng)新在于系統(tǒng)性地生成"負(fù)面樣本"。他們?cè)O(shè)計(jì)了一套規(guī)則和AI輔助的方法來創(chuàng)造錯(cuò)誤的描述。對(duì)于簡(jiǎn)單的問題,比如計(jì)數(shù)或是非判斷,他們使用規(guī)則方法直接生成錯(cuò)誤答案。對(duì)于復(fù)雜的描述性問題,他們利用GPT-4o-mini來生成高質(zhì)量的錯(cuò)誤描述,確保這些錯(cuò)誤既逼真又具有挑戰(zhàn)性。

生成負(fù)面樣本的過程非常細(xì)致。系統(tǒng)會(huì)自動(dòng)識(shí)別原始答案中的關(guān)鍵短語,然后用同類但不正確的內(nèi)容替換。比如,如果原始描述中有"紅色塑料杯",可能會(huì)被替換為"綠色玻璃瓶"。這種替換保持了語義的連貫性,但改變了事實(shí)內(nèi)容,創(chuàng)造出了高質(zhì)量的"迷惑性"錯(cuò)誤樣本。

最終的數(shù)據(jù)集包含130萬個(gè)訓(xùn)練樣本,共680萬個(gè)問答輪次,其中380萬個(gè)是正確答案,290萬個(gè)是錯(cuò)誤答案。這種平衡的設(shè)計(jì)確保模型既能學(xué)會(huì)生成正確內(nèi)容,也能識(shí)別錯(cuò)誤內(nèi)容。

訓(xùn)練過程采用了改進(jìn)的交叉熵?fù)p失函數(shù)。關(guān)鍵創(chuàng)新在于對(duì)不同類型的標(biāo)記使用不同的權(quán)重。正確內(nèi)容的標(biāo)記獲得正常權(quán)重,而錯(cuò)誤內(nèi)容的標(biāo)記被屏蔽(權(quán)重為零),這樣模型在學(xué)習(xí)時(shí)不會(huì)被錯(cuò)誤內(nèi)容誤導(dǎo),但同時(shí)學(xué)會(huì)了如何識(shí)別和標(biāo)記不可信的內(nèi)容。

四、實(shí)驗(yàn)驗(yàn)證:多項(xiàng)指標(biāo)全面領(lǐng)先

研究團(tuán)隊(duì)在多個(gè)標(biāo)準(zhǔn)數(shù)據(jù)集上驗(yàn)證了REVERSE系統(tǒng)的效果,結(jié)果令人印象深刻。在圖像描述任務(wù)中,REVERSE在CHAIR-MSCOCO基準(zhǔn)上將幻覺率降低了12%,在HaloQuest數(shù)據(jù)集上更是達(dá)到了34%的顯著改進(jìn)。

CHAIR-MSCOCO是評(píng)估視覺幻覺的經(jīng)典基準(zhǔn),它會(huì)檢查模型生成的描述中提到的物體是否真實(shí)存在于圖像中。傳統(tǒng)的LLaVA-v1.5模型在這個(gè)測(cè)試中的CHAIRi得分(物體級(jí)幻覺率)為15.4%,而REVERSE系統(tǒng)在保守設(shè)置下可以降至10.3%,在更嚴(yán)格設(shè)置下甚至可以降至6.1%。

在處理包含錯(cuò)誤前提的問題時(shí),REVERSE表現(xiàn)尤為出色。HaloQuest數(shù)據(jù)集專門設(shè)計(jì)了三類挑戰(zhàn)性問題:錯(cuò)誤前提問題、視覺證據(jù)不足問題和視覺復(fù)雜問題。傳統(tǒng)模型往往會(huì)被錯(cuò)誤前提誤導(dǎo),給出不正確的答案。而REVERSE系統(tǒng)學(xué)會(huì)了識(shí)別這些陷阱,在錯(cuò)誤前提問題上的準(zhǔn)確率從17.1%提升到31.8%,在證據(jù)不足問題上從10.7%提升到26.9%。

系統(tǒng)的另一個(gè)優(yōu)勢(shì)是可控性。通過調(diào)整檢測(cè)閾值,用戶可以在"保守程度"和"表達(dá)豐富度"之間找到平衡。較低的閾值讓系統(tǒng)更加謹(jǐn)慎,減少幻覺但可能使描述變得簡(jiǎn)潔;較高的閾值則允許更豐富的表達(dá)但承擔(dān)更多風(fēng)險(xiǎn)。這種靈活性讓REVERSE能夠適應(yīng)不同應(yīng)用場(chǎng)景的需求。

在計(jì)算效率方面,REVERSE的開銷是可接受的。驗(yàn)證過程只在63%的情況下被觸發(fā),而且基于輕量級(jí)的概率檢查而非復(fù)雜的外部模型調(diào)用。在觸發(fā)驗(yàn)證的情況下,超過一半的幻覺問題可以通過單輪重新生成解決,平均計(jì)算開銷增加不到50%。

五、技術(shù)細(xì)節(jié):讓AI"回頭看"的工程實(shí)現(xiàn)

REVERSE系統(tǒng)的技術(shù)實(shí)現(xiàn)包含幾個(gè)關(guān)鍵組件。首先是閾值設(shè)定機(jī)制,不同的模型需要不同的閾值參數(shù)。研究團(tuán)隊(duì)發(fā)現(xiàn),LLaVA系列模型適合使用0.003的閾值,而Qwen2.5-VL模型則需要0.01的閾值。這種差異反映了不同模型架構(gòu)在置信度校準(zhǔn)方面的特性。

回溯策略采用了多層次設(shè)計(jì)。系統(tǒng)維護(hù)兩種檢查點(diǎn):局部檢查點(diǎn)(最近的``標(biāo)記)和全局檢查點(diǎn)(最近的句號(hào)位置)。當(dāng)局部糾錯(cuò)連續(xù)失敗10次時(shí),系統(tǒng)會(huì)回退到全局檢查點(diǎn)重新開始,總共允許50次糾錯(cuò)嘗試。這種設(shè)計(jì)平衡了糾錯(cuò)能力和計(jì)算效率。

溫度調(diào)整策略也很巧妙。系統(tǒng)從基礎(chǔ)溫度開始,每次失敗后增加0.1,最高不超過基礎(chǔ)溫度加0.5。這種漸進(jìn)式升溫策略在保持輸出質(zhì)量的同時(shí)增加了多樣性,提高了找到正確答案的概率。

查詢重寫功能通過修改輸入提示來引導(dǎo)模型避免重復(fù)錯(cuò)誤。系統(tǒng)會(huì)自動(dòng)在原始問題后添加"提示:可能的錯(cuò)誤短語包括..."等信息,這種方法在訓(xùn)練時(shí)隨機(jī)使用(20%的概率),讓模型學(xué)會(huì)理解和響應(yīng)這類提示。

針對(duì)開放式問答任務(wù),系統(tǒng)還實(shí)現(xiàn)了特殊的處理機(jī)制。當(dāng)模型檢測(cè)到問題可能包含錯(cuò)誤前提或證據(jù)不足時(shí),會(huì)生成空白回應(yīng)。此時(shí)系統(tǒng)自動(dòng)切換到第二輪推理,使用修改后的提示:"對(duì)于這個(gè)問題,請(qǐng)指出錯(cuò)誤前提或說明缺失的信息,而不是直接回答。"這種兩階段處理確保了系統(tǒng)能夠優(yōu)雅地處理無法回答的問題。

六、創(chuàng)新意義:重新定義AI的可信邊界

REVERSE系統(tǒng)的出現(xiàn)標(biāo)志著AI可信性研究的一個(gè)重要里程碑。傳統(tǒng)的幻覺緩解方法要么是"一次性"的生成調(diào)整,要么是"事后諸葛亮"式的外部檢查。REVERSE首次實(shí)現(xiàn)了真正的"邊生成邊驗(yàn)證",讓AI模型具備了類似人類的自我反省能力。

這種能力對(duì)于AI的實(shí)際應(yīng)用具有深遠(yuǎn)意義。在醫(yī)療影像分析中,一個(gè)能夠表達(dá)不確定性的AI系統(tǒng)比一個(gè)過度自信的系統(tǒng)更值得信任。在自動(dòng)駕駛領(lǐng)域,能夠識(shí)別和糾正感知錯(cuò)誤的系統(tǒng)將大大提高安全性。在教育輔助工具中,會(huì)承認(rèn)"我不確定"的AI比給出錯(cuò)誤答案的AI更有價(jià)值。

從技術(shù)角度看,REVERSE展示了"自監(jiān)督學(xué)習(xí)"的新可能性。通過讓模型學(xué)會(huì)評(píng)估自己的輸出質(zhì)量,系統(tǒng)實(shí)現(xiàn)了某種形式的"元認(rèn)知"能力。這種能力不僅適用于視覺語言任務(wù),也為其他AI應(yīng)用提供了新的思路。

系統(tǒng)的模塊化設(shè)計(jì)也具有重要價(jià)值。REVERSE的核心思想可以應(yīng)用到其他類型的生成模型中,比如純文本生成、代碼生成等領(lǐng)域。只要是存在"幻覺"或錯(cuò)誤輸出問題的生成任務(wù),都可以借鑒這種"生成-驗(yàn)證-糾錯(cuò)"的框架。

七、局限性與未來展望:仍待完善的AI良心

盡管REVERSE系統(tǒng)取得了顯著進(jìn)展,但研究團(tuán)隊(duì)也誠實(shí)地指出了當(dāng)前的局限性。首先,系統(tǒng)主要針對(duì)生成式任務(wù)進(jìn)行了優(yōu)化,在判斷式任務(wù)(如是非題)上的改進(jìn)有限。這是因?yàn)槭欠穷}的答案空間很小,回溯重采樣的作用相對(duì)有限。

數(shù)據(jù)集質(zhì)量是另一個(gè)潛在限制。雖然130萬樣本的規(guī)模令人印象深刻,但數(shù)據(jù)主要來源于MS-COCO等現(xiàn)有數(shù)據(jù)集,可能存在一定的偏見。比如,這些數(shù)據(jù)集在性別、種族、地理區(qū)域等方面的代表性可能不夠均衡。未來需要更多樣化、更高質(zhì)量的訓(xùn)練數(shù)據(jù)來進(jìn)一步提升系統(tǒng)的公平性和準(zhǔn)確性。

閾值設(shè)定目前還依賴于經(jīng)驗(yàn)調(diào)優(yōu),不同模型需要不同的參數(shù)設(shè)置。理想情況下,未來的系統(tǒng)應(yīng)該能夠自適應(yīng)地調(diào)整這些參數(shù),根據(jù)具體任務(wù)和用戶需求自動(dòng)優(yōu)化置信度閾值。

計(jì)算開銷雖然可接受,但仍有優(yōu)化空間。目前的回溯重采樣過程可能需要多輪迭代,在某些實(shí)時(shí)應(yīng)用中可能成為瓶頸。未來的研究可以探索更高效的驗(yàn)證機(jī)制,比如并行生成多個(gè)候選答案然后選擇最優(yōu)的。

從更廣闊的視角看,REVERSE代表了AI安全研究的一個(gè)重要方向:讓AI系統(tǒng)具備自我監(jiān)督和糾錯(cuò)能力。這種能力對(duì)于實(shí)現(xiàn)真正可信的人工智能至關(guān)重要。隨著AI系統(tǒng)變得越來越復(fù)雜和強(qiáng)大,單純依靠外部監(jiān)督已經(jīng)不夠,必須讓AI系統(tǒng)學(xué)會(huì)自我約束和自我改進(jìn)。

未來的研究可能會(huì)探索更復(fù)雜的自我驗(yàn)證機(jī)制,比如引入因果推理、常識(shí)知識(shí)庫或多模態(tài)交叉驗(yàn)證等。也可能會(huì)將這種思想擴(kuò)展到更多領(lǐng)域,比如科學(xué)計(jì)算、創(chuàng)意寫作或戰(zhàn)略規(guī)劃等高級(jí)認(rèn)知任務(wù)。

說到底,REVERSE系統(tǒng)最重要的貢獻(xiàn)不僅僅是技術(shù)上的突破,更是為AI發(fā)展指明了一個(gè)新方向:不是讓AI變得更加"強(qiáng)大",而是讓它變得更加"謙遜"和"可信"。在這個(gè)AI能力快速提升的時(shí)代,學(xué)會(huì)說"我不確定"的AI可能比無所不知的AI更有價(jià)值。畢竟,一個(gè)懂得自我質(zhì)疑的智能系統(tǒng),才是真正值得人類信任的伙伴。

對(duì)于普通用戶而言,REVERSE系統(tǒng)的普及意味著未來的AI助手將更加可靠。當(dāng)你問AI一張照片里有什么時(shí),它不會(huì)再信口開河地編造不存在的細(xì)節(jié),而是會(huì)誠實(shí)地告訴你哪些地方它不確定。這種改變看似微小,實(shí)際上是AI從"炫技工具"向"可信伙伴"轉(zhuǎn)變的關(guān)鍵一步。

想要深入了解這項(xiàng)研究的技術(shù)細(xì)節(jié)和實(shí)驗(yàn)數(shù)據(jù)的讀者,可以訪問論文的完整版本和相關(guān)代碼。研究團(tuán)隊(duì)已經(jīng)在MIT許可證下開源了完整的代碼和訓(xùn)練數(shù)據(jù),為學(xué)術(shù)界和工業(yè)界的進(jìn)一步研究提供了寶貴資源。

Q&A

Q1:什么是AI的"視覺幻覺"問題?為什么需要解決? A:AI的"視覺幻覺"是指AI模型在描述圖片時(shí)會(huì)"看到"實(shí)際不存在的東西,比如明明圖片里只有一只貓,AI卻說還有一只狗。在自動(dòng)駕駛、醫(yī)療診斷等安全關(guān)鍵領(lǐng)域,這種錯(cuò)誤可能帶來嚴(yán)重后果,因此亟需解決。

Q2:REVERSE系統(tǒng)和傳統(tǒng)方法有什么不同? A:傳統(tǒng)方法要么在生成前調(diào)整AI行為(但一旦出錯(cuò)無法糾正),要么生成后用外部程序檢查(復(fù)雜且只能拒絕而非改正)。REVERSE首次實(shí)現(xiàn)了"邊生成邊驗(yàn)證",讓AI能夠?qū)崟r(shí)監(jiān)控自己是否在胡說八道,一旦發(fā)現(xiàn)問題就立即回退重新思考。

Q3:普通用戶什么時(shí)候能用上這種更可靠的AI? A:目前REVERSE還處于研究階段,但研究團(tuán)隊(duì)已經(jīng)開源了完整代碼和數(shù)據(jù)。隨著技術(shù)成熟,預(yù)計(jì)未來1-2年內(nèi)就會(huì)有商業(yè)產(chǎn)品采用類似技術(shù),屆時(shí)AI助手將變得更加誠實(shí)可信,不再隨意編造不存在的內(nèi)容。

分享至
0贊

好文章,需要你的鼓勵(lì)

推薦文章
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-