av天堂久久天堂色综合,最近中文字幕mv免费高清在线,在线a级毛片免费视频,av动漫,中文字幕精品亚洲无线码一区

<style id="fwzn6"><li id="fwzn6"></li></style>

微信掃一掃，關(guān)注公眾號

科技行者
算力行者

見證連接與計算的「力量」

臺灣大學(xué)團隊開發(fā)MovieCORE：讓AI像人類一樣深度理解電影的創(chuàng)新數(shù)據(jù)集

視頻理解深度學(xué)習(xí)認(rèn)知評估

臺灣大學(xué)團隊開發(fā)MovieCORE：讓AI像人類一樣深度理解電影的創(chuàng)新數(shù)據(jù)集

作者：科技行者

2025-09-02 12:30

分享至：

臺灣大學(xué)研究團隊開發(fā)了MovieCORE數(shù)據(jù)集，這是首個專門訓(xùn)練AI深度理解電影內(nèi)容的創(chuàng)新工具。該數(shù)據(jù)集通過多AI智能體協(xié)作生成復(fù)雜問題，采用認(rèn)知分類法測量思維深度，99.2%的問答需要高層次思維。研究還開發(fā)了ACE增強技術(shù)，可將AI性能提升25%。實驗顯示現(xiàn)有AI在深度視頻理解方面仍存在顯著不足，為未來AI發(fā)展指明了方向。

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

2025-09-02 12:30 ? 科技行者

在日常生活中，當(dāng)我們看電影時，不僅僅是在觀看畫面和聽取對話，更是在用心感受角色的情感變化、理解故事的深層含義、分析人物關(guān)系的微妙發(fā)展。然而，目前的人工智能系統(tǒng)在理解視頻內(nèi)容時，往往只能停留在表面，比如識別"這是一個男人"或"他在走路"這樣的基礎(chǔ)信息，卻無法像人類一樣進行深入思考和情感共鳴。

這項由臺灣大學(xué)的Gueter Josmy Faure領(lǐng)導(dǎo)，聯(lián)合英偉達、臺灣清華大學(xué)和政治大學(xué)研究團隊共同完成的突破性研究，發(fā)表于2025年8月的arXiv預(yù)印本平臺（論文編號：arXiv:2508.19026v1），為解決這一難題帶來了全新的解決方案。有興趣深入了解的讀者可以通過https://joslefaure.github.io/assets/html/moviecore.html訪問完整的研究資料和代碼。

研究團隊發(fā)現(xiàn)，現(xiàn)有的視頻問答數(shù)據(jù)集就像是給AI出的小學(xué)生問題，只問"視頻里有什么"或"發(fā)生了什么事"，從不問"為什么會這樣"或"這意味著什么"。這就好比我們看完一部感人的電影，別人只問我們"主角穿什么顏色的衣服"，而不問"這個故事想表達什么深層含義"。為了讓AI真正理解電影的精髓，研究團隊開發(fā)了MovieCORE數(shù)據(jù)集，這是一個專門訓(xùn)練AI進行深度思考的"高考試卷"。

一、創(chuàng)新的智能體協(xié)作生成方法：像智囊團一樣制作問題

傳統(tǒng)的數(shù)據(jù)集制作方式就像一個人在房間里自言自語地出題，難免思路狹窄、深度不夠。研究團隊卻創(chuàng)造性地開發(fā)了一種"智囊團討論"的方法，讓多個AI智能體扮演不同的專家角色，共同討論和完善每一個問題。

這個智囊團包含了五個不同性格的專家。首先是"深度思考專家"，它專門負(fù)責(zé)將淺層問題轉(zhuǎn)化為需要深入分析的復(fù)雜問題，就像把"主角是誰"這樣的簡單問題改成"主角的行為動機如何推動故事發(fā)展"。接著是"懷疑論者"，它會像挑剔的評委一樣質(zhì)疑每個問題是否真的需要深度思考，是否與視頻內(nèi)容緊密相關(guān)。然后是"偵探專家"，它善于發(fā)現(xiàn)隱藏的因果關(guān)系，挖掘出那些不易察覺的深層聯(lián)系。還有"元評審員"，它負(fù)責(zé)綜合所有專家的意見，給出最終的改進建議。最后由"協(xié)調(diào)員"統(tǒng)籌整個討論過程，確保每個聲音都被聽到。

這種方法的效果就像是從單人獨奏變成了交響樂團合奏。以一個簡單的例子來說明其威力：原本的單次生成可能只會問"兩個主角的關(guān)系如何變化"，得到的答案也比較抽象和籠統(tǒng)。但經(jīng)過智囊團的討論完善后，問題變成了"你能提供具體場景來展現(xiàn)主角關(guān)系的演變和動機嗎"，答案也變得具體生動，會詳細(xì)描述"有一個場景中，紅黑服裝的角色幫助貓耳角色避免跌落，顯示出信任關(guān)系的建立，另一個屋頂場景展現(xiàn)了他們無縫合作的默契"。

二、革命性的認(rèn)知復(fù)雜度測量體系：給思維深度打分

為了確保他們制作的問題真的需要深度思考，研究團隊開發(fā)了一套就像"思維體檢表"一樣的評估系統(tǒng)。這套系統(tǒng)從三個維度來衡量問題的認(rèn)知難度。

第一個維度是"句法復(fù)雜度"，通過分析句子結(jié)構(gòu)的層次深度來評估。簡單來說，就是看句子的"家族樹"有多復(fù)雜。比如"他走路"這個句子結(jié)構(gòu)很簡單，只有兩層關(guān)系，而"他為了尋找失散多年的妹妹而踏上了充滿危險的旅程"這樣的句子就有很多層嵌套關(guān)系，需要更多的認(rèn)知資源來理解。研究顯示，MovieCORE數(shù)據(jù)集的平均句法深度達到了5.88，遠超其他數(shù)據(jù)集的2.45到4.38。

第二個維度是"閱讀難度等級"，使用美國教育系統(tǒng)的年級評估標(biāo)準(zhǔn)。MovieCORE的問題平均需要14年級（相當(dāng)于大學(xué)二年級）的閱讀水平才能理解，而現(xiàn)有數(shù)據(jù)集大多只需要8到10年級水平。這就像是從看圖畫書進階到閱讀學(xué)術(shù)論文的差別。

第三個維度最有趣，采用了教育學(xué)中著名的"布魯姆認(rèn)知分類法"。這套分類法把人類思維活動分成六個層次，從最基礎(chǔ)的"記憶"到最高級的"創(chuàng)造"。低層次的問題只需要記憶和理解，比如"視頻中出現(xiàn)了什么物體"。高層次的問題需要分析、評估和創(chuàng)造，比如"窗戶和放大鏡這些象征性物體如何體現(xiàn)老年角色的心路歷程"。令人驚喜的是，MovieCORE中有99.2%的問題和答案都屬于高層次思維，而其他數(shù)據(jù)集這個比例通常不到35%。

三、多維度AI能力評估框架：全方位檢測AI的理解水平

現(xiàn)有的視頻問答評估就像是只看學(xué)生答案對不對，不管過程和思路。研究團隊認(rèn)為這種評估方式太粗糙了，就像判斷一個人會不會做菜，不能只看最后的菜品味道，還要看他的刀工、火候掌握、搭配創(chuàng)意等各個方面。

因此，他們設(shè)計了一套五維度評估體系。"準(zhǔn)確性"維度檢查AI的答案是否符合事實，就像檢查學(xué)生的數(shù)學(xué)答案是否正確。"全面性"維度評估AI是否遺漏了重要信息，就像檢查學(xué)生的作文是否涵蓋了所有要點。"深度性"維度衡量AI的分析是否深入，是停留在表面現(xiàn)象還是能夠挖掘內(nèi)在規(guī)律。"證據(jù)支撐"維度檢查AI是否能夠用視頻中的具體場景來支撐自己的觀點，而不是空談理論。"邏輯連貫性"維度評估AI的表達是否清晰有條理，論證過程是否合乎邏輯。

這套評估體系的應(yīng)用效果非常顯著。測試結(jié)果顯示，目前最先進的商業(yè)AI模型（如GPT-4和谷歌Gemini）在這個數(shù)據(jù)集上的表現(xiàn)也只能達到4分左右（滿分5分），而開源模型的表現(xiàn)更是差強人意，大多數(shù)只能達到2到3分。這說明現(xiàn)有AI系統(tǒng)在深度視頻理解方面還有很大的提升空間。

四、ACE增強技術(shù)：給AI裝上"第二雙眼睛"

在發(fā)現(xiàn)現(xiàn)有AI模型表現(xiàn)不夠理想后，研究團隊并沒有停步，而是開發(fā)了一種叫做ACE（Agentic Choice Enhancement）的增強技術(shù)。這種技術(shù)的核心思想很簡單卻很有效：當(dāng)AI給出一個答案后，讓另一個AI來當(dāng)"質(zhì)檢員"，從多個候選答案中選出最好的那個。

這就像是考試時多做幾道題，然后讓經(jīng)驗豐富的老師幫你選出最好的答案。具體過程是這樣的：首先讓主AI模型生成5個不同的候選答案，就像是從不同角度思考同一個問題。然后使用一個專門的評分AI（基于Llama-3.2模型）來評估這5個答案的質(zhì)量，最終選出最優(yōu)秀的那個作為最終答案。

這種方法的效果相當(dāng)顯著。在多個不同的AI模型上測試，ACE技術(shù)都能帶來15%到25%的性能提升。比如HERMES模型的綜合得分從2.93分提升到3.41分，提升了16%。InstructBLIP模型更是從2.63分躍升到3.29分，提升幅度達到25%。這種提升在AI領(lǐng)域已經(jīng)是相當(dāng)可觀的進步了。

有趣的是，研究團隊還測試了不同的候選答案數(shù)量（3個、5個、7個），發(fā)現(xiàn)5個候選答案是最優(yōu)選擇，既能保證質(zhì)量又不會造成計算資源的浪費。這說明"三個臭皮匠頂個諸葛亮"的道理在AI領(lǐng)域同樣適用，但也不是候選答案越多越好。

五、深度對比實驗：System-2與System-1思維的較量

為了驗證MovieCORE確實需要深度思考，研究團隊進行了一個巧妙的對比實驗。他們使用了相同的視頻內(nèi)容，但分別測試AI在簡單問題和復(fù)雜問題上的表現(xiàn)差異。

簡單問題就像是"這個視頻是白天拍的還是晚上拍的"、"主角穿什么顏色的衣服"這樣的表面信息。復(fù)雜問題則是"角色的情感變化如何推動故事發(fā)展"、"視覺元素如何增強敘事的情感張力"這樣需要深度分析的內(nèi)容。

實驗結(jié)果令人震驚。同一個AI模型HERMES在簡單的MovieChat-1k數(shù)據(jù)集上能達到84.9%的準(zhǔn)確率（換算成5分制約為4.25分），但在MovieCORE上只能達到3.52分。這種巨大的性能差距清楚地證明了兩點：首先，MovieCORE確實比現(xiàn)有數(shù)據(jù)集更具挑戰(zhàn)性；其次，現(xiàn)有AI系統(tǒng)在深度理解方面確實存在明顯不足。

這個結(jié)果就像是發(fā)現(xiàn)了AI的"閱讀理解短板"。AI可以很好地回答"文章中的主人公是誰"這樣的問題，但當(dāng)問到"作者通過這個角色想表達什么深層含義"時，就開始困惑了。這恰恰反映出目前AI系統(tǒng)缺乏真正的理解能力，更多是在進行模式匹配而非深度思考。

六、質(zhì)量控制與人工驗證：確保數(shù)據(jù)集的可靠性

為了確保數(shù)據(jù)集的質(zhì)量，研究團隊實施了嚴(yán)格的人工驗證流程。他們招募了七名擁有學(xué)士學(xué)位的專業(yè)評估員，對150個問答對和30個視頻進行了詳細(xì)評估。

評估過程就像是給數(shù)據(jù)集做"全面體檢"。評估員需要完整觀看每個視頻，然后從四個維度給問答對打分：相關(guān)性（問題是否與視頻內(nèi)容緊密相關(guān)）、清晰度（表達是否明確無歧義）、深度（是否需要深入思考）、可回答性（是否能僅從視頻內(nèi)容中找到答案）。每個維度的評分從1到5分，5分為最高分。

驗證結(jié)果令人滿意。問題的清晰度和深度都達到了4.3分以上，答案的相關(guān)性和可回答性也超過了3.8分。這些高分證明了數(shù)據(jù)集的質(zhì)量確實達到了預(yù)期標(biāo)準(zhǔn)。雖然可回答性得分相對較低（3.8分），但這恰恰反映了問題的高難度特性——這些問題確實需要觀看者進行深入思考才能回答。

研究團隊還展示了一個有趣的案例。有一個關(guān)于游行場面的問題在相關(guān)性和可回答性方面得到了較低評分，但經(jīng)過人工元評審員的仔細(xì)審查，發(fā)現(xiàn)這個問題實際上提供了有意義的洞察和語境相關(guān)性。這說明有些看似"困難"的問題實際上是有價值的，只是需要更深層的理解能力。

七、傳統(tǒng)評估指標(biāo)的補充驗證：多角度確認(rèn)數(shù)據(jù)集價值

除了創(chuàng)新的多維度評估體系，研究團隊也使用了傳統(tǒng)的自然語言處理評估指標(biāo)來驗證他們的發(fā)現(xiàn)。這些傳統(tǒng)指標(biāo)包括BLEU-4、CIDEr和METEOR，雖然在捕捉語義豐富性和推理深度方面有限制，但能夠提供與現(xiàn)有工作的比較基準(zhǔn)。

有趣的是，使用傳統(tǒng)指標(biāo)得到的模型排名與新的認(rèn)知導(dǎo)向評估結(jié)果高度一致。經(jīng)過ACE增強的模型在傳統(tǒng)指標(biāo)上也表現(xiàn)更好，這進一步驗證了研究團隊方法的有效性。比如HERMES模型在ACE增強后，BLEU-4分?jǐn)?shù)從0.0308提升到0.0654，CIDEr分?jǐn)?shù)從0.1230提升到0.1622，METEOR分?jǐn)?shù)更是從0.0983躍升到0.2138。

這種一致性很重要，因為它表明新的評估方法并非與傳統(tǒng)方法完全脫節(jié)，而是在保持兼容性的同時提供了更豐富的評估維度。這就像是在保留傳統(tǒng)"筆試"的同時，增加了"面試"和"實操"環(huán)節(jié)，讓評估更加全面和準(zhǔn)確。

八、實際應(yīng)用案例分析：看AI如何"看懂"電影

研究團隊提供了幾個生動的案例來展示不同AI模型在MovieCORE上的表現(xiàn)差異。其中一個關(guān)于獵豹行為的案例特別有啟發(fā)性。

當(dāng)被問及"這些場景如何展現(xiàn)獵豹社會結(jié)構(gòu)和生存策略"時，表現(xiàn)較差的InternVL-2模型只能給出基礎(chǔ)觀察，比如"看到獵豹在追捕獵物"這樣的表面描述。中等水平的HERMES模型能夠識別出一些行為模式，但缺乏具體細(xì)節(jié)支撐。而經(jīng)過ACE增強的HERMES模型則能提供豐富的具體場景描述，比如"有一個場景顯示多只獵豹協(xié)調(diào)行動包圍獵物，體現(xiàn)了群體狩獵策略；另一個場景展現(xiàn)了獵豹媽媽教導(dǎo)幼崽如何標(biāo)記領(lǐng)域，反映了知識傳承機制"。

這種差異就像是從"看熱鬧"到"看門道"的轉(zhuǎn)變。普通觀眾可能只看到動物在跑來跑去，但真正的專家能看出其中的社會結(jié)構(gòu)、行為策略和生存智慧。研究團隊希望通過MovieCORE訓(xùn)練AI達到專家級的理解水平。

另一個有趣的案例涉及電影中象征物體的分析。當(dāng)詢問"窗戶和放大鏡等象征性物體如何體現(xiàn)老年角色的心路歷程"時，不同模型的回答展現(xiàn)出明顯的認(rèn)知層次差異?；A(chǔ)模型可能只會說"看到了窗戶和放大鏡"，而高級模型能夠分析出"窗戶代表了對外部世界的渴望和內(nèi)心的孤獨感，放大鏡則象征著對過去回憶的仔細(xì)審視和對細(xì)節(jié)的關(guān)注"。

九、研究局限與未來展望：誠實面對挑戰(zhàn)

研究團隊對自己工作的局限性也有清醒的認(rèn)識。首先，雖然他們對數(shù)據(jù)集的子集進行了人工驗證，但30個視頻和150個問答對的驗證樣本相對于整個數(shù)據(jù)集來說還是比較小。這就像是質(zhì)檢員只檢查了生產(chǎn)線上的一小部分產(chǎn)品，雖然能發(fā)現(xiàn)系統(tǒng)性問題，但可能遺漏一些細(xì)節(jié)問題。

其次，由于數(shù)據(jù)集構(gòu)建在MovieChat-1k的基礎(chǔ)上，可能存在電影類型覆蓋面的局限性。某些電影類型或敘事風(fēng)格可能被過度代表，而另一些可能被低估。這種不平衡可能會影響數(shù)據(jù)集的通用性，就像用偏愛某種菜系的評委來評判所有料理比賽一樣。

此外，評估過程部分依賴AI輔助，這雖然提高了效率和可擴展性，但也可能繼承了評判模型自身的局限性和偏見。這就像是讓機器人老師給學(xué)生作業(yè)打分，雖然客觀一致，但可能缺乏人類教師的靈活性和洞察力。

不過，這些局限性并不掩蓋研究的價值，反而為未來的改進指明了方向。研究團隊建議未來工作可以擴大人工驗證的規(guī)模、增加電影類型的多樣性、結(jié)合更多人工專家的判斷等。

說到底，這項研究就像是給AI打開了一扇通往深度理解的大門。過去的AI就像是只會背書的學(xué)生，能夠準(zhǔn)確回答事實性問題，但缺乏思辨和分析能力。MovieCORE數(shù)據(jù)集則像是一套專門訓(xùn)練批判性思維的教材，不僅要求AI知道發(fā)生了什么，更要求它理解為什么會這樣、這意味著什么、會產(chǎn)生什么影響。

這種從淺層識別到深度理解的轉(zhuǎn)變，對于AI技術(shù)的發(fā)展具有深遠意義。當(dāng)AI系統(tǒng)能夠像人類一樣理解電影的情感深度、把握故事的主題內(nèi)涵、分析角色的復(fù)雜動機時，它們就有可能在教育、娛樂、心理咨詢等更多需要深度理解的領(lǐng)域發(fā)揮重要作用。比如AI可以成為更好的學(xué)習(xí)伙伴，幫助學(xué)生分析文學(xué)作品的深層含義；或者成為更智能的內(nèi)容推薦系統(tǒng)，根據(jù)用戶的情感需求推薦合適的影視作品。

ACE增強技術(shù)的成功也啟發(fā)了一個重要思路：有時候讓AI變聰明的方法不一定是訓(xùn)練更大的模型，而是讓多個AI協(xié)作，發(fā)揮集體智慧的力量。這種"眾人拾柴火焰高"的方法可能是未來AI發(fā)展的重要方向之一。

當(dāng)然，這項研究也提醒我們，即使是最先進的AI系統(tǒng)在真正理解復(fù)雜內(nèi)容方面仍然有很長的路要走。MovieCORE數(shù)據(jù)集就像是一面鏡子，讓我們清楚地看到了現(xiàn)有AI技術(shù)的優(yōu)勢和不足。這種清醒的認(rèn)識對于推動AI技術(shù)的健康發(fā)展至關(guān)重要。

對于普通用戶來說，這項研究的意義在于讓我們對AI能力有更準(zhǔn)確的期待。我們既不應(yīng)該高估AI的理解能力，認(rèn)為它已經(jīng)能夠完全替代人類進行復(fù)雜思考；也不應(yīng)該低估AI的潛力，忽視它在適當(dāng)引導(dǎo)下能夠達到的理解深度。合理的期待和正確的使用方式，才能讓AI真正成為我們學(xué)習(xí)和工作的好幫手。

研究團隊承諾將在論文被接受后立即公開所有數(shù)據(jù)集、代碼和評估方案，這種開放的態(tài)度值得贊賞。他們希望通過開源的方式，讓更多研究者能夠在此基礎(chǔ)上繼續(xù)探索，推動視頻理解技術(shù)的發(fā)展。感興趣的讀者可以關(guān)注項目網(wǎng)站獲取最新進展。

Q&A

Q1：MovieCORE數(shù)據(jù)集與現(xiàn)有視頻問答數(shù)據(jù)集有什么本質(zhì)區(qū)別？

A：MovieCORE專門設(shè)計來測試AI的深度思考能力，而現(xiàn)有數(shù)據(jù)集主要測試表面理解。現(xiàn)有數(shù)據(jù)集的問題通常是"視頻里有什么人"或"發(fā)生了什么事"，而MovieCORE會問"為什么角色會這樣做"、"這個情節(jié)的深層含義是什么"。用數(shù)據(jù)說話，MovieCORE中99.2%的問題需要高層次認(rèn)知思維，而其他數(shù)據(jù)集這個比例通常不到35%。

Q2：ACE增強技術(shù)是如何提升AI性能的？

A：ACE技術(shù)讓AI先生成5個不同的候選答案，然后用另一個專門的AI來當(dāng)"評委"選出最好的答案。這就像考試時多做幾種解法，然后讓老師幫你選最優(yōu)的。實驗顯示，這種方法能讓不同AI模型的表現(xiàn)提升15%到25%，比如HERMES模型從2.93分提升到3.41分。

Q3：普通人可以使用MovieCORE數(shù)據(jù)集嗎？有什么實際應(yīng)用價值？

A：研究團隊承諾會公開所有數(shù)據(jù)集和代碼，普通開發(fā)者和研究者都可以免費使用。雖然普通用戶不會直接使用數(shù)據(jù)集，但基于MovieCORE訓(xùn)練的AI系統(tǒng)未來可能在教育、內(nèi)容推薦、心理咨詢等領(lǐng)域發(fā)揮作用，比如幫助學(xué)生更好地分析文學(xué)作品，或根據(jù)情感需求推薦合適的影視內(nèi)容。

視頻理解深度學(xué)習(xí)認(rèn)知評估

分享至

0贊

好文章，需要你的鼓勵

推薦文章

音頻生成
大語言模型
多模態(tài)AI

2025-09-10 09:47

如何讓AI像電影配樂師一樣創(chuàng)作完整的長篇音頻故事——騰訊ARC實驗室團隊AudioStory突破性進展

騰訊ARC實驗室推出AudioStory系統(tǒng)，首次實現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù)，通過交錯式推理生成、解耦橋接機制和漸進式訓(xùn)練，能夠?qū)?fù)雜指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測試中表現(xiàn)優(yōu)異，為AI音頻創(chuàng)作開辟新方向。
視頻生成
深度學(xué)習(xí)
多模態(tài)學(xué)習(xí)

2025-09-09 13:57

Meta與特拉維夫大學(xué)聯(lián)手打造VideoJAM：讓AI生成的視頻動起來不再是奢望

Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù)，通過讓AI同時學(xué)習(xí)外觀和運動信息，顯著解決了當(dāng)前視頻生成模型中動作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個線性層就能大幅提升運動質(zhì)量，在多項測試中超越包括Sora在內(nèi)的商業(yè)模型，為AI視頻生成的實用化應(yīng)用奠定了重要基礎(chǔ)。
多模態(tài)AI
人類價值觀對齊
數(shù)據(jù)集構(gòu)建

2025-09-09 13:56

上海AI實驗室重磅發(fā)布：讓AI看圖"說人話"的神奇訓(xùn)練法，解決多模態(tài)AI與人類價值觀對齊難題

上海AI實驗室發(fā)布OmniAlign-V研究，首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評測基準(zhǔn)，通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法，讓AI在保持技術(shù)能力的同時顯著提升人性化交互水平，為AI價值觀對齊提供了可行技術(shù)路徑。
人工智能
圖神經(jīng)網(wǎng)絡(luò)
天氣預(yù)報

2025-09-09 10:56

谷歌研究團隊發(fā)布超級預(yù)測模型：讓AI像天氣預(yù)報員一樣預(yù)測全球大氣變化

谷歌DeepMind團隊開發(fā)的GraphCast是一個革命性的AI天氣預(yù)測模型，能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報，準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù)，通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律，在極端天氣預(yù)測方面表現(xiàn)卓越，能耗僅為傳統(tǒng)方法的千分之一，為氣象學(xué)領(lǐng)域帶來了效率和精度的雙重突破。

如何讓AI像電影配樂師一樣創(chuàng)作完整的長篇音頻故事——騰訊ARC實驗室團隊AudioStory突破性進展

如何讓AI像電影配樂師一樣創(chuàng)作完整的長篇音頻故事——騰訊ARC實驗室團隊AudioStory突破性進展

2025-09-10 09:47

Meta與特拉維夫大學(xué)聯(lián)手打造VideoJAM：讓AI生成的視頻動起來不再是奢望

Meta與特拉維夫大學(xué)聯(lián)手打造VideoJAM：讓AI生成的視頻動起來不再是奢望

2025-09-09 13:57

上海AI實驗室重磅發(fā)布：讓AI看圖"說人話"的神奇訓(xùn)練法，解決多模態(tài)AI與人類價值觀對齊難題

上海AI實驗室重磅發(fā)布：讓AI看圖"說人話"的神奇訓(xùn)練法，解決多模態(tài)AI與人類價值觀對齊難題

2025-09-09 13:56

谷歌研究團隊發(fā)布超級預(yù)測模型：讓AI像天氣預(yù)報員一樣預(yù)測全球大氣變化

谷歌研究團隊發(fā)布超級預(yù)測模型：讓AI像天氣預(yù)報員一樣預(yù)測全球大氣變化

2025-09-09 10:56

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

友情鏈接

至頂網(wǎng)
管理現(xiàn)代化
和訊IT
TechWeb
第三媒體
速途網(wǎng)
51CTO傳媒
投資界
科技訊
智者新時代

京ICP證15039648號京ICP備15039648號-9 京公網(wǎng)安備 11010802021500號

北京第二十六維信息技術(shù)有限公司（至頂網(wǎng)）版權(quán)所有。 | 聯(lián)絡(luò)我們

舉報電話：010-62641205　涉未成年人舉報專線：010-62641208 舉報郵箱: jubao@zhiding.cn 　網(wǎng)上有害信息舉報專區(qū)：https://www.12377.cn

<p id="0acfl"><li id="0acfl"><sup id="0acfl"></sup></li></p>