av天堂久久天堂色综合,最近中文字幕mv免费高清在线,在线a级毛片免费视频,av动漫,中文字幕精品亚洲无线码一区

<pre id="grupk"><big id="grupk"><strike id="grupk"></strike></big></pre>

<output id="grupk"></output>

首頁(yè)
對(duì)話創(chuàng)新
對(duì)話科技行者
機(jī)器人新紀(jì)元
AI論文解讀
聯(lián)系我們

微信掃一掃，關(guān)注公眾號(hào)

科技行者
算力行者

見證連接與計(jì)算的「力量」

HASHIRU：一個(gè)能自主調(diào)配資源的多智能體系統(tǒng)，讓AI團(tuán)隊(duì)合作更聰明、更省錢

人工智能多智能體系統(tǒng)資源優(yōu)化

HASHIRU：一個(gè)能自主調(diào)配資源的多智能體系統(tǒng)，讓AI團(tuán)隊(duì)合作更聰明、更省錢

作者：科技行者

2025-06-10 09:28

分享至：

HASHIRU是一個(gè)創(chuàng)新的多智能體系統(tǒng)，由加州大學(xué)戴維斯研究團(tuán)隊(duì)開發(fā)，采用"CEO-員工"層級(jí)結(jié)構(gòu)，動(dòng)態(tài)管理AI智能體團(tuán)隊(duì)。系統(tǒng)優(yōu)先使用小型本地語(yǔ)言模型，僅在必要時(shí)調(diào)用更強(qiáng)大的外部API，通過經(jīng)濟(jì)模型控制資源分配，并能自主創(chuàng)建新工具擴(kuò)展功能。實(shí)驗(yàn)表明，它在復(fù)雜推理任務(wù)上顯著優(yōu)于單一模型（如GSM8K：96% vs 61%），并能有效執(zhí)行學(xué)術(shù)論文評(píng)審和安全評(píng)估任務(wù)，展現(xiàn)了更靈活、更高效的AI協(xié)作新范式。

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

2025-06-10 09:28 ? 科技行者

加州大學(xué)戴維斯分校的Kunal Pai、獨(dú)立研究者Parth Shah和加州大學(xué)戴維斯分校的Harshil Patel在2025年6月1日發(fā)布了一篇引人注目的研究論文《HASHIRU: Hierarchical Agent System for Hybrid Intelligent Resource Utilization》（層級(jí)化混合智能資源利用智能體系統(tǒng)）。這篇論文已發(fā)布在arXiv預(yù)印本平臺(tái)（arXiv:2506.04255v1），有興趣深入了解的讀者可以通過arXiv網(wǎng)站訪問完整論文。

一、為什么我們需要更智能的AI合作團(tuán)隊(duì)？

想象一下，你是一家公司的老板，需要組建一個(gè)團(tuán)隊(duì)來(lái)完成各種復(fù)雜任務(wù)。你會(huì)怎么做？你可能會(huì)根據(jù)任務(wù)需求招聘合適的專家，在項(xiàng)目結(jié)束后解散不再需要的團(tuán)隊(duì)成員，并時(shí)刻關(guān)注團(tuán)隊(duì)的運(yùn)營(yíng)成本。在人工智能世界中，研究者們正在嘗試創(chuàng)建類似的"AI團(tuán)隊(duì)"，讓多個(gè)AI智能體（agent）協(xié)同工作，共同解決復(fù)雜問題。

隨著大型語(yǔ)言模型（LLM）技術(shù)的飛速發(fā)展，這些模型已經(jīng)展現(xiàn)出令人驚嘆的語(yǔ)言理解、生成、推理和規(guī)劃能力。研究者們開始利用這些能力，構(gòu)建多智能體系統(tǒng)（Multi-Agent System，簡(jiǎn)稱MAS），讓AI"團(tuán)隊(duì)"協(xié)同工作，解決單個(gè)AI無(wú)法應(yīng)對(duì)的復(fù)雜問題。這些系統(tǒng)已在科學(xué)發(fā)現(xiàn)、軟件工程、數(shù)據(jù)分析和決策制定等領(lǐng)域顯示出巨大潛力。

然而，當(dāng)前的多智能體框架存在幾個(gè)明顯的局限性：

首先是僵化性。許多系統(tǒng)使用預(yù)定義的角色，難以適應(yīng)不斷變化的任務(wù)需求。就像一家只雇傭固定崗位員工的公司，當(dāng)面臨新挑戰(zhàn)時(shí)會(huì)顯得力不從心。

其次是資源浪費(fèi)。很多系統(tǒng)不關(guān)注計(jì)算資源的優(yōu)化，無(wú)論是API調(diào)用費(fèi)用、內(nèi)存還是CPU使用，都缺乏有效管理機(jī)制，尤其在使用昂貴的專有大型語(yǔ)言模型時(shí)，成本問題尤為突出。

第三是模型單一性。大多數(shù)系統(tǒng)默認(rèn)使用單一的強(qiáng)大LLM，忽視了使用多樣化、更小或本地模型可能帶來(lái)的效率提升。

最后是缺乏自主工具創(chuàng)建和集成能力，限制了系統(tǒng)的動(dòng)態(tài)自我提升。

二、HASHIRU：一個(gè)更靈活、更高效的AI團(tuán)隊(duì)管理系統(tǒng)

為解決這些問題，研究團(tuán)隊(duì)設(shè)計(jì)了HASHIRU（Hierarchical Agent System for Hybrid Intelligent Resource Utilization，層級(jí)化混合智能資源利用智能體系統(tǒng)）。如果把傳統(tǒng)AI系統(tǒng)比作固定編制的團(tuán)隊(duì)，那么HASHIRU就像一個(gè)靈活高效的現(xiàn)代企業(yè)，有明確的層級(jí)管理，合理分配資源，并能根據(jù)需求動(dòng)態(tài)調(diào)整團(tuán)隊(duì)結(jié)構(gòu)。

HASHIRU的核心是一個(gè)類似"CEO"的中央智能體，它動(dòng)態(tài)管理一組專業(yè)化的"員工"智能體。這些"員工"根據(jù)任務(wù)需求和資源限制（成本、內(nèi)存）被即時(shí)創(chuàng)建或銷毀。系統(tǒng)的混合智能策略優(yōu)先使用更小、本地的LLM（通常通過Ollama平臺(tái)運(yùn)行3B-7B參數(shù)規(guī)模的模型），同時(shí)在必要時(shí)靈活使用外部API和更大的模型。

HASHIRU還引入了經(jīng)濟(jì)模型，設(shè)置了"雇傭"和"調(diào)用"費(fèi)用，以促進(jìn)團(tuán)隊(duì)穩(wěn)定性和高效資源分配。系統(tǒng)還包括自主API工具創(chuàng)建功能和記憶功能，使其能夠不斷學(xué)習(xí)和適應(yīng)。

三、HASHIRU如何工作：智能的層級(jí)化管理

HASHIRU的架構(gòu)就像一個(gè)真實(shí)公司的組織結(jié)構(gòu)。在頂層，有一個(gè)"CEO"智能體作為中央?yún)f(xié)調(diào)者和入口點(diǎn)。這位"CEO"負(fù)責(zé)理解用戶查詢、將主要任務(wù)分解為子任務(wù)、識(shí)別所需能力、管理"員工"池、分配子任務(wù)、監(jiān)控進(jìn)度、整合結(jié)果、管理整體資源預(yù)算，以及在必要時(shí)創(chuàng)建新工具。

研究團(tuán)隊(duì)選擇了Gemini 2.0 Flash作為CEO智能體，因?yàn)樗哂袕?qiáng)大的基礎(chǔ)推理能力、工具使用支持和成本效益，使其成為實(shí)際部署的實(shí)用選擇。為增強(qiáng)其規(guī)劃和推理能力，系統(tǒng)提示被設(shè)計(jì)為在處理復(fù)雜查詢和管理子任務(wù)時(shí)激發(fā)內(nèi)在的思維鏈過程。

"員工"智能體則是由CEO根據(jù)特定子任務(wù)實(shí)例化的專業(yè)智能體。每個(gè)員工通常包裝一個(gè)LLM（通過Ollama本地運(yùn)行或通過外部API）或提供工具訪問。它們的特點(diǎn)是專業(yè)化（針對(duì)特定任務(wù)類型如代碼、數(shù)據(jù)分析、信息檢索等定制能力）、動(dòng)態(tài)存在（根據(jù)需要/表現(xiàn)由CEO創(chuàng)建/銷毀）、任務(wù)執(zhí)行（接收任務(wù)、執(zhí)行、返回結(jié)果）和資源消耗（系統(tǒng)追蹤相關(guān)成本如API、硬件利用率）。

這些專業(yè)化的員工智能體基于Mistral 7B、Llama 3、Gemini 1.5、Qwen2.5和DeepSeek-R1等基礎(chǔ)模型構(gòu)建，CEO根據(jù)任務(wù)需求為它們生成定制系統(tǒng)提示。模型可以通過Ollama在本地運(yùn)行，也可以通過API調(diào)用外部模型，如Gemini 2.5 Flash、Qwen QwQ、Llama 4、Mistral Saba、Hermes3等，以及托管在Hugging Face、Groq、Lambda.ai等平臺(tái)上的其他模型。

四、動(dòng)態(tài)智能體生命周期管理：按需雇傭與解雇

HASHIRU的一個(gè)核心創(chuàng)新是CEO對(duì)"員工"智能體的動(dòng)態(tài)管理（雇傭/解雇）。這就像一個(gè)老板根據(jù)公司需求和預(yù)算來(lái)決定何時(shí)雇傭新員工或裁員。

當(dāng)一個(gè)子任務(wù)需要不可用或無(wú)法高效提供的能力時(shí)，CEO可能會(huì)雇傭一個(gè)新智能體。相反，如果一個(gè)智能體表現(xiàn)不佳、閑置、成本高昂，或資源限制接近上限，CEO可能會(huì)解雇它。決策因素包括任務(wù)需求（等待中子任務(wù)所需的能力）、智能體表現(xiàn)（歷史成功率、輸出質(zhì)量、效率）和運(yùn)營(yíng)成本（API、估計(jì)計(jì)算量或其他成本）。

HASHIRU還包含一個(gè)經(jīng)濟(jì)模型：

雇傭成本（"入職獎(jiǎng)金"）：本地模型實(shí)例化時(shí)產(chǎn)生的一次性成本，代表設(shè)置開銷。這個(gè)成本可以根據(jù)模型的資源配置定量調(diào)整（例如，需要更多VRAM或復(fù)雜設(shè)置的模型成本更高）。

調(diào)用成本（"薪資"）：每次使用本地模型時(shí)產(chǎn)生的經(jīng)常性成本，反映操作負(fù)載（如推斷計(jì)算、系統(tǒng)資源參與）。這抽象了給定任務(wù)使用本地資源的成本。

支出成本：外部API調(diào)用的經(jīng)常性成本（如OpenAI、Anthropic），通常根據(jù)API提供商記錄的定價(jià)按令牌使用量計(jì)算。

這些交易成本抑制了過度頻繁的變動(dòng)，促進(jìn)團(tuán)隊(duì)穩(wěn)定性。CEO會(huì)評(píng)估更換一個(gè)智能體的收益是否超過雇傭/解雇成本加上運(yùn)營(yíng)差異。這既打擊了僵化性又允許在管理預(yù)算的同時(shí)進(jìn)行適應(yīng)，防止浪費(fèi)性的頻繁人員更替。

五、混合智能與模型管理：資源的智能調(diào)配

HASHIRU設(shè)計(jì)用于混合智能，利用多樣化的認(rèn)知資源。它戰(zhàn)略性地優(yōu)先使用更小（3B-7B）、成本效益更高的本地LLM，通過Ollama集成增強(qiáng)效率、減少對(duì)外部API的依賴，并潛在地改善隱私/延遲。

系統(tǒng)還整合了外部LLM API（必要時(shí)訪問Gemini 2.5 Flash等強(qiáng)大LLM）、外部工具API（第三方軟件/數(shù)據(jù)源集成）和自創(chuàng)API（由HASHIRU生成的工具）。

CEO管理這個(gè)異構(gòu)資源池，根據(jù)難度、能力和預(yù)算選擇最合適的資源。這平衡了成本效益和效率與高能力需求。

六、資源監(jiān)控與控制：時(shí)刻關(guān)注預(yù)算和性能

顯式資源管理是HASHIRU的核心，超越簡(jiǎn)單的API成本跟蹤。系統(tǒng)在CEO的協(xié)調(diào)下監(jiān)控：

成本：外部API費(fèi)用根據(jù)公布的定價(jià)累計(jì)，而本地智能體的"雇傭"和調(diào)用成本則根據(jù)其內(nèi)存使用情況計(jì)算。

內(nèi)存使用：跟蹤所有活躍"員工"智能體的組合VRAM占用，作為總本地模型GPU預(yù)算的百分比（例如，16 GiB VRAM容量代表100%）。這個(gè)指標(biāo)確保我們保持在預(yù)定義的內(nèi)存限制內(nèi)。

七、工具利用與自主創(chuàng)建：擴(kuò)展AI的能力邊界

HASHIRU的CEO使用預(yù)定義工具（函數(shù)、API、數(shù)據(jù)庫(kù)）進(jìn)行交互并執(zhí)行超出文本生成的操作。

一個(gè)獨(dú)特的功能是集成的自主工具創(chuàng)建。如果CEO確定所需功能缺失，它可以啟動(dòng)新工具創(chuàng)建。這涉及：

1. 定義工具規(guī)范（輸入、輸出、功能） 2. 委托邏輯生成（代碼，可能使用提供的憑證通過外部API，可能通過代碼生成智能體） 3. 將邏輯部署為HASHIRU內(nèi)的新可調(diào)用API端點(diǎn)

為實(shí)現(xiàn)這種自主創(chuàng)建，HASHIRU采用少樣本提示方法，分析系統(tǒng)內(nèi)現(xiàn)有工具以學(xué)習(xí)如何指定和實(shí)現(xiàn)新工具。系統(tǒng)然后可以通過分析執(zhí)行錯(cuò)誤或次優(yōu)輸出迭代地改進(jìn)生成的工具代碼，促進(jìn)自我修正。這使HASHIRU能夠動(dòng)態(tài)擴(kuò)展其功能庫(kù)，定制能力以適應(yīng)任務(wù)，無(wú)需手動(dòng)干預(yù)，實(shí)現(xiàn)更大的自主性和適應(yīng)性。

八、記憶功能：從經(jīng)驗(yàn)中學(xué)習(xí)

HASHIRU為其CEO集成了記憶功能，使其能從過去互動(dòng)中學(xué)習(xí)并糾正錯(cuò)誤。這個(gè)功能存儲(chǔ)重要過去事件的歷史日志，特別是那些涉及失敗嘗試或次優(yōu)結(jié)果的事件。遇到新的或重復(fù)的挑戰(zhàn)時(shí)，系統(tǒng)會(huì)查詢這個(gè)記憶。

檢索依賴于當(dāng)前上下文（如任務(wù)描述、最近行動(dòng)、錯(cuò)誤消息）與存儲(chǔ)的記憶條目之間的語(yǔ)義相似性。由all-MiniLM-L6-v2模型生成的嵌入表示查詢和記憶，余弦相似度確定相關(guān)性。超過預(yù)定義相似度閾值的記憶被檢索，為智能體提供上下文信息。

這使系統(tǒng)能夠汲取過去經(jīng)驗(yàn)，理解為什么之前的方法失敗，調(diào)整策略以避免重復(fù)錯(cuò)誤，從而隨著時(shí)間推移提高性能和效率。這個(gè)過程，用檢索到的知識(shí)增強(qiáng)決策，與檢索增強(qiáng)生成（RAG）概念一致，并支持通過反思過去行動(dòng)來(lái)學(xué)習(xí)，類似于自反思RAG和Reflexion等框架中的想法。

九、實(shí)際應(yīng)用案例：自我完善的AI團(tuán)隊(duì)

研究團(tuán)隊(duì)提供了四個(gè)案例研究，展示HASHIRU的自我完善能力：

首先是自動(dòng)生成智能體專業(yè)化的成本模型。準(zhǔn)確的成本模型對(duì)HASHIRU的資源優(yōu)化至關(guān)重要。HASHIRU通過使用其網(wǎng)絡(luò)搜索能力自動(dòng)收集本地模型性能（如在16 GiB VRAM上）和云API成本數(shù)據(jù)，將其整合到內(nèi)部模型中，自動(dòng)完成了傳統(tǒng)上手動(dòng)的研究過程。

其次是CEO智能體的自主工具集成。為擴(kuò)展其操作范圍，HASHIRU自主集成新工具。它通過使用現(xiàn)有工具模板的少樣本學(xué)習(xí)方法和迭代錯(cuò)誤修復(fù)，簡(jiǎn)化了手動(dòng)工具開發(fā)過程。新生成的工具直接集成到代碼庫(kù)中，減少了開發(fā)開銷并增強(qiáng)了適應(yīng)性，實(shí)現(xiàn)了動(dòng)態(tài)工具創(chuàng)建，最小化人工干預(yù)。

第三是自主預(yù)算管理?；贏PI的LLM常見問題是令牌計(jì)費(fèi)可能導(dǎo)致成本快速上升。HASHIRU通過一個(gè)自我調(diào)節(jié)機(jī)制緩解這一問題，該機(jī)制自主監(jiān)控預(yù)算分配，持續(xù)跟蹤支出與預(yù)定義限制的對(duì)比。這種主動(dòng)方法防止超支并優(yōu)化資源利用，確保成本效益。

最后是通過錯(cuò)誤分析和知識(shí)檢索從經(jīng)驗(yàn)中學(xué)習(xí)。HASHIRU使用兩階段自我改進(jìn)循環(huán)學(xué)習(xí)經(jīng)驗(yàn)。首先，在不正確響應(yīng)后（如在Humanity's Last Exam基準(zhǔn)測(cè)試上），它生成語(yǔ)言批評(píng)和可操作指導(dǎo)，類似"口頭強(qiáng)化學(xué)習(xí)"。其次，這一反饋被索引到檢索增強(qiáng)生成（RAG）存儲(chǔ)系統(tǒng)中，允許在未來(lái)類似問題中檢索。這個(gè)過程，也反映了人類反饋強(qiáng)化學(xué)習(xí)（RLHF）原則，使HASHIRU通過分析解決方案和生成可操作建議從錯(cuò)誤中學(xué)習(xí)。

十、HASHIRU的性能表現(xiàn)：實(shí)驗(yàn)與結(jié)果

研究團(tuán)隊(duì)設(shè)計(jì)了實(shí)驗(yàn)來(lái)評(píng)估HASHIRU的性能、效率和適應(yīng)性，目標(biāo)是評(píng)估其動(dòng)態(tài)資源管理、混合智能和自主工具創(chuàng)建能力，并與基線（Gemini 2.0 Flash單獨(dú)操作）進(jìn)行比較。

在學(xué)術(shù)論文評(píng)審任務(wù)中，HASHIRU表現(xiàn)出58%的成功率。這個(gè)任務(wù)要求系統(tǒng)生成三個(gè)不同專業(yè)背景的評(píng)審，展示了HASHIRU分解復(fù)雜目標(biāo)、動(dòng)態(tài)創(chuàng)建專業(yè)智能體團(tuán)隊(duì)的能力。

在安全評(píng)估上，使用JailbreakBench子集（專為測(cè)試LLM安全特性的對(duì)抗性提示），HASHIRU實(shí)現(xiàn)了100%的成功率，表明其層級(jí)控制和授權(quán)機(jī)制不會(huì)損害基礎(chǔ)CEO模型的安全防護(hù)。

在復(fù)雜推理任務(wù)上，HASHIRU在數(shù)學(xué)和形式推理任務(wù)上顯著優(yōu)于基線：JEEBench（80% vs 68.3%，p < 0.05）、GSM8K（96% vs 61%，p < 0.01）、SVAMP（92% vs 84%，p < 0.05）和MMLU數(shù)學(xué)（91.8% vs 87.2%，p < 0.05）。這些結(jié)果，特別是在數(shù)學(xué)和形式推理任務(wù)如GSM8K、SVAMP、JEEBench和MMLU數(shù)學(xué)上，凸顯了有效工具集成的重大影響，HASHIRU對(duì)此管理得當(dāng)。

然而，在MMLU法律（58.4% vs 61.6%，p > 0.05）和MMLU心理學(xué)（78.7% vs 78.3%，p > 0.05）等社會(huì)科學(xué)領(lǐng)域，即使使用Gemini 2.5 Flash等強(qiáng)大模型，HASHIRU也沒有表現(xiàn)出統(tǒng)計(jì)顯著的優(yōu)勢(shì)。這表明未來(lái)工作可以有益地探索更復(fù)雜的智能體選擇策略或開發(fā)專門針對(duì)這些領(lǐng)域推理微妙之處的專業(yè)智能體，而不僅僅依靠通用模型能力擴(kuò)展。

所有這些發(fā)現(xiàn)直接支持HASHIRU的核心貢獻(xiàn)：動(dòng)態(tài)資源感知智能體生命周期管理、優(yōu)先考慮成本效益本地LLM的混合智能模型、自主工具創(chuàng)建，以及促進(jìn)穩(wěn)定性和高效資源分配的經(jīng)濟(jì)模型。

十一、HASHIRU的局限性與未來(lái)方向

盡管HASHIRU展現(xiàn)出令人印象深刻的能力，研究團(tuán)隊(duì)也認(rèn)識(shí)到系統(tǒng)存在幾個(gè)局限性。一個(gè)關(guān)鍵限制是CEO智能體的通信被限制在單一層級(jí)層次；員工智能體不能生成額外的子智能體，限制了層級(jí)深度。此外，還需要進(jìn)一步開發(fā)以實(shí)現(xiàn)更強(qiáng)大的自主工具創(chuàng)建和對(duì)齊、有效的經(jīng)濟(jì)模型校準(zhǔn)，以及優(yōu)化廣泛歷史的內(nèi)存。

未來(lái)工作將解決這些限制并增強(qiáng)HASHIRU的能力。優(yōu)先事項(xiàng)包括改進(jìn)CEO智能性、探索分布式認(rèn)知、開發(fā)全面的工具管理生命周期，以及嚴(yán)格的基準(zhǔn)測(cè)試。一個(gè)核心計(jì)劃是引入工具調(diào)用校準(zhǔn)：HASHIRU將評(píng)估其內(nèi)部置信度與工具的潛在輸出和可靠性，在不確定時(shí)或如果工具承諾更高效用時(shí)調(diào)用工具，從而旨在更高效、更準(zhǔn)確地解決任務(wù)。這一發(fā)展借鑒了LLM不確定性量化和置信度校準(zhǔn)研究，考慮到LLM擴(kuò)展工具使用的趨勢(shì)，這一點(diǎn)至關(guān)重要。

其他關(guān)鍵工作將集中于通過消融和成本效益分析提高系統(tǒng)可解釋性，擴(kuò)大本地模型庫(kù)，為論文評(píng)審、代碼等任務(wù)專門化架構(gòu)，以及形式化倫理安全框架。

十二、結(jié)語(yǔ)：邁向更智能、更高效的AI合作未來(lái)

這項(xiàng)研究展示了HASHIRU如何通過其層級(jí)控制結(jié)構(gòu)、動(dòng)態(tài)智能體生命周期管理、混合智能方法和集成自主工具創(chuàng)建，解決了當(dāng)前多智能體系統(tǒng)的關(guān)鍵限制。初步評(píng)估和案例研究展示了其在執(zhí)行復(fù)雜任務(wù)、高效管理資源和自主擴(kuò)展能力方面的潛力。

歸根結(jié)底，HASHIRU提供了一個(gè)令人期待的方向，用于開發(fā)更健壯、更高效和更適應(yīng)性強(qiáng)的多智能體系統(tǒng)。就像一個(gè)精明的CEO知道何時(shí)雇傭?qū)＜摇⒑螘r(shí)使用現(xiàn)有資源、如何有效分配預(yù)算一樣，HASHIRU展示了AI系統(tǒng)如何通過動(dòng)態(tài)組織和資源感知決策變得更加聰明。

對(duì)于我們?nèi)粘Ｓ脩?，這意味著未來(lái)的AI助手可能更加高效，能夠更好地利用計(jì)算資源，同時(shí)提供更全面、更準(zhǔn)確的幫助。無(wú)論是復(fù)雜的科學(xué)計(jì)算、文檔分析還是創(chuàng)意任務(wù)，像HASHIRU這樣的系統(tǒng)都將讓AI協(xié)作更加智能化、個(gè)性化和經(jīng)濟(jì)高效。

這一研究由Hugging Face、Lambda Labs和Groq提供支持，源代碼和基準(zhǔn)測(cè)試可在HASHIRU和HASHIRUBench倉(cāng)庫(kù)獲取，感興趣的讀者還可以根據(jù)需求申請(qǐng)實(shí)時(shí)演示。

人工智能多智能體系統(tǒng)資源優(yōu)化

分享至

0贊

好文章，需要你的鼓勵(lì)

推薦文章

音頻生成
大語(yǔ)言模型
多模態(tài)AI

2025-09-10 09:47

如何讓AI像電影配樂師一樣創(chuàng)作完整的長(zhǎng)篇音頻故事——騰訊ARC實(shí)驗(yàn)室團(tuán)隊(duì)AudioStory突破性進(jìn)展

騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng)，首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長(zhǎng)篇音頻故事。該系統(tǒng)結(jié)合大語(yǔ)言模型的敘事推理能力與音頻生成技術(shù)，通過交錯(cuò)式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練，能夠?qū)?fù)雜指令分解為連續(xù)音頻場(chǎng)景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異，為AI音頻創(chuàng)作開辟新方向。
視頻生成
深度學(xué)習(xí)
多模態(tài)學(xué)習(xí)

2025-09-09 13:57

Meta與特拉維夫大學(xué)聯(lián)手打造VideoJAM：讓AI生成的視頻動(dòng)起來(lái)不再是奢望

Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù)，通過讓AI同時(shí)學(xué)習(xí)外觀和運(yùn)動(dòng)信息，顯著解決了當(dāng)前視頻生成模型中動(dòng)作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個(gè)線性層就能大幅提升運(yùn)動(dòng)質(zhì)量，在多項(xiàng)測(cè)試中超越包括Sora在內(nèi)的商業(yè)模型，為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
多模態(tài)AI
人類價(jià)值觀對(duì)齊
數(shù)據(jù)集構(gòu)建

2025-09-09 13:56

上海AI實(shí)驗(yàn)室重磅發(fā)布：讓AI看圖"說(shuō)人話"的神奇訓(xùn)練法，解決多模態(tài)AI與人類價(jià)值觀對(duì)齊難題

上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究，首次系統(tǒng)性解決多模態(tài)大語(yǔ)言模型人性化對(duì)話問題。該研究創(chuàng)建了包含20萬(wàn)高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評(píng)測(cè)基準(zhǔn)，通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法，讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平，為AI價(jià)值觀對(duì)齊提供了可行技術(shù)路徑。
人工智能
圖神經(jīng)網(wǎng)絡(luò)
天氣預(yù)報(bào)

2025-09-09 10:56

谷歌研究團(tuán)隊(duì)發(fā)布超級(jí)預(yù)測(cè)模型：讓AI像天氣預(yù)報(bào)員一樣預(yù)測(cè)全球大氣變化

谷歌DeepMind團(tuán)隊(duì)開發(fā)的GraphCast是一個(gè)革命性的AI天氣預(yù)測(cè)模型，能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào)，準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù)，通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律，在極端天氣預(yù)測(cè)方面表現(xiàn)卓越，能耗僅為傳統(tǒng)方法的千分之一，為氣象學(xué)領(lǐng)域帶來(lái)了效率和精度的雙重突破。

如何讓AI像電影配樂師一樣創(chuàng)作完整的長(zhǎng)篇音頻故事——騰訊ARC實(shí)驗(yàn)室團(tuán)隊(duì)AudioStory突破性進(jìn)展

如何讓AI像電影配樂師一樣創(chuàng)作完整的長(zhǎng)篇音頻故事——騰訊ARC實(shí)驗(yàn)室團(tuán)隊(duì)AudioStory突破性進(jìn)展

2025-09-10 09:47

Meta與特拉維夫大學(xué)聯(lián)手打造VideoJAM：讓AI生成的視頻動(dòng)起來(lái)不再是奢望

Meta與特拉維夫大學(xué)聯(lián)手打造VideoJAM：讓AI生成的視頻動(dòng)起來(lái)不再是奢望

2025-09-09 13:57

上海AI實(shí)驗(yàn)室重磅發(fā)布：讓AI看圖"說(shuō)人話"的神奇訓(xùn)練法，解決多模態(tài)AI與人類價(jià)值觀對(duì)齊難題

上海AI實(shí)驗(yàn)室重磅發(fā)布：讓AI看圖"說(shuō)人話"的神奇訓(xùn)練法，解決多模態(tài)AI與人類價(jià)值觀對(duì)齊難題

2025-09-09 13:56

谷歌研究團(tuán)隊(duì)發(fā)布超級(jí)預(yù)測(cè)模型：讓AI像天氣預(yù)報(bào)員一樣預(yù)測(cè)全球大氣變化

谷歌研究團(tuán)隊(duì)發(fā)布超級(jí)預(yù)測(cè)模型：讓AI像天氣預(yù)報(bào)員一樣預(yù)測(cè)全球大氣變化

2025-09-09 10:56

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

友情鏈接

至頂網(wǎng)
管理現(xiàn)代化
和訊IT
TechWeb
第三媒體
速途網(wǎng)
51CTO傳媒
投資界
科技訊
智者新時(shí)代

京ICP證15039648號(hào) 京ICP備15039648號(hào)-9 京公網(wǎng)安備 11010802021500號(hào)

北京第二十六維信息技術(shù)有限公司（至頂網(wǎng)）版權(quán)所有。 | 聯(lián)絡(luò)我們

舉報(bào)電話：010-62641205　涉未成年人舉報(bào)專線：010-62641208 舉報(bào)郵箱: jubao@zhiding.cn 　網(wǎng)上有害信息舉報(bào)專區(qū)：https://www.12377.cn

<abbr id="iip0m"><thead id="iip0m"><progress id="iip0m"></progress></thead></abbr>

<em id="iip0m"></em>

<track id="iip0m"><option id="iip0m"></option></track>

<abbr id="iip0m"></abbr>

<pre id="iip0m"><big id="iip0m"></big></pre>

<pre id="iip0m"></pre>

<form id="iip0m"></form><tfoot id="iip0m"><source id="iip0m"><input id="iip0m"></input></source></tfoot>

<center id="iip0m"><progress id="iip0m"></progress></center>