av天堂久久天堂色综合,最近中文字幕mv免费高清在线,在线a级毛片免费视频,av动漫,中文字幕精品亚洲无线码一区

<sub id="c6hxm"><rt id="c6hxm"><form id="c6hxm"></form></rt></sub>

微信掃一掃，關(guān)注公眾號

科技行者
算力行者

見證連接與計算的「力量」

這款會"進(jìn)化"的手機助手，讓智能手機變得前所未有地聰明——伊利諾伊大學(xué)聯(lián)合阿里巴巴推出Mobile-Agent-E

人工智能多智能體系統(tǒng)自我進(jìn)化算法

這款會"進(jìn)化"的手機助手，讓智能手機變得前所未有地聰明——伊利諾伊大學(xué)聯(lián)合阿里巴巴推出Mobile-Agent-E

作者：科技行者

2025-09-15 09:17

分享至：

伊利諾伊大學(xué)和阿里巴巴聯(lián)合推出Mobile-Agent-E，這是一款革命性的自我進(jìn)化手機智能助手。該系統(tǒng)采用分層多智能體架構(gòu)，能夠處理復(fù)雜的跨應(yīng)用任務(wù)，更重要的是具備從經(jīng)驗中學(xué)習(xí)的能力。在新開發(fā)的Mobile-Eval-E基準(zhǔn)測試中，性能比現(xiàn)有最佳方法提升22.1%。

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

2025-09-15 09:17 ? 科技行者

在這個人人都離不開智能手機的時代，我們平均每天要在手機上花費4.5小時。然而，當(dāng)你需要在多個應(yīng)用之間跳轉(zhuǎn)比價購物，或者需要從不同網(wǎng)站收集信息時，是否感到過frustrated？伊利諾伊大學(xué)厄巴納-香檳分校的Zhenhailong Wang、Heng Ji等研究者，聯(lián)合阿里巴巴集團的Haiyang Xu、Ming Yan等科學(xué)家，在2025年1月發(fā)表了一項突破性研究成果Mobile-Agent-E。這項研究發(fā)表在預(yù)印本平臺arXiv上，感興趣的讀者可以通過DOI: arXiv:2501.11733v2訪問完整論文。

想象一下，如果你的手機有一個超級聰明的數(shù)字助手，它不僅能幫你完成復(fù)雜的多步驟任務(wù)，還能從每次使用中學(xué)習(xí)經(jīng)驗，變得越來越高效。這正是Mobile-Agent-E要實現(xiàn)的愿景。這個系統(tǒng)就像一個會學(xué)習(xí)成長的智能管家，能夠代替你在手機上完成那些繁瑣的操作序列。

當(dāng)前的手機智能助手面臨兩個關(guān)鍵問題。第一個問題是能力不足：現(xiàn)有的手機助手通常只能處理簡單、直接的任務(wù)，比如"導(dǎo)航到附近的加油站"。但真實生活中我們需要的任務(wù)要復(fù)雜得多——比如在多個購物應(yīng)用中比較價格找到最優(yōu)惠的商品，或者制定一份綜合考慮多種因素的旅行計劃。這些任務(wù)需要深度推理、跨多個應(yīng)用的長期規(guī)劃，以及在模糊指令下的主動探索。

第二個問題更加根本：現(xiàn)有的智能助手就像患了健忘癥的新手，每次執(zhí)行任務(wù)時都從零開始，重復(fù)犯同樣的錯誤。相比之下，當(dāng)人類用戶第一次打開一個新應(yīng)用時，可能需要一些嘗試才能理解布局并成功執(zhí)行搜索。但通過每次交互，用戶會學(xué)習(xí)和改進(jìn)，下次使用時會更快更準(zhǔn)確?，F(xiàn)有的手機助手卻缺乏這種從過往經(jīng)驗中學(xué)習(xí)的能力。

為了解決這些核心問題，研究團隊開發(fā)了Mobile-Agent-E，這是一個具有自我進(jìn)化能力的分層多智能體框架。這個系統(tǒng)的設(shè)計理念就像一個高效的公司組織架構(gòu)：有一個負(fù)責(zé)制定總體戰(zhàn)略的經(jīng)理，以及幾個各司其職的專門員工。

一、分層管理的智能團隊

Mobile-Agent-E的核心創(chuàng)新在于將復(fù)雜的決策過程分解成兩個層次：高層規(guī)劃和低層執(zhí)行。這種分層設(shè)計就像建筑工程一樣，有總工程師負(fù)責(zé)整體設(shè)計，有各種專業(yè)工人負(fù)責(zé)具體施工。

系統(tǒng)的"經(jīng)理"（Manager）專門負(fù)責(zé)制定總體計劃。當(dāng)你給出一個復(fù)雜任務(wù)時，比如"我想買一個全新的任天堂Switch Joy-Con手柄，任何顏色都可以，請在亞馬遜、沃爾瑪和百思買中比較價格，找到最便宜的選項"，經(jīng)理會將這個大任務(wù)分解成一系列子目標(biāo)：首先打開亞馬遜搜索產(chǎn)品，然后記錄價格，接著切換到沃爾瑪重復(fù)同樣操作，最后在百思買進(jìn)行搜索，并比較三家的價格。

在經(jīng)理制定計劃的同時，四個專業(yè)的下屬智能體分工協(xié)作。感知者（Perceptor）就像系統(tǒng)的"眼睛"，專門負(fù)責(zé)理解當(dāng)前手機屏幕上顯示的內(nèi)容，識別圖標(biāo)、文字和界面元素。操作者（Operator）是系統(tǒng)的"雙手"，根據(jù)經(jīng)理的指示執(zhí)行具體的點擊、滑動、輸入等操作。動作反思者（Action Reflector）充當(dāng)"質(zhì)檢員"，檢查每個操作是否達(dá)到了預(yù)期效果，如果發(fā)現(xiàn)錯誤會及時反饋。記錄員（Notetaker）則負(fù)責(zé)收集和整理任務(wù)過程中的重要信息，比如商品價格、餐廳電話等。

這種分層架構(gòu)的優(yōu)勢非常明顯。經(jīng)理專注于全局規(guī)劃，不會被具體操作細(xì)節(jié)分散注意力，因此能夠制定更合理的長期策略。同時，當(dāng)?shù)蛯硬僮饔龅絾栴}時，系統(tǒng)有完善的錯誤恢復(fù)機制。如果操作者連續(xù)犯錯，錯誤會被上報給經(jīng)理，經(jīng)理會從更高的角度重新調(diào)整策略來解決問題。

二、會學(xué)習(xí)的數(shù)字大腦

Mobile-Agent-E最令人印象深刻的功能是它的自我進(jìn)化能力。系統(tǒng)擁有一個持續(xù)的長期記憶，存儲兩種類型的知識：技巧（Tips）和快捷方式（Shortcuts）。

技巧就像人類的經(jīng)驗教訓(xùn)，是系統(tǒng)從之前的試錯過程中學(xué)到的一般性指導(dǎo)原則。比如，在經(jīng)過多次購物比價任務(wù)后，系統(tǒng)可能學(xué)會這樣的技巧："在確定最佳交易時，要同時考慮價格和功能特性，并確保任何折扣或促銷信息都被清楚標(biāo)注"，或者"在使用篩選器時，滑動操作通常比點擊更有效"。這些技巧類似于人類的情節(jié)記憶，幫助系統(tǒng)在未來遇到類似情況時做出更好的決策。

快捷方式則像熟練工人掌握的標(biāo)準(zhǔn)操作程序，是可以重復(fù)使用的操作序列。比如，系統(tǒng)可能學(xué)會創(chuàng)建一個名為"點擊輸入并搜索"的快捷方式，將"點擊搜索框、輸入文字、按回車"這三個步驟合并成一個可復(fù)用的功能模塊。由于手機環(huán)境變化很快，每個快捷方式都配有明確的使用條件，確保只在合適的情況下使用。

系統(tǒng)配備了兩個專門的"經(jīng)驗反思者"，它們像認(rèn)真的學(xué)生一樣，在每個任務(wù)完成后分析整個過程，更新技巧庫和快捷方式庫。這些反思者會考慮當(dāng)前任務(wù)的執(zhí)行情況、遇到的問題，以及未來可能面臨的類似任務(wù)，從而提取出有價值的經(jīng)驗。

這種學(xué)習(xí)機制的效果是累積的。隨著系統(tǒng)執(zhí)行的任務(wù)越來越多，它的表現(xiàn)會逐步提升。實驗結(jié)果顯示，啟用自我進(jìn)化功能后，系統(tǒng)的滿意度得分提升了6.5%，而且隨著任務(wù)序列的推進(jìn)，后續(xù)任務(wù)的改進(jìn)效果更加顯著。

三、更貼近真實需求的測試標(biāo)準(zhǔn)

為了驗證Mobile-Agent-E的效果，研究團隊還開發(fā)了一個全新的測試基準(zhǔn)Mobile-Eval-E?，F(xiàn)有的手機智能體測試大多關(guān)注簡單、短期的任務(wù)，而且性能已經(jīng)接近飽和。Mobile-Eval-E專門設(shè)計了復(fù)雜的真實世界任務(wù)，更貼近普通用戶的實際需求。

這個基準(zhǔn)包含25個精心設(shè)計的任務(wù)，覆蓋5個真實場景：餐廳推薦、信息搜索、網(wǎng)購比價、熱門趨勢和旅行規(guī)劃。與之前的測試相比，Mobile-Eval-E的任務(wù)復(fù)雜度大幅提升，平均每個任務(wù)需要執(zhí)行14.56個操作，是之前測試的兩倍多。更重要的是，76%的任務(wù)需要在多個應(yīng)用之間切換，而之前的測試中這一比例不到10%。

由于真實世界的任務(wù)往往沒有標(biāo)準(zhǔn)答案，研究團隊還創(chuàng)新了評價方法。他們不再簡單地判斷"成功"或"失敗"，而是制定詳細(xì)的評分準(zhǔn)則，既考慮里程碑式的完成情況（比如"成功打開了地圖應(yīng)用"），也考慮探索性的行為表現(xiàn)（比如"查看了多條用戶評論"）。這種"滿意度得分"更能反映用戶對智能助手表現(xiàn)的真實感受。

四、令人矚目的性能表現(xiàn)

實驗結(jié)果證明了Mobile-Agent-E的有效性。在Mobile-Eval-E基準(zhǔn)測試中，Mobile-Agent-E相比之前最好的方法實現(xiàn)了22.1%的絕對性能提升。在GPT-4o、Claude-3.5-Sonnet和Gemini-1.5-pro三種不同的基礎(chǔ)模型上，這種改進(jìn)都是一致的。

更令人印象深刻的是系統(tǒng)的學(xué)習(xí)效果。隨著任務(wù)執(zhí)行順序的推進(jìn)，后期任務(wù)顯示出更顯著的性能提升，證明了自我進(jìn)化機制的有效性。系統(tǒng)不僅能夠積累經(jīng)驗，還能將這些經(jīng)驗有效地應(yīng)用到新任務(wù)中。

在效率方面，快捷方式的使用顯著減少了計算開銷。雖然分層多智能體架構(gòu)在理論上增加了計算復(fù)雜度，但快捷方式能夠在單次決策中執(zhí)行多個操作，實際上提高了整體效率。啟用自我進(jìn)化后的系統(tǒng)執(zhí)行速度甚至可以與之前的簡單框架相媲美，但性能卻顯著更好。

研究團隊還進(jìn)行了一個閉環(huán)自我進(jìn)化的案例研究。當(dāng)系統(tǒng)積累了大量技巧和快捷方式后，它能夠智能地檢索出與當(dāng)前任務(wù)相關(guān)的經(jīng)驗知識，并成功完成全新的復(fù)雜任務(wù)。這展示了系統(tǒng)在實際應(yīng)用中的可擴展性。

五、技術(shù)創(chuàng)新的深層意義

Mobile-Agent-E的技術(shù)創(chuàng)新不僅僅體現(xiàn)在性能數(shù)字上，更重要的是它代表了智能手機助手發(fā)展的新方向。傳統(tǒng)的單一智能體方法就像讓一個人同時擔(dān)任建筑師、工程師、施工隊長和質(zhì)檢員，難免顧此失彼。分層多智能體架構(gòu)通過合理的分工協(xié)作，讓每個組件都能專注于自己最擅長的任務(wù)。

自我進(jìn)化功能更是具有深遠(yuǎn)意義。它不僅解決了重復(fù)任務(wù)的效率問題，更重要的是為智能系統(tǒng)的持續(xù)改進(jìn)提供了框架。系統(tǒng)能夠從失敗中學(xué)習(xí)，將偶然的成功轉(zhuǎn)化為可復(fù)用的經(jīng)驗，這正是人工智能向更高智能水平發(fā)展的關(guān)鍵特征。

當(dāng)然，系統(tǒng)目前還存在一些限制。比如，有時會因為錯誤理解手機界面狀態(tài)而誤用快捷方式，或者生成的快捷方式本身可能存在缺陷。但這些問題為未來的改進(jìn)指明了方向。

研究團隊特別強調(diào)了安全性考慮。隨著智能助手能力的增強，如何確保它們的行為始終符合用戶意圖變得越來越重要。未來的工作將重點加強隱私保護(hù)、用戶同意確認(rèn)和潛在危險操作的預(yù)警機制。

Mobile-Agent-E的出現(xiàn)標(biāo)志著智能手機助手從簡單的指令執(zhí)行工具向真正智能的數(shù)字伙伴轉(zhuǎn)變。它不僅能夠處理復(fù)雜的現(xiàn)實任務(wù)，還能從經(jīng)驗中持續(xù)學(xué)習(xí)和改進(jìn)。雖然目前還處于研究階段，但這項技術(shù)的發(fā)展方向清晰地指向一個未來：我們的智能手機將擁有真正理解我們需求、能夠獨立思考和學(xué)習(xí)的數(shù)字助手。

說到底，Mobile-Agent-E展示了人工智能技術(shù)如何從實驗室走向真實應(yīng)用的可能路徑。它不是簡單的技術(shù)炫技，而是針對用戶實際痛點的系統(tǒng)性解決方案。隨著這類技術(shù)的成熟和普及，我們與智能設(shè)備的交互方式將發(fā)生根本性變革，手機真正成為我們生活中不可或缺的智能伙伴。

Q&A

Q1：Mobile-Agent-E和普通手機助手有什么區(qū)別？

A：Mobile-Agent-E最大的不同在于它會學(xué)習(xí)和進(jìn)化。普通手機助手每次都從零開始執(zhí)行任務(wù)，而Mobile-Agent-E能從過往經(jīng)驗中學(xué)習(xí)技巧和快捷方式，變得越來越聰明高效。它還采用分層架構(gòu)，有專門的"經(jīng)理"負(fù)責(zé)規(guī)劃，多個"員工"負(fù)責(zé)執(zhí)行，能處理更復(fù)雜的多應(yīng)用任務(wù)。

Q2：Mobile-Agent-E的自我進(jìn)化功能是如何實現(xiàn)的？

A：系統(tǒng)擁有長期記憶，存儲兩種知識：技巧（從試錯中學(xué)到的經(jīng)驗教訓(xùn)）和快捷方式（可重復(fù)使用的操作序列）。每完成一個任務(wù)，兩個"經(jīng)驗反思者"會分析整個過程，更新知識庫。這些經(jīng)驗會在后續(xù)任務(wù)中被調(diào)用，讓系統(tǒng)表現(xiàn)越來越好。

Q3：這項技術(shù)什么時候能在普通手機上使用？

A：目前Mobile-Agent-E還處于研究階段，論文發(fā)表在學(xué)術(shù)預(yù)印本平臺上。雖然實驗結(jié)果很有前景，但要真正應(yīng)用到消費級手機產(chǎn)品中，還需要解決安全性、隱私保護(hù)、用戶界面設(shè)計等問題。研究團隊正在開發(fā)相關(guān)的安全機制和用戶確認(rèn)流程。

人工智能多智能體系統(tǒng)自我進(jìn)化算法

分享至

0贊

好文章，需要你的鼓勵

推薦文章

音頻生成
大語言模型
多模態(tài)AI

2025-09-10 09:47

如何讓AI像電影配樂師一樣創(chuàng)作完整的長篇音頻故事——騰訊ARC實驗室團隊AudioStory突破性進(jìn)展

騰訊ARC實驗室推出AudioStory系統(tǒng)，首次實現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù)，通過交錯式推理生成、解耦橋接機制和漸進(jìn)式訓(xùn)練，能夠?qū)?fù)雜指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測試中表現(xiàn)優(yōu)異，為AI音頻創(chuàng)作開辟新方向。
視頻生成
深度學(xué)習(xí)
多模態(tài)學(xué)習(xí)

2025-09-09 13:57

Meta與特拉維夫大學(xué)聯(lián)手打造VideoJAM：讓AI生成的視頻動起來不再是奢望

Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù)，通過讓AI同時學(xué)習(xí)外觀和運動信息，顯著解決了當(dāng)前視頻生成模型中動作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個線性層就能大幅提升運動質(zhì)量，在多項測試中超越包括Sora在內(nèi)的商業(yè)模型，為AI視頻生成的實用化應(yīng)用奠定了重要基礎(chǔ)。
多模態(tài)AI
人類價值觀對齊
數(shù)據(jù)集構(gòu)建

2025-09-09 13:56

上海AI實驗室重磅發(fā)布：讓AI看圖"說人話"的神奇訓(xùn)練法，解決多模態(tài)AI與人類價值觀對齊難題

上海AI實驗室發(fā)布OmniAlign-V研究，首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評測基準(zhǔn)，通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法，讓AI在保持技術(shù)能力的同時顯著提升人性化交互水平，為AI價值觀對齊提供了可行技術(shù)路徑。
人工智能
圖神經(jīng)網(wǎng)絡(luò)
天氣預(yù)報

2025-09-09 10:56

谷歌研究團隊發(fā)布超級預(yù)測模型：讓AI像天氣預(yù)報員一樣預(yù)測全球大氣變化

谷歌DeepMind團隊開發(fā)的GraphCast是一個革命性的AI天氣預(yù)測模型，能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報，準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù)，通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律，在極端天氣預(yù)測方面表現(xiàn)卓越，能耗僅為傳統(tǒng)方法的千分之一，為氣象學(xué)領(lǐng)域帶來了效率和精度的雙重突破。

如何讓AI像電影配樂師一樣創(chuàng)作完整的長篇音頻故事——騰訊ARC實驗室團隊AudioStory突破性進(jìn)展

如何讓AI像電影配樂師一樣創(chuàng)作完整的長篇音頻故事——騰訊ARC實驗室團隊AudioStory突破性進(jìn)展

2025-09-10 09:47

Meta與特拉維夫大學(xué)聯(lián)手打造VideoJAM：讓AI生成的視頻動起來不再是奢望

Meta與特拉維夫大學(xué)聯(lián)手打造VideoJAM：讓AI生成的視頻動起來不再是奢望

2025-09-09 13:57

上海AI實驗室重磅發(fā)布：讓AI看圖"說人話"的神奇訓(xùn)練法，解決多模態(tài)AI與人類價值觀對齊難題

上海AI實驗室重磅發(fā)布：讓AI看圖"說人話"的神奇訓(xùn)練法，解決多模態(tài)AI與人類價值觀對齊難題

2025-09-09 13:56

谷歌研究團隊發(fā)布超級預(yù)測模型：讓AI像天氣預(yù)報員一樣預(yù)測全球大氣變化

谷歌研究團隊發(fā)布超級預(yù)測模型：讓AI像天氣預(yù)報員一樣預(yù)測全球大氣變化

2025-09-09 10:56

----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-

友情鏈接

至頂網(wǎng)
管理現(xiàn)代化
和訊IT
TechWeb
第三媒體
速途網(wǎng)
51CTO傳媒
投資界
科技訊
智者新時代

京ICP證15039648號京ICP備15039648號-9 京公網(wǎng)安備 11010802021500號

北京第二十六維信息技術(shù)有限公司（至頂網(wǎng)）版權(quán)所有。 | 聯(lián)絡(luò)我們

舉報電話：010-62641205　涉未成年人舉報專線：010-62641208 舉報郵箱: jubao@zhiding.cn 　網(wǎng)上有害信息舉報專區(qū)：https://www.12377.cn

<cite id="tgnnk"></cite>

<cite id="tgnnk"></cite>