作者|周雅
AI技術狂熱之后,大家當然更關心應用落地。
就在今年的亞馬遜云科技中國峰會,有個議題貫穿了所有討論,那就是“Agentic AI”。在峰會開場,亞馬遜全球副總裁、亞馬遜云科技大中華區(qū)總裁儲瑞松拋出一個判斷:“過去一年,機器智能已經(jīng)爆發(fā)了,如今AI的發(fā)展又來到了一個拐點,我們正處在Agentic AI爆發(fā)的前夜。”
儲瑞松的判斷有理有據(jù),他指出:歷史上,蒸汽機的出現(xiàn),放大和解放了人和動物的肌肉力量,通過在紡織、交通、采礦和冶煉等領域的應用帶來了工業(yè)革命;而現(xiàn)在,機器智能的爆發(fā),則放大和解放了人的大腦智力,其應用也將帶來下一場革命:Agentic AI的革命。
數(shù)據(jù)也在支撐這個觀點:在過去一年,大模型的能力在各個維度都實現(xiàn)了跨越式發(fā)展,就連在2025年1月推出的HLE — Humanity’s Last Exam上,模型正確率也從剛開始的個位數(shù),迅速發(fā)展到如今已經(jīng)超過20%。
亞馬遜全球副總裁、亞馬遜云科技大中華區(qū)總裁儲瑞松
Agentic AI的本質是什么?
我們先不談概念,直擊Agentic AI的本質。
如果說過去一年我們所熟知的生成式AI,是解決了“我說AI寫”、“我問AI答”的問題,那么Agentic AI,用儲瑞松的解釋來說,就是實現(xiàn)了“我說AI做”。這意味著,AI不再是一個被動的工具,而是一個能夠理解復雜意圖、自主規(guī)劃步驟、調用多種工具、并最終完成任務的“數(shù)字員工”。
這聽起來似乎有點抽象,但在峰會的展區(qū),我看到了它最具體的呈現(xiàn):
· 在游戲行業(yè)展臺,開發(fā)者用一句自然語言——“給我創(chuàng)建一個帶有爆炸效果的寶箱”,Amazon Q Developer便能自動編寫代碼、調用游戲引擎API,在幾秒鐘內生成一個功能完備的游戲原型。這背后,是模型上下文協(xié)議(MCP)技術,讓AI像一個資深程序員一樣,讀懂了整個項目的“上下文”,并直接動手干活。
· 在汽車行業(yè)展臺,面對海量的路采視頻,過去需要工程師耗費數(shù)周時間進行人工標注,而現(xiàn)在,基于多模態(tài)大模型的Agent,能夠自動分析視頻內容,精準識別并標注出“雨天夜晚的十字路口,有行人闖紅燈”這樣的復雜場景,極大地加速了高階輔助駕駛模型的研發(fā)迭代。
· 在零售行業(yè)展臺,亞馬遜云科技更是直接將自家的王牌產(chǎn)品Amazon Rufus背后的邏輯,打造成了一套可供所有零售商使用的解決方案。這個AI導購Agent,能理解“我想給喜歡戶外運動的父親買一個生日禮物,預算在500元左右”這樣模糊而復雜的需求,然后自主地去檢索商品庫、分析用戶評論、對比產(chǎn)品參數(shù),最終給出一份個性化的購物清單。
這些鮮活的案例,在儲瑞松看來,共同指向了Agentic AI爆發(fā)的幾個關鍵催化劑:
其一,大模型能力高速提升。
其二,模型上下文(MCP)和智能體到智能體(A2A)兩大協(xié)議,也極大地簡化了智能體與外部工具的交互及智能體間的協(xié)作。
其三,推理成本的降低。斯坦福大學2025年人工智能報告指出,過去兩年推理成本下降了約280倍,這讓Agentic AI應用的規(guī)?;渴鸪蔀榭赡?。
其四,Strands Agents 、Amazon Q等工具的涌現(xiàn),簡化智能體開發(fā)流程。
其五,由于企業(yè)此前在數(shù)字化方面的投入,讓很多場景里數(shù)據(jù)和應用的API都已經(jīng)就緒,可供AI 智能體使用。
亞馬遜云科技全球技術總經(jīng)理Shaown Nandi用了一個絕妙的比喻來形容這一刻:“AI技術的發(fā)展恰如巨型海浪的形成:看似平靜的漣漪在特定條件下也可演變?yōu)楦哌_30米的巨浪,生成式AI和Agentic AI同樣發(fā)展成當今的超級浪潮。而這一轉變主要由不斷創(chuàng)新的模型、海量可用數(shù)據(jù)及強大計算能力的融合所驅動。隨著企業(yè)從謹慎探索轉向廣泛應用,以及亞馬遜云科技等領先科技公司在模型能力、準確性、經(jīng)濟性與安全性等方面持續(xù)創(chuàng)新,這股AI超級巨浪正在重塑全球各個行業(yè)。”
亞馬遜云科技全球技術總經(jīng)理Shaown Nandi
是的,我們正處在這股巨浪的中心,而那些僅僅將AI視為“聊天機器人”或“寫作助手”的企業(yè),恐怕很快就會被這股浪潮無情地拍在沙灘上。
企業(yè)如何擁抱Agentic AI?
當“我說AI做”成為現(xiàn)實,一個更嚴峻的問題擺在了所有企業(yè)面前:如何才能真正駕馭這些“數(shù)字員工”,而不是被它們所淘汰?
答案,遠比選擇一個模型或一個平臺要復雜得多。因為這不是一個單純的技術選型問題,而是一項涉及管理與技術的系統(tǒng)性工程。
在峰會上,儲瑞松給出了企業(yè)實現(xiàn)Agentic AI價值創(chuàng)造的“三大技術準備”,這在我看來,更像是一份寫給所有CEO的“AI時代生存指南”:
第一,你需要一朵“對的云”——一個AI就緒的統(tǒng)一基礎設施。
?這聽起來像是云廠商的廣告語,但儲瑞松的解讀卻切中了要害。他強調,云在Agentic AI時代,是“數(shù)字員工”的工作場所,其重要性被提到了前所未有的高度。企業(yè)選擇云,必須考量四大要素:
第一,安全性。這是底線,無需多言。
第二,穩(wěn)定可靠。“云會成為未來Agentic AI“數(shù)字員工”的工作場所,云的穩(wěn)定可靠將給企業(yè)的Agentic AI “數(shù)字員工”提供一個好的工作場所”。
第三,靈活性。“若要很好地支持企業(yè)的全球業(yè)務拓展,云需要提供大環(huán)境不確定性下靈活應對的確定性。”
第四,技術領先性。“AI發(fā)展日新月異,云需要與時俱進,才能很好地支持企業(yè)的AI創(chuàng)新。”
這實際上是在提醒企業(yè),選擇云,已經(jīng)從過去單純的成本考量,轉變?yōu)閷ξ磥砗诵纳a(chǎn)力平臺的一次戰(zhàn)略性投資。
第二,你需要一盤“好菜”——聚合且治理過的AI就緒的數(shù)據(jù)。
?如果說云是廚房,AI模型是廚師,那么數(shù)據(jù)就是食材。再厲害的廚師,面對一堆雜亂無章、質量堪憂的食材,也做不出米其林大餐。儲瑞松直言不諱:“數(shù)據(jù)決定一家企業(yè)未來Agentic AI‘數(shù)字員工’的視野高度、能力范疇、決策水平和執(zhí)行效果。”
企業(yè)必須打破內部的數(shù)據(jù)孤島,對異構數(shù)據(jù)進行統(tǒng)一的治理。否則,你的“數(shù)字員工”就只能是個別部門的“私人助理”,而無法成為驅動整個企業(yè)變革的“戰(zhàn)略大腦”。
第三,你需要一張“作戰(zhàn)地圖”——明確的策略和快速高效的執(zhí)行。?
這一點,最考驗企業(yè)的戰(zhàn)略定力和執(zhí)行力。儲瑞松給出了兩條極具現(xiàn)實意義的建議:
• 客觀預期:“短期不要有過高不切實際的期望,但是長期一定不能低估它將會對各行各業(yè)帶來的影響。這個長期說的不是10年,而是1到2年。”這簡直是對當前AI泡沫的一劑清醒劑!
• 快速迭代:“能快速實踐Agentic AI應用、并及時總結經(jīng)驗、迭代提升、推廣復制的企業(yè),將有可能更早地從中獲益、并疊加膨脹獲益,從先人一步發(fā)展成為持續(xù)領先。”
這三大準備,環(huán)環(huán)相扣,構成了一個“鐵三角”。而亞馬遜云科技的角色,正是為這個“鐵三角”提供全方位的支撐。從自研的Trainium AI芯片,到覆蓋全球的基礎設施;從全面的大數(shù)據(jù)能力,到Amazon Bedrock、SageMaker等完善的AI開發(fā)工具。
Agentic AI的終極價值
那么,當企業(yè)做好了這一切準備,Agentic AI所能帶來的終極價值,僅僅是提升效率、降低成本嗎?
如果這么想,那就太小看這場革命了。
在峰會現(xiàn)場,我看到了具身機器人在Amazon IoT Core的控制下,實現(xiàn)了精準的語音交互與控制;看到了醫(yī)療行業(yè)的“智能醫(yī)學內容生成中心”,正在加速新藥的研發(fā)與上市;看到了長文本一鍵生成動畫視頻的解決方案,正在顛覆傳統(tǒng)的內容創(chuàng)作流程。
這些固然是效率的巨大提升。但儲瑞松在演講中反復強調了一點:“Agentic AI時代,最令人興奮的將是產(chǎn)品服務乃至商業(yè)模式的創(chuàng)新。”
他舉了Uber、Airbnb、Netflix這些顛覆了傳統(tǒng)行業(yè)的例子,并點名了Cursor、Perplexity等正在用AI創(chuàng)造新物種的初創(chuàng)公司。這背后傳遞出一個信號:Agentic AI最大的價值,在于創(chuàng)造全新的可能性,在于重塑人與世界交互的方式,在于催生前所未見的商業(yè)模式。
這或許才是這場革命最關鍵的部分,它將迫使每一個企業(yè)重新思考:“我的核心價值是什么?”“我為客戶提供的體驗是否可以被重塑?”“我所在的行業(yè),是否會被AI驅動的模式所顛覆?”
為了迎接Agentic AI的爆發(fā),亞馬遜云科技認為,用一朵對的云對于企業(yè)來說變得尤為重要。 此次,亞馬遜云科技還專門推出了“中國區(qū)域客戶Agentic AI實踐指南”,提供Agentic AI系統(tǒng)開發(fā)的參考架構和具體應用指導,讓企業(yè)快速輕松地構建其Agentic AI應用。
亞馬遜云科技Agentic AI實踐指南發(fā)布
當然,從過往經(jīng)驗來看,這是一朵果實累累的云,目前亞馬遜云科技已經(jīng)助力很多企業(yè)解鎖生成式AI潛力:復星醫(yī)藥利用亞馬遜云科技的生成式AI技術和智能醫(yī)學內容生成中心解決方案,將臨床試驗報告的一致性檢查效率提升70%。在零售電商領域,亞馬遜云科技賦能安克創(chuàng)新利用AI創(chuàng)新智能產(chǎn)品,提升公司運作效率,營銷領域20%以上的廣告由AI全托管。消費電子企業(yè)TCL 不僅借助亞馬遜云科技實現(xiàn)產(chǎn)品創(chuàng)新迭代,例如將生成式AI應用于藝術電視及內容出海等方面,提高產(chǎn)品品牌力和用戶體驗,盤活存量電視內容。獨立軟件開發(fā)商合合信息則借助亞馬遜云科技構建了開源的AI Agent終端管理工具Chaterm.AI,助力開發(fā)者高效創(chuàng)新。
好文章,需要你的鼓勵
新加坡國立大學研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓練AI玩簡單撲克游戲就能讓其數(shù)學推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學題目作為訓練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉移到數(shù)學解題中,為AI訓練提供了新思路。
同濟大學團隊開發(fā)的GIGA-ToF技術通過融合多幀圖像的"圖結構"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術利用圖像間的不變幾何關系,結合深度學習和數(shù)學優(yōu)化方法,在合成數(shù)據(jù)集上實現(xiàn)37.9%的精度提升,并在真實設備上展現(xiàn)出色泛化能力,為機器人、AR和自動駕駛等領域提供更可靠的3D視覺解決方案。
伊利諾伊大學研究團隊通過對比實驗發(fā)現(xiàn),經(jīng)過強化學習訓練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實際提升推理準確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構聯(lián)合提出SparseLoRA技術,通過動態(tài)稀疏性實現(xiàn)大語言模型訓練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓練效率,已在多個任務上驗證有效性。
關注科技創(chuàng)新、技術投資。
以文會友,左手硬核科技,右手浪漫主義。