與之前幾乎所有的平臺性技術(shù)不同,生成式AI骨子里就帶著“應(yīng)用”的基因,因?yàn)檫@個概念的興起就是和ChatGPT這個“超級應(yīng)用”結(jié)合在一起的。不過,通用性的聊天機(jī)器人,顯然更擅長解決通用性問題,如何面向更多行業(yè)、更多企業(yè)、更多個人,將大模型能力下沉到細(xì)分場景中,將所有“傳統(tǒng)應(yīng)用”再做一遍,才是AI真正的價(jià)值所在。
產(chǎn)業(yè)機(jī)遇在哪里很清楚,但抓住這個機(jī)遇并不容易。因?yàn)?strong>信仰“Scaling Law”的大模型,是高投入的游戲,疊加新的技術(shù)門檻,沒有足夠的資源,開發(fā)者們很難上牌桌。他們急需一個強(qiáng)大基礎(chǔ)設(shè)施的托舉。
而阿里云正在承擔(dān)這個使命。
作為國內(nèi)云計(jì)算產(chǎn)業(yè)的領(lǐng)軍者,阿里云過去15年的厚重積累早已被打上云時(shí)代基礎(chǔ)設(shè)施的標(biāo)簽。而面向新的AI時(shí)代,這家公司現(xiàn)在又成為生成式AI創(chuàng)新的底座。Gartner 2024年度《云AI開發(fā)者服務(wù)魔力象限》報(bào)告顯示,阿里云是唯一進(jìn)入挑戰(zhàn)者象限的中國企業(yè),且在云上AI服務(wù)的執(zhí)行能力上,阿里云獲評中國最佳。
如果說象限圖上的指標(biāo)還略顯抽象,那么在2024云棲大會期間,阿里云4萬平米智能科技展區(qū)上,所展示的百余款前沿AI應(yīng)用,則是相當(dāng)具象的。
在百景AI應(yīng)用展區(qū)入口,有一句醒目的標(biāo)語:“讓天下沒有難做的AI應(yīng)用”,顯然也巧妙地呼應(yīng)了阿里早期立下的使命:“讓天下沒有難做的生意”。阿里云大模型與AI計(jì)算解決方案總經(jīng)理張?zhí)靹聦Υ丝偨Y(jié)說,“(讓難事不再難)這不是一個新話題,而是延續(xù)阿里多年來一直做的事情,只是在AI時(shí)代賦予了新的使命。”
【1】解題三板斧
從大模型的基礎(chǔ)能力到應(yīng)用落地,中間橫亙著一條漫長的PMF鏈路。張?zhí)靹轮赋觯?strong>指令理解、知識增強(qiáng)、工具增強(qiáng)——這些都是AI應(yīng)用中的關(guān)鍵技術(shù)點(diǎn),雖然很多創(chuàng)新團(tuán)隊(duì)可以通過框架或工具,快速搭建簡單的應(yīng)用,但將其優(yōu)化到完全契合業(yè)務(wù)需求,仍是一個巨大挑戰(zhàn)。
此外,AI應(yīng)用的落地不僅考驗(yàn)技術(shù),對人才也提出了更高的要求。根據(jù)《2024年中國企業(yè)智能化發(fā)展人才需求調(diào)研》報(bào)告,高達(dá)91.3%的受訪企業(yè)面臨AI人才缺乏的問題。換言之,高水平的AI產(chǎn)品經(jīng)理和AI架構(gòu)師的匱乏,進(jìn)一步加劇了這一難題。
既然如此,阿里云憑借什么來降低AI應(yīng)用門檻,從而實(shí)現(xiàn)“讓天下沒有難做的AI應(yīng)用”?張?zhí)靹驴偨Y(jié)而言,有這樣的三重保證:
落到具體的措施層面,在推動AI應(yīng)用落地的過程中,阿里云也提供了多個維度的支持:
在技術(shù)層面,阿里云提供模型、云上數(shù)據(jù)庫、人工智能平臺PAI、智能搜索平臺OpenSearch等核心服務(wù),為企業(yè)的AI應(yīng)用筑下堅(jiān)實(shí)的技術(shù)底座。同時(shí),針對不同需求的客戶,阿里云推出了靈活的解決方案——對于技術(shù)自服務(wù)能力強(qiáng)的客戶,提供原子化產(chǎn)品;而對于需要完整工具鏈的客戶,則提供“百煉”這樣的一站式平臺。
在價(jià)格方面,阿里云也表達(dá)了極大的誠意。繼5月首次大幅降價(jià)后,本次云棲大會上,阿里云宣布百煉平臺上的三款通義千問主力模型再次降價(jià)。其中,Qwen-Turbo的價(jià)格直降85%,低至百萬tokens僅0.3元,Qwen-Plus和Qwen-Max分別降價(jià)80%和50%。此外,阿里云百煉平臺還為所有新用戶免費(fèi)贈送超5000萬tokens及4500張圖片生成額度。
這一系列舉措,不僅有效降低了AI應(yīng)用的門檻,也在推動更多企業(yè)參與AI創(chuàng)新。云棲大會的百大AI應(yīng)用展示,是最有力的說明。
【2】四大板塊,解碼百景AI
為了讓業(yè)界更方便找到契合自身賽道的應(yīng)用范本,阿里云將這100個應(yīng)用分為創(chuàng)作搭檔、效率工具、專業(yè)助手、擬人交互四大板塊,也間接勾勒出一幅AI產(chǎn)業(yè)畫卷。
中國一汽、趣丸集團(tuán)、申通、網(wǎng)易伏羲、巨人網(wǎng)絡(luò)、小冰、星巴克、小紅書、微博、喜馬拉雅、創(chuàng)維酷開、小鵬汽車等眾多企業(yè)悉數(shù)亮相。從軟件到硬件,從商業(yè)到服務(wù),業(yè)態(tài)類型豐富程度可想而知。
張?zhí)靹轮赋觯?strong>這四大板塊實(shí)際上是沿著時(shí)間線脈絡(luò),體現(xiàn)了工程由易到難、產(chǎn)品由簡單到豐富的演進(jìn)過程。大模型從支持創(chuàng)作者激發(fā)內(nèi)容想象力、到辦公場景做提效工具、再到行業(yè)垂直領(lǐng)域?qū)<抑忠约吧缃粖蕵奉I(lǐng)域的擬人交互,落地的場景和商業(yè)化閉環(huán)在不斷演進(jìn)。
在創(chuàng)作搭檔板塊,無論是音頻生成、音樂創(chuàng)作、短劇編寫,還是繪本創(chuàng)作,AI如同靈感繆斯,激發(fā)創(chuàng)作者無限的創(chuàng)意與想象。起初,人們擔(dān)心AIGC(AI生成內(nèi)容)會沖擊UGC(用戶生成內(nèi)容),但事實(shí)證明,創(chuàng)作者正加速擁抱AI技術(shù),推動UGC與AIGC的深度融合。
例如,中文在線的逍遙AI協(xié)作平臺,能夠一鍵生成萬字小說,甚至只用一張圖就能寫一部小說;趣丸集團(tuán)的唱鴨APP,提供文本生曲、圖片生曲、視頻生曲的AI能力,實(shí)現(xiàn)了“零門檻”音樂創(chuàng)作。
在效率工具板塊,從會議摘要自動生成、智能決策支持、標(biāo)書快速編寫,到智能搜索優(yōu)化、智能外呼服務(wù)、精準(zhǔn)營銷推薦,AI驅(qū)動的生產(chǎn)工具正在帶來工作方式的革命性變化。
作為傳統(tǒng)制造企業(yè)的代表,中國一汽在擁抱AI上表現(xiàn)得尤為積極。今年2月,中國一汽聯(lián)合阿里云通義千問打造的大模型應(yīng)用GPT-BI率先落地,可接收自然語言查詢,結(jié)合企業(yè)數(shù)據(jù)自動生成分析圖表。在現(xiàn)場,觀眾還可以體驗(yàn)智慧助手“紅旗云妹”,體驗(yàn)“輸入一句話實(shí)時(shí)產(chǎn)出數(shù)據(jù)看板”。
如今“AI上車”已成為汽車行業(yè)的熱詞,雖然目前還處于初級階段,但張?zhí)靹抡J(rèn)為,AI與車輛核心功能的深度結(jié)合已是大勢所趨,未來通過AI交互實(shí)現(xiàn)整車控制的時(shí)刻會加速到來。
在專業(yè)助手板塊,無論是交通、能源、金融、醫(yī)療、教育,還是旅游出行、面試招聘,AI降低了獲取行業(yè)知識的門檻,通過知識庫訓(xùn)練的虛擬專家逐漸成為各領(lǐng)域不可或缺的助手。
例如,申通利用AI加速快遞行業(yè)的數(shù)字化轉(zhuǎn)型。他們以快遞員和客服的AI助手為切入點(diǎn),AI快遞員助手可以實(shí)現(xiàn)即時(shí)業(yè)務(wù)支持和知識檢索,客服AI助手則幫助客服人員進(jìn)行工單摘要和熱線推薦,這很大程度提升了服務(wù)質(zhì)量。
在擬人交互板塊,針對社交娛樂、直播電商等需要人形態(tài)的服務(wù)場景,智能NPC通過模擬真實(shí)的人類行為和情感反應(yīng),極大地豐富了互動的內(nèi)容和形式。
例如,網(wǎng)易伏羲聯(lián)合阿里云打造了游戲UGC-NPC、游戲Copilot語音AI隊(duì)友、智能捏臉等AI應(yīng)用,為玩家提供多模態(tài)的AI游戲體驗(yàn)。在展臺現(xiàn)場,觀眾可以試玩《永劫無間》,親身感受AI隊(duì)友帶來的游戲體驗(yàn)。
這些百大AI應(yīng)用,代表著AI為產(chǎn)業(yè)帶來的無限可能,正是這些廣泛落地的應(yīng)用場景,昭示著AI產(chǎn)業(yè)化的蓬勃發(fā)展。
【3】云與AI,是一體兩面
有一句人人皆知的觀念,叫做“能力越大責(zé)任越大”,但是反過來,要想承擔(dān)更大的責(zé)任,也需要能力這個基本功。換言之,打鐵還要自身硬。
為了給更多生成式AI企業(yè)賦能,阿里云在這次云棲大會上,升級了自身的“云+AI”實(shí)力。具體而言,通過全棧優(yōu)化,阿里云打造出一套穩(wěn)定和高效的AI基礎(chǔ)設(shè)施,連續(xù)訓(xùn)練有效時(shí)長大于99%,模型算力利用率提升20%以上;同時(shí),阿里云全線升級了云原生安全能力,首次發(fā)布了云原生網(wǎng)絡(luò)檢測與響應(yīng)產(chǎn)品NDR(Network Detection Response),并宣布將持續(xù)增加免費(fèi)的安全防護(hù)能力,幫助中小企業(yè)客戶以極低的投入完成基礎(chǔ)的云上安全風(fēng)險(xiǎn)治理。
談到云與AI的關(guān)系,張?zhí)靹抡J(rèn)為,AI已成為云的一個基本能力。兩者相互促進(jìn),云為AI提供了彈性的高可用基礎(chǔ)設(shè)施,AI為云帶來了智能化的運(yùn)維、體驗(yàn)、監(jiān)測、建模能力,以及對數(shù)據(jù)化能力的重構(gòu)。
他進(jìn)一步指出,“在阿里云內(nèi)部,我們從未將云與AI視為兩件事。AI的到來,使云成為更先進(jìn)的生產(chǎn)力形態(tài)。10年前的云服務(wù)可能僅限于初級的IaaS層產(chǎn)品;而如今,數(shù)據(jù)庫、大數(shù)據(jù)、云原生等高層次的服務(wù)已成為云的標(biāo)配。同樣的道理,我們認(rèn)為未來的云將默認(rèn)包含AI的能力。”
總之,云計(jì)算之所以在AI時(shí)代更有優(yōu)勢,是因?yàn)樵泼嫦駻I的能力提升,能為AI應(yīng)用開發(fā)、應(yīng)用部署提供最強(qiáng)有力的支持和最好的客戶體驗(yàn)。此外,AI應(yīng)用還要兼具企業(yè)應(yīng)用的基礎(chǔ)特征、高可用、業(yè)務(wù)連續(xù)性、數(shù)據(jù)強(qiáng)一致性等,這才是能夠被廣泛使用的AI應(yīng)用的核心要素。
在具體構(gòu)建AI應(yīng)用或AI Agent方面,企業(yè)需要高性能的網(wǎng)絡(luò)、存儲等彈性基礎(chǔ)設(shè)施、底層基礎(chǔ)大模型能力、彈性的API能力、以及模型服務(wù)工具、微調(diào)工具、向量數(shù)據(jù)庫等能力。而阿里云當(dāng)下的路線,幾乎覆蓋了所有的AI技術(shù)棧,并在每一條線上都持續(xù)投入。
類似地,在AI應(yīng)用場景上,阿里云也并未局限在一兩個熱門領(lǐng)域,而是廣泛覆蓋了幾乎所有重點(diǎn)業(yè)務(wù)場景。對此,張?zhí)靹卤硎荆?ldquo;我們希望能夠服務(wù)更多的客戶,因?yàn)锳I技術(shù)的想象空間非常廣闊。不過事實(shí)上,很多時(shí)候并不是我們?nèi)ミx擇場景,而是客戶找到了我們。”
從公司戰(zhàn)略角度,阿里云始終堅(jiān)守云與AI技術(shù)服務(wù)商的定位,不會跳下去做具體應(yīng)用,也不會打造一個超級APP作為商業(yè)模式的主要出口。這種堅(jiān)定的生態(tài)站位,確保了阿里云專注于技術(shù)賦能,為各行各業(yè)提供堅(jiān)實(shí)的基礎(chǔ)支撐,同時(shí)也讓客戶和生態(tài)伙伴敢于和阿里云長期合作。
此外,大模型的開源和閉源一直是業(yè)界頗有爭議的話題,阿里云在這方面堅(jiān)持開源開放的戰(zhàn)略,同時(shí)形成了開源與閉源相結(jié)合的整體體系。2023年8月,通義千問宣布加入開源行列,此次云棲大會上,阿里云宣布開源通義千問Qwen2.5。相比Qwen2,Qwen2.5擁有更強(qiáng)的知識、編程和數(shù)學(xué)能力,在多個核心任務(wù)上,性能超越了Llama 405B。
張?zhí)靹抡J(rèn)為,首先,開源一定有利于生態(tài)的發(fā)展,甚至是今天中國AI產(chǎn)業(yè)實(shí)現(xiàn)全球領(lǐng)先的唯一路徑;由于AI技術(shù)可探索的方向太多,任何一個團(tuán)隊(duì)都無法覆蓋所有方向,開源能夠吸引更多的力量參與進(jìn)來。其次,開源為用戶提供了更多選擇,尤其是那些希望在獨(dú)立環(huán)境中使用AI的客戶,閉源會限制這些客戶的使用,開源則為他們打開了大門。最后,開源也表達(dá)了阿里云長期投入、持續(xù)創(chuàng)新的決心。
【4】三個新落腳點(diǎn)
盡管大模型的輿論熱度已經(jīng)高到沸點(diǎn),但是在云棲大會上,幾乎所有發(fā)言嘉賓都認(rèn)為,我們依然處于AI大時(shí)代的早期階段。
站在產(chǎn)業(yè)應(yīng)用一線的角度,阿里云也觀察到了三大新趨勢。
首先在語言模型層面,行業(yè)內(nèi)正在探索兩條路線:一是探索更大的Dense模型,尋求更高的智能化水平;二是在同等智能化水平,把模型能做得更小。今天,阿里云的很多模型服務(wù)已經(jīng)在更小的尺寸上提供了同樣的泛化能力,這是工程上的一大進(jìn)步。
其次是全模態(tài)模型,GPT-4o掀起一股全模態(tài)(Omni-modal)熱潮,而目前國內(nèi)尚未有嚴(yán)格對標(biāo)的全模態(tài)模型,阿里云的VL模型(Vision-LanguageModel)、VL模型(Audio-LanguageModel)都在開發(fā)者生態(tài)獲得了非常高的評價(jià),阿里云正在快速發(fā)展對標(biāo)4o的全模態(tài)模型。
最后是下一代端到端的機(jī)器人技術(shù),端到端的自動駕駛技術(shù)已經(jīng)逐步具備了工程化的能力這也讓我們看到了端到端機(jī)器人技術(shù)的曙光,盡管當(dāng)下這項(xiàng)技術(shù)不一定有突破,但值得各個公司長期研究和投入。
得益于這些戰(zhàn)略布局和前瞻洞察,阿里云才能有底氣引領(lǐng)AI產(chǎn)業(yè)的發(fā)展方向,踐行“讓天下沒有難做的AI應(yīng)用”這一使命。
張?zhí)靹抡f,“上半年很多友商都在宣傳自己的大模型調(diào)用量、token量,這些數(shù)字只對廠商
自己有意義,對客戶沒價(jià)值。接下來,我們不會通過數(shù)字來秀肌肉,而是更加關(guān)注客戶價(jià)值,只有為客戶創(chuàng)造價(jià)值,才能證明我們的技術(shù)是有意義的,服務(wù)是可持續(xù)的。”
寫在最后
自2009年成立以來,阿里云已經(jīng)走過15載春秋。阿里云是中國內(nèi)地最早跨入云計(jì)算領(lǐng)域,開始部署算力集群并研發(fā)飛天操作系統(tǒng)的企業(yè),也是最早投入大模型研發(fā)的科技公司之一。
2014年,阿里成立數(shù)據(jù)科學(xué)與技術(shù)研究院,并在當(dāng)年打造國內(nèi)首個人工智能平臺PAI;
2019年,阿里啟動了大模型研發(fā);
2021年,阿里做出了國內(nèi)第一個百億級參數(shù)規(guī)模的大模型;
2023年4月,阿里云正式發(fā)布了自研大模型“通義千問”;
2024年5月,阿里云發(fā)布通義千問2.5,宣布性能趕超GPT-4 Turbo。
而在此刻的云棲大會上,阿里云開始全面迎接“云+AI”時(shí)代。
從阿里云的發(fā)展歷程中不難看出,在不同的技術(shù)時(shí)代,它總能抓住當(dāng)下的機(jī)遇。正如它在互聯(lián)網(wǎng)時(shí)代創(chuàng)造了淘寶,開創(chuàng)中國電商的先河;在移動互聯(lián)網(wǎng)時(shí)代,推動了計(jì)算范式從本地向云端轉(zhuǎn)變,研發(fā)了飛天操作系統(tǒng),促進(jìn)了國內(nèi)云計(jì)算的發(fā)展。而如今,“百模大戰(zhàn)”已成歷史,“百大創(chuàng)新”方興未艾,面向AI時(shí)代的到來,阿里再次站在了技術(shù)革新的浪潮之巔。
好文章,需要你的鼓勵
新加坡國立大學(xué)研究團(tuán)隊(duì)開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實(shí)驗(yàn)顯示,僅訓(xùn)練AI玩簡單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟(jì)大學(xué)團(tuán)隊(duì)開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機(jī)噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實(shí)現(xiàn)37.9%的精度提升,并在真實(shí)設(shè)備上展現(xiàn)出色泛化能力,為機(jī)器人、AR和自動駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團(tuán)隊(duì)通過對比實(shí)驗(yàn)發(fā)現(xiàn),經(jīng)過強(qiáng)化學(xué)習(xí)訓(xùn)練的視覺語言模型雖然表現(xiàn)出"頓悟時(shí)刻"現(xiàn)象,但這些自我糾錯行為并不能實(shí)際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗(yàn)證差距",即生成答案的能力強(qiáng)于驗(yàn)證答案質(zhì)量的能力,且模型在自我驗(yàn)證時(shí)無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機(jī)構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動態(tài)稀疏性實(shí)現(xiàn)大語言模型訓(xùn)練加速1.6倍,計(jì)算成本降低2.2倍。該方法使用SVD稀疏性估計(jì)器智能選擇重要計(jì)算部分,在保持模型性能的同時(shí)顯著提升訓(xùn)練效率,已在多個任務(wù)上驗(yàn)證有效性。