作者 | 金旺
來源 | 科技行者
“我們認(rèn)為AI最大的想象力絕對不在手機屏幕上,而是在通過滲透數(shù)字世界、接管數(shù)字世界,并改變物理世界,”在2024云棲大會上,阿里CEO吳泳銘如是說。
過去22個月里,隨著大模型的闖入,人工智能技術(shù)發(fā)展進入到了一個全新的加速期,從最初擅長文本的大語言模型,到如今的語音、視覺技術(shù)能力加入后的多模態(tài)大模型,大模型已經(jīng)不再只是改善交互能力,而是開始在產(chǎn)業(yè)中嘗試落地、生根發(fā)芽。
阿里是國內(nèi)最早研發(fā)大模型,并將大模型定位為企業(yè)戰(zhàn)略級產(chǎn)品的互聯(lián)網(wǎng)頭部廠商之一。
自2022年9月通義系列大模型發(fā)布后,阿里一邊在推動大模型不斷迭代進化,一邊在推動大模型進入家居、汽車、工業(yè)等場景中,大模型由此開始成為企業(yè)數(shù)智化過程中的一把利器。
實際上,阿里也在推動人工智能與物聯(lián)網(wǎng)深度融合,借助端云協(xié)同能力,幫助企業(yè)應(yīng)對數(shù)智化、全球化兩大產(chǎn)業(yè)趨勢。
01 大模型讓端側(cè)智能再進化
據(jù)Transforma Insights統(tǒng)計數(shù)據(jù)顯示,截至2023年底,全球物聯(lián)網(wǎng)設(shè)備連接數(shù)超過160億。
百億規(guī)模的物聯(lián)網(wǎng)市場,撐起的是近6000億美元的市場規(guī)模。
然而,這樣的發(fā)展速度依然低于市場預(yù)期,早在2010年物聯(lián)網(wǎng)興起時,不少調(diào)研機構(gòu)給出的預(yù)測是,十年后(到2020年),全球物聯(lián)網(wǎng)設(shè)備連接量將達(dá)到500億。
比爾·蓋茨曾說過,“人們總是對于短期的趨勢過于樂觀,對于長期的趨勢過于悲觀”。
如今物聯(lián)網(wǎng)設(shè)備的全球連接量不足最初預(yù)計的一半,大家對于物聯(lián)網(wǎng)市場的長期發(fā)展趨勢似乎過于樂觀了。
之所以如此,是因為在過去十年里,物聯(lián)網(wǎng)市場遭遇過多次價值質(zhì)疑——
對于用戶而言,設(shè)備聯(lián)網(wǎng)后是否真能帶來便利?
對于物聯(lián)網(wǎng)廠商而言,設(shè)備聯(lián)網(wǎng)后如何提供增值服務(wù)、轉(zhuǎn)型做物聯(lián)網(wǎng)“運營商”?
這時,人工智能技術(shù)的發(fā)展就成了破局關(guān)鍵,智能化也成了家電、家居硬件的一個主流趨勢,尤其是大模型的出現(xiàn),正在推動智能終端體驗升級和價值再次躍遷。
阿里云智能集團公共云江浙皖大區(qū)解決方案總經(jīng)理余勇指出,“大模型正在改變所有終端的使用方式。”
余勇認(rèn)為,現(xiàn)在典型的AI終端有三個特性:
第一,要有端側(cè)的AI智能體,在端側(cè)要有個性化的本地實時大模型;
第二,要有多模態(tài)交互能力,人類跟很多機器終端的交互都將采用擬人的自然交互模式;
第三,要有端云協(xié)同的整體能力,結(jié)合端側(cè)的個性化、實時能力和云端規(guī)?;⑼ㄓ媚芰?,讓AI終端有無限成長空間。
實際上,阿里云早在2022年9月就對外發(fā)布了通義系列大模型。
在過去兩年里,阿里云通過技術(shù)迭代,在端云協(xié)同上持續(xù)發(fā)力,不斷豐富模型種類,逐漸形成了如今的全規(guī)格、全尺寸、多模態(tài)模型矩陣,與此同時,阿里云也在借助在大模型上的技術(shù)產(chǎn)品,破局智能終端價值困境。
以智能終端市場中家庭智能攝像頭為例,以往的智能家居攝像頭往往需要在端側(cè)增加AI算法,來實現(xiàn)諸如家庭環(huán)境中的智能識別,但由于端側(cè)算力極為有限,再加上家庭環(huán)境中的干擾,最終在面對老人摔倒檢測這樣的痛點場景,檢測精度往往難以達(dá)到要求。
阿里云相關(guān)負(fù)責(zé)人告訴我們,“由于當(dāng)時的端側(cè)AI能力較弱,往往只能識別出畫面中有沒有人,但無法精準(zhǔn)判斷用戶動作,視覺智能就顯得捉襟見肘。”
作為如今家庭攝像頭領(lǐng)域一位重要玩家,杰峰科技通過與阿里云合作,引入了阿里云通義千問多模態(tài)大模型來增強視覺智能。
同樣是在老人摔倒檢測這個場景中,通過對通義千問大模型在這一場景進行一系列調(diào)優(yōu),最終應(yīng)用到杰峰科技產(chǎn)品中的大模型基本已經(jīng)能夠?qū)崿F(xiàn)接近100%的識別準(zhǔn)確率,由此減少了家庭攝像頭的錯報、漏報問題。
阿里云作為國內(nèi)最早布局大模型技術(shù)的科技公司之一,也一直在推動通義模型持續(xù)開源,如今通義模型已成為最受企業(yè)和開發(fā)者歡迎的國產(chǎn)大模型。
此次在2024云棲大會上開源的Qwen2.5全系列模型都在18T token數(shù)據(jù)上進行預(yù)訓(xùn)練,相比Qwen2,擁有更多的知識、更強的編程和數(shù)學(xué)能力。
Qwen2.5-72B模型在MMLU-rudex基準(zhǔn)(考察通用知識)、MBPP 基準(zhǔn)(考察代碼能力)和MATH基準(zhǔn)(考察數(shù)學(xué)能力)的得分甚至分別高達(dá)86.8、88.2、83.1,阿里云官方稱之為,最強開源模型。
02 什么是企業(yè)出海的剛需?
2024年,面對全球一體化趨勢,企業(yè)業(yè)務(wù)出海成了必然,越來越多的中國企業(yè)開始走出國門,擁抱全球市場。
借助中國供應(yīng)鏈、智能制造優(yōu)勢,擁抱全球市場,對于中國智能終端廠商來說,是一個獨具優(yōu)勢的商業(yè)模式。
然而,要想將智能終端的增值服務(wù)進一步在全球推廣、廣泛運營,就需要一個高可靠、高可用的全球化IT技術(shù)架構(gòu)。
余勇說,“我們要讓IT能力成為企業(yè)業(yè)務(wù)出海的助力,而不是企業(yè)出海的阻礙。”
之所以有這樣的底氣,是因為經(jīng)過過去二十多年的技術(shù)積累,如今的阿里云已經(jīng)成為全球前三,國內(nèi)第一的云服務(wù)商。
據(jù)阿里云官方數(shù)據(jù)顯示,阿里云目前已經(jīng)在全球29個地域,87個可用區(qū)部署了3200+個邊緣節(jié)點,全球合規(guī)認(rèn)證數(shù)量超過130個,完全滿足全球合規(guī)部署需求。
另外,阿里云的OSS對象存儲支持千萬級IPC并發(fā)吞吐,SLS日志分析支持單用戶EB級存儲、日BP級寫入流量、千億物聯(lián)網(wǎng)日志秒查詢……
杰峰科技在將視覺智能產(chǎn)品推向海外時,正是借助阿里的瓴羊?qū)崿F(xiàn)了全球合規(guī)的數(shù)據(jù)采集和分析,由此提升視覺智能產(chǎn)品諸如視圖數(shù)據(jù)分析等智能化能力,提升服務(wù)開通率和用戶訂閱量。
目前杰峰科技的產(chǎn)品已經(jīng)服務(wù)于80多個國家。
涂鴉智能同樣在開展出海業(yè)務(wù)時選用了阿里云,據(jù)涂鴉智能技術(shù)副總裁柯都敏介紹,“涂鴉智能與阿里云在多個業(yè)務(wù)板塊達(dá)成合作,阿里云為我們的業(yè)務(wù)發(fā)展提供了堅實的技術(shù)底座。”
值得注意的是,在2024云棲大會上,阿里云和涂鴉智能官宣發(fā)布了涂鴉物聯(lián)網(wǎng)平臺—阿里云版,雙方將基于這一統(tǒng)一物聯(lián)網(wǎng)平臺,幫助企業(yè)打通IoT數(shù)據(jù)孤島,助力企業(yè)多元化、全球化業(yè)務(wù)發(fā)展。
03 端云協(xié)同,阿里云的戰(zhàn)略版圖
有市場調(diào)研機構(gòu)預(yù)測數(shù)據(jù)顯示,預(yù)計2024年中國市場搭載AI功能的終端設(shè)備將超過70%,此外,全球智能家居市場活躍用戶數(shù)將在2025年達(dá)到5.737億,家庭滲透率從2022年的14.2%增長到2026年的25%。
然而,面對發(fā)展如此迅猛的智能終端市場,智能終端企業(yè)依然面臨著四大挑戰(zhàn):
第一,市場碎片化、互聯(lián)互通難度大的挑戰(zhàn),智能終端廠商需要通過市場整合持續(xù)優(yōu)化成本,尋找業(yè)務(wù)增長的第二曲線;
第二,業(yè)務(wù)全球化的合規(guī)挑戰(zhàn),全球已經(jīng)有137個國家和地區(qū)制定了數(shù)據(jù)保護相關(guān)法律,在企業(yè)出海浪潮下,隱私合規(guī)問題挑戰(zhàn)已經(jīng)越來越大;
第三,海量終端高并發(fā)的挑戰(zhàn),到2025年,物聯(lián)網(wǎng)終端連接量將超過250億,海量設(shè)備的穩(wěn)定可靠安全高效接入和業(yè)務(wù)彈性擴展不可忽視;
第四,端側(cè)智能化的挑戰(zhàn),端側(cè)算力不足、環(huán)境復(fù)雜,如何實現(xiàn)多端協(xié)同、跨模態(tài)交互,通過數(shù)據(jù)化、智能化驅(qū)動高價值服務(wù)轉(zhuǎn)化成為又一挑戰(zhàn)。
面對這些挑戰(zhàn),余勇稱,“云計算的持續(xù)升級,是應(yīng)對技術(shù)挑戰(zhàn)最理想的模式。”
實際上,面對如此復(fù)雜的智能物聯(lián)市場,阿里云已經(jīng)構(gòu)建起云、數(shù)、智、聯(lián)、端一整套完整的產(chǎn)品體系和生態(tài)體系。
基于阿里云這樣的端云協(xié)同產(chǎn)品體系,杰峰科技正在推動端側(cè)應(yīng)用加速,據(jù)杰峰科技AI研究院院長顧湘余介紹,這樣的應(yīng)用加速主要分為五步:
第一,云端持續(xù)收集并更新數(shù)據(jù);
第二,應(yīng)用大模型進行場景細(xì)分訓(xùn)練數(shù)據(jù);
第三,應(yīng)用通義千問大模型進行訓(xùn)練數(shù)據(jù)預(yù)標(biāo)注;
第四,基于標(biāo)注數(shù)據(jù)自助訓(xùn)練模型;
第五,模型加速并自動適配到端側(cè)芯片。
這是杰峰科技借助阿里云端云協(xié)同產(chǎn)品體系的一個端云協(xié)同嘗試,同樣是基于這樣的端云協(xié)同模式,諸如美的、星紀(jì)魅族等企業(yè)也在進行著智能物聯(lián)嘗試。
也是基于這樣的端云協(xié)同產(chǎn)品體系,阿里云正在助力越來越多的智能終端企業(yè)數(shù)智化轉(zhuǎn)型,助力企業(yè)高效開辟、運營海外市場。
好文章,需要你的鼓勵
新加坡國立大學(xué)研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓(xùn)練AI玩簡單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟大學(xué)團隊開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實現(xiàn)37.9%的精度提升,并在真實設(shè)備上展現(xiàn)出色泛化能力,為機器人、AR和自動駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團隊通過對比實驗發(fā)現(xiàn),經(jīng)過強化學(xué)習(xí)訓(xùn)練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質(zhì)量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動態(tài)稀疏性實現(xiàn)大語言模型訓(xùn)練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓(xùn)練效率,已在多個任務(wù)上驗證有效性。
關(guān)注智造、硬件、機器人。