從扎克伯格喊出“進(jìn)攻元宇宙”的口號到現(xiàn)在,已經(jīng)快一年,但許多人對于元宇宙的認(rèn)知仍然很模糊。
對于普通人來說,現(xiàn)在能接觸到的元宇宙是什么樣的?元宇宙到底怎么實(shí)現(xiàn)?帶著這些疑問,記者來到2022世界人工智能大會元宇宙展區(qū),一探究竟。
“WAIC元宇宙展區(qū)”是本屆世界人工智能大會的核心展區(qū),處在會場入口位置,紫紅色展臺十分惹眼。展區(qū)由近三十家元宇宙相關(guān)企業(yè)聯(lián)合打造,展示上海及中國在元宇宙賽道上的最新成果,以及產(chǎn)業(yè)發(fā)展最新進(jìn)程,與大會主題“智聯(lián)世界 元生無界”相契合。同時(shí),展會還同步推出“元境星球”和“元宇宙會場”,為遠(yuǎn)程用戶提供虛實(shí)結(jié)合的參展體驗(yàn)。
交互終端
“WAIC元宇宙展區(qū)”分為數(shù)字工具、交互終端、入口生態(tài)、核心技術(shù)四大板塊,分別對應(yīng)目前元宇宙產(chǎn)業(yè)鏈上的四個(gè)重要技術(shù)領(lǐng)域,其中很多亮相的產(chǎn)品都已經(jīng)進(jìn)入了應(yīng)用階段。
走進(jìn)展區(qū),右側(cè)就是交互終端板塊。這一板塊也是現(xiàn)場參觀者體驗(yàn)感最強(qiáng)的區(qū)域,不少參展者正在試戴AR或VR交互眼鏡。
記者試戴了多款不同品牌的智能眼鏡后,第一感覺是智能眼鏡變輕了!不同于以往人們對智能眼鏡的印象,大多又大又沉,佩戴時(shí)間過長脖子會累,現(xiàn)在的智能交互眼鏡基本和普通眼鏡大小無異,有些產(chǎn)品甚至可以更換不同度數(shù)的內(nèi)鏡片,對近視的用戶也十分友好。
在AR、VR交互終端上,很多技術(shù)和產(chǎn)品已經(jīng)成熟,并且開始走入“尋常百姓家”,比如閃耀現(xiàn)實(shí)發(fā)布的國內(nèi)首款消費(fèi)級AR智能眼鏡Nreal X。這款眼鏡可以將3D AR世界呈現(xiàn)在鏡片上,以連接的智能手機(jī)為操作工具,讓用戶實(shí)現(xiàn)在AR世界里進(jìn)行交互活動。目前,這款眼鏡除了可以與手機(jī)連接,還可以與電腦甚至是游戲機(jī)連接,以滿足用戶觀影、游戲等等娛樂需求。另外,展區(qū)還有運(yùn)用到醫(yī)療場景上的Seerlens One AR眼鏡、為工業(yè)場景打造的PinNotes AR記事本及眼鏡,都讓體驗(yàn)者“耳目一新”。
從工廠到會議室,從文旅打卡到線上觀展,智能交互終端正在將元宇宙引入我們的生活,改變我們參與世界的方式。隨著算法技術(shù)進(jìn)步,智能交互終端也將是下一代計(jì)算中心,成為元宇宙新賽道的重要技術(shù)支撐。
入口生態(tài)
展區(qū)入口的左側(cè)則聚集著幾家做入口生態(tài)的企業(yè)。在這里,你可以看到百度、網(wǎng)易、嗶哩嗶哩等企業(yè)已經(jīng)打造出的元宇宙平臺。
跟隨著動感的音樂聲,記者來到網(wǎng)易的展臺,看到一場蹦迪大會正在屏幕中上演。這是網(wǎng)易瑤臺打造的虛擬活動平臺。掃碼登錄后,記者也可以打造自己的虛擬形象,進(jìn)入蹦迪現(xiàn)場,并和身旁的工作人員在虛擬世界中成功會面,組隊(duì)蹦迪。網(wǎng)易瑤臺解決方案工程師韓磊磊告訴記者,元宇宙虛擬場景的構(gòu)建依靠的就是渲染加美術(shù)建模,而網(wǎng)易具備專業(yè)的游戲美術(shù)團(tuán)隊(duì),在美觀度和沉浸感方面具有優(yōu)勢。
旁邊百度的“希壤”元宇宙平臺也不甘示弱,參觀者通過現(xiàn)場的設(shè)備,可以連接到其元宇宙展區(qū),包含藝術(shù)時(shí)尚、科技、汽車營銷、泛娛樂等等不同的體驗(yàn)區(qū),了解百度“希壤”的元宇宙應(yīng)用場景。
而諸如此類的元宇宙平臺開發(fā),其實(shí)正是為各行各業(yè)快速進(jìn)入元宇宙、搭建元宇宙內(nèi)容場景提供解決方案,目前已經(jīng)可以應(yīng)用在展會、博物館、教育等等場景。入口生態(tài)相關(guān)產(chǎn)業(yè)技術(shù)的創(chuàng)新和應(yīng)用,將大大加速元宇宙新組織形態(tài)、新規(guī)則、新經(jīng)濟(jì)體系的演進(jìn)。
數(shù)字工具
再向前走到展區(qū)的里側(cè),一個(gè)個(gè)展示屏上,活躍著不同的虛擬人形象,說明你走到了數(shù)字工具板塊。這里有著一批虛擬人和數(shù)字孿生展品。
其中一個(gè)高度逼真的仿真人形象引起了記者的注意,屏幕中的男士形象皮膚質(zhì)感非常細(xì)膩、清晰。在工作人員的引導(dǎo)下,記者在手機(jī)鏡頭前做出表情,手機(jī)會識別記者的面部結(jié)構(gòu),電腦上的人也會同步做出表情。甚至,仿真人在同步做表情時(shí),皺紋、面部光影都會隨之改變。
影眸科技項(xiàng)目經(jīng)理原帥介紹,這是其公司開發(fā)的“實(shí)時(shí)超寫實(shí)孿生數(shù)字人”,即可以實(shí)時(shí)驅(qū)動捕捉面部表情的數(shù)字虛擬形象。“以前做到這樣精度的數(shù)字形象,制作周期最少要三個(gè)月?,F(xiàn)在我們突破了技術(shù)壁壘后,通過自研算法和硬件,制作周期只要三天,就可以復(fù)制一個(gè)高精度相似的復(fù)刻形象”原帥說。據(jù)他介紹,目前像這一類數(shù)字工具產(chǎn)品已經(jīng)可以應(yīng)用直播、文旅、教育等等場景。
數(shù)字工具是構(gòu)建元宇宙的基礎(chǔ)虛擬技術(shù),未來元宇宙世界的每一個(gè)基本要素如人、建筑等等萬物的形象,都需要數(shù)字工具去構(gòu)建、開發(fā)??梢哉f,數(shù)字工具支撐起了虛實(shí)兩界的“穿越”,讓用戶在虛擬世界中擁有現(xiàn)實(shí)物理世界的“克隆”。
核心技術(shù)
當(dāng)然,無論是交互終端,還是元宇宙生態(tài)構(gòu)建,都需要背后有核心技術(shù)的支持。在展區(qū)的核心地帶,高通、亞信科技、腦虎科技三家為元宇宙開發(fā)提供技術(shù)和工具產(chǎn)品的企業(yè)聚集在一起,為參觀者呈現(xiàn)目前元宇宙產(chǎn)業(yè)的核心技術(shù)。
亞信科技展區(qū)的負(fù)責(zé)人介紹,他們本次展出的“XR場景工坊”是一套XR內(nèi)容制作和展示的工具產(chǎn)品,產(chǎn)品基于3D、Unity、VR、AR等技術(shù),可以幫助企業(yè)快速制作沉浸式體驗(yàn)應(yīng)用。以“九江VR數(shù)字展廳”為例,虛擬展廳不僅使訪問人數(shù)多了近十倍,而且布展的時(shí)間和經(jīng)濟(jì)成本也極大地縮減下來,在能耗上也做到了清潔,具有線下展廳不可比擬的優(yōu)越性。未來,這種數(shù)字搭建的技術(shù)將越來越成熟。
核心技術(shù)是元宇宙賽道的關(guān)鍵生產(chǎn)力,其強(qiáng)弱在一定程度上影響企業(yè)在賽道上的發(fā)揮,掌握核心技術(shù)也就掌握了元宇宙的話語權(quán)。
元宇宙互動
除了元宇宙展區(qū),本屆元宇宙大會也推出了多種元宇宙體驗(yàn)活動。如大會開發(fā)的元宇宙云會場和元境小鎮(zhèn)兩個(gè)云產(chǎn)品,觀眾可以在其中體驗(yàn)元境打卡、虛擬云會場、直播廣場、亮點(diǎn)產(chǎn)品、五周年地圖、碳中和計(jì)劃等多種形式的互動,體驗(yàn)元宇宙概念。
另外,本屆展會還開設(shè)多個(gè)線下打卡地,觀眾可以在張江科學(xué)會堂、徐匯油罐藝術(shù)分會場兩大WAIC主會場,以及武康大樓、外灘、陸家嘴等上海城市地標(biāo)體驗(yàn)元宇宙技術(shù)。視+AR聯(lián)合創(chuàng)始人涂意說,公司為WAIC提供空間計(jì)算技術(shù)支持,目前在城市級大空間三維建模中,精度已經(jīng)可以達(dá)到1米以內(nèi),歡迎觀眾體驗(yàn)。
同時(shí)在會場內(nèi),還有WAIC專屬記憶、小程序AR導(dǎo)航導(dǎo)覽等等驚喜體驗(yàn)項(xiàng)目。在WAIC專屬記憶打卡點(diǎn),相關(guān)工作人員告訴記者,掃臉完畢后,后臺會自動制作一則包含觀眾形象的短視頻,供觀眾作參會留念。
好文章,需要你的鼓勵
新加坡國立大學(xué)研究團(tuán)隊(duì)開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實(shí)驗(yàn)顯示,僅訓(xùn)練AI玩簡單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟(jì)大學(xué)團(tuán)隊(duì)開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機(jī)噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實(shí)現(xiàn)37.9%的精度提升,并在真實(shí)設(shè)備上展現(xiàn)出色泛化能力,為機(jī)器人、AR和自動駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團(tuán)隊(duì)通過對比實(shí)驗(yàn)發(fā)現(xiàn),經(jīng)過強(qiáng)化學(xué)習(xí)訓(xùn)練的視覺語言模型雖然表現(xiàn)出"頓悟時(shí)刻"現(xiàn)象,但這些自我糾錯行為并不能實(shí)際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗(yàn)證差距",即生成答案的能力強(qiáng)于驗(yàn)證答案質(zhì)量的能力,且模型在自我驗(yàn)證時(shí)無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機(jī)構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動態(tài)稀疏性實(shí)現(xiàn)大語言模型訓(xùn)練加速1.6倍,計(jì)算成本降低2.2倍。該方法使用SVD稀疏性估計(jì)器智能選擇重要計(jì)算部分,在保持模型性能的同時(shí)顯著提升訓(xùn)練效率,已在多個(gè)任務(wù)上驗(yàn)證有效性。