科技行者支持,以分享創(chuàng)業(yè)者的創(chuàng)新故事。
,主要包括仿真現(xiàn)實(shí)SR、虛擬現(xiàn)實(shí)VR、增強(qiáng)現(xiàn)實(shí)AR、混合現(xiàn)實(shí)MR等真實(shí)與虛擬組合的各種技術(shù)應(yīng)用,是具備最高級交互和沉浸方式的內(nèi)容承載形式,甚至被認(rèn)為是“下一代移動(dòng)計(jì)算平臺”,可以被廣泛應(yīng)用于教育培訓(xùn)、工業(yè)制造、游戲娛樂等諸多領(lǐng)域。
然而由于各種條件限制,走向民用的XR技術(shù)還局限于線下應(yīng)用,即極大依賴于硬件,需要戴頭顯或者在特定設(shè)備上使用。具體挑戰(zhàn)來自于:系統(tǒng)數(shù)據(jù)量大、對終端算力要求高、成本高,難以通過網(wǎng)絡(luò)實(shí)現(xiàn)便捷的傳播和輕量化的應(yīng)用。
”平行云創(chuàng)始人兼CEO李巖指出,利用“云”強(qiáng)大的計(jì)算能力,將XR內(nèi)容運(yùn)行上云、渲染上云,同時(shí)把復(fù)雜計(jì)算和圖形渲染轉(zhuǎn)移至云端,通過網(wǎng)絡(luò)將XR體驗(yàn)傳遞至各種形式的泛終端,降低了對終端硬件的配置要求和成本,減弱了對高性能硬件的依賴,推動(dòng)了XR應(yīng)用輕量化、便捷化、移動(dòng)化的使用,并且保護(hù)知識產(chǎn)權(quán),為用戶和企業(yè)提供了卓越的XR體驗(yàn)。
5G是促成XR規(guī)?;瘧?yīng)用的關(guān)鍵要素。
平行云成立于2016年,是CloudXR的理念倡導(dǎo)者和技術(shù)先行者,以提供平行世界的云基礎(chǔ)設(shè)施為核心理念,致力于為開發(fā)者提供低代碼、開箱即用、高效部署的Cloud XR PaaS平臺。服務(wù)客戶覆蓋教育培訓(xùn)、數(shù)字孿生、游戲娛樂、在線展示、虛擬直播等領(lǐng)域。
>
科技行者:您當(dāng)初創(chuàng)辦平行云的一個(gè)契機(jī)是什么?
李巖:說到創(chuàng)辦平行云,不得不說我創(chuàng)業(yè)之前的履歷。此前近20年,我一直在軍隊(duì)的科研單位從事戰(zhàn)場環(huán)境仿真的工作,與XR相關(guān)的事情。業(yè)內(nèi)也都說這項(xiàng)技術(shù)本身是源自于軍事應(yīng)用。
?出來創(chuàng)業(yè)無非考慮兩個(gè)因素。第一,如何把既往的積累盡可能復(fù)用起來;第二,找到一個(gè)更廣闊的空間。
結(jié)合這兩點(diǎn)我們思考,既然可以用仿真的方式去構(gòu)建一個(gè)虛擬的戰(zhàn)場環(huán)境,那么也可以用仿真的方式去構(gòu)建一個(gè)更宏大的虛擬世界,這是創(chuàng)業(yè)初的一個(gè)想法。
?科技行者:給我的感覺有點(diǎn)像平行宇宙或者平行世界。
,這是我們創(chuàng)業(yè)的初心。
科技行者:平行云的定位是云化XR,當(dāng)初為什么選擇這樣一條賽道,對于這條賽道的期待又是什么?
?李巖:由于此前一直在行業(yè)內(nèi),我對XR本身很熟悉,對整個(gè)行業(yè)的發(fā)展歷程、行業(yè)痛點(diǎn)、以及未來趨勢,有自己的理解和認(rèn)知。
我們現(xiàn)在講元宇宙也好,講Metaverse也好,講平行世界也好,眾說紛紜,各種概念沒有統(tǒng)一標(biāo)準(zhǔn)。但其實(shí)大家還是有一個(gè)共識——元宇宙是未來互聯(lián)網(wǎng)的新形態(tài)。這種新形態(tài)跟傳統(tǒng)形態(tài)相比,最大的區(qū)別是,我們可以身臨其境進(jìn)入到一個(gè)虛擬的空間,在里面可以做各種互動(dòng),比如社交、娛樂、購物、學(xué)習(xí)、工作等等。
未來我們不是打開一個(gè)瀏覽器,在一個(gè)窗口里用文字、圖片、音視頻的方式去了解信息,而是身臨其境進(jìn)入一個(gè)虛擬的、三維的、像真實(shí)世界一樣的空間去做互動(dòng),這種形態(tài)就是我們所說的XR。
生產(chǎn)不出來,海量的內(nèi)容傳播不出去或者傳播不便捷,那么使用肯定不廣泛。
只有實(shí)現(xiàn)XR的云化,讓它上云,讓內(nèi)容和終端實(shí)現(xiàn)解綁,讓大家用最輕量級的設(shè)備連上網(wǎng)就能使用XR,這是未來XR規(guī)?;褂玫囊粋€(gè)前提。
科技行者:您剛剛多次提到元宇宙,它其中也會(huì)用到XR和云,您自己怎么看待元宇宙?
其實(shí)目前還不用關(guān)注太多。
?元宇宙的概念是代表著未來,但元宇宙所依賴的技術(shù)一直在發(fā)展,比如XR技術(shù)、新一代智能終端設(shè)備的技術(shù)、網(wǎng)絡(luò)技術(shù),都在發(fā)展中。
科技行者:5G時(shí)代的云化XR有哪些新機(jī)遇?
李巖:XR規(guī)模化應(yīng)用的一個(gè)關(guān)鍵要素是云化,云化之后,它所帶來的問題有三點(diǎn)。
它需要實(shí)時(shí)把一個(gè)高碼率的視頻流,從云端傳輸?shù)浇K端,這需要一個(gè)非常大的帶寬。
不太一樣,后者對于時(shí)延要求的沒那么苛刻。但XR每進(jìn)行一個(gè)新動(dòng)作,比如戴上VR眼鏡,頭稍微一動(dòng),一個(gè)指令上傳到云端,云端去計(jì)算結(jié)果,再以一個(gè)很高碼率的視頻流推回來,這個(gè)時(shí)間必須控制在一個(gè)很小的范圍,否則會(huì)造成眩暈、卡頓等一些不好的用戶體驗(yàn)。
這是一個(gè)完全實(shí)施的過程。不像我們在線看視頻的時(shí)候,還能緩沖一下,可以事先下載,然后保持一個(gè)連續(xù)播放,但是XR的云化對可靠性要求極高。
總結(jié)剛才講的三個(gè)需求,高帶寬、低時(shí)延高可靠、廣連接,恰恰是5G的三大特性。
?科技行者:具體來說,云化XR的應(yīng)用場景是怎么樣的?
,如果用仿真的方式來做,不只讓學(xué)生單向獲取知識,還能夠進(jìn)入場景里進(jìn)行互動(dòng)學(xué)習(xí),這種學(xué)習(xí)效率很高,俗話說看十遍不如動(dòng)手做一遍。
云平臺,所有散落在各個(gè)院系的虛仿課程/VR課程統(tǒng)一放在云平臺上,學(xué)生在任意的時(shí)間、地點(diǎn)用任意輕量級的設(shè)備,都可以接入學(xué)習(xí)。
,臺下的觀眾不只是單向的看演出,還可以化身為一個(gè)虛擬形象進(jìn)入到場景中,與歌手互動(dòng)。
?而這樣的方式,它不可避免要有大量的三維系統(tǒng)去運(yùn)行,甚至是VR/AR系統(tǒng)去運(yùn)行,我們不可能要求看演唱會(huì)的人都有一套專業(yè)設(shè)備,所以要實(shí)現(xiàn)XR的云化才能做到。
科技行者:您如何看待中國在XR領(lǐng)域的產(chǎn)業(yè)地位,和國際相比,情況如何?
,特別是從整個(gè)產(chǎn)業(yè)的核心基礎(chǔ)技術(shù)角度講,我們還處于追趕的階段。
,特別是XR在C端的應(yīng)用場景,實(shí)際上是有待培育和挖掘的。但是國內(nèi)已經(jīng)有大量的B端場景在廣泛使用。
?第三,也是我們國內(nèi)的一個(gè)優(yōu)勢。一方面,我們剛才提到CloudXR是XR規(guī)?;瘧?yīng)用的一個(gè)重要因素,另一方面,5G網(wǎng)絡(luò)建設(shè)又是CloudXR的一個(gè)關(guān)鍵要素,而中國的5G建設(shè)在全球是領(lǐng)先的,所以從這方面一定會(huì)去助力XR在國內(nèi)的各個(gè)場景中的快速落地。
科技行者:所以就更需要像平行云這樣的公司,去做一些技術(shù)推動(dòng)。另外我們了解到,平行云此前跟GSMA有過接觸,您怎么看待未來與GSMA的合作?
李巖:網(wǎng)絡(luò)條件是CloudXR的一個(gè)非常重要的一環(huán),而GSMA又是國際上代表所有運(yùn)營商的一個(gè)組織,而運(yùn)營商是網(wǎng)絡(luò)的提供者,是非常重要的。我們希望能夠借助GSMA平臺,去跟更多的運(yùn)營商、產(chǎn)業(yè)鏈上下游的伙伴一起合作,共同推進(jìn)XR以及XR云化的發(fā)展。
好文章,需要你的鼓勵(lì)
新加坡國立大學(xué)研究團(tuán)隊(duì)開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實(shí)驗(yàn)顯示,僅訓(xùn)練AI玩簡單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟(jì)大學(xué)團(tuán)隊(duì)開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機(jī)噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實(shí)現(xiàn)37.9%的精度提升,并在真實(shí)設(shè)備上展現(xiàn)出色泛化能力,為機(jī)器人、AR和自動(dòng)駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團(tuán)隊(duì)通過對比實(shí)驗(yàn)發(fā)現(xiàn),經(jīng)過強(qiáng)化學(xué)習(xí)訓(xùn)練的視覺語言模型雖然表現(xiàn)出"頓悟時(shí)刻"現(xiàn)象,但這些自我糾錯(cuò)行為并不能實(shí)際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗(yàn)證差距",即生成答案的能力強(qiáng)于驗(yàn)證答案質(zhì)量的能力,且模型在自我驗(yàn)證時(shí)無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機(jī)構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動(dòng)態(tài)稀疏性實(shí)現(xiàn)大語言模型訓(xùn)練加速1.6倍,計(jì)算成本降低2.2倍。該方法使用SVD稀疏性估計(jì)器智能選擇重要計(jì)算部分,在保持模型性能的同時(shí)顯著提升訓(xùn)練效率,已在多個(gè)任務(wù)上驗(yàn)證有效性。