CNET科技資訊網(wǎng) 1月9日 特別報(bào)道(文/周雅):當(dāng)你把宜家產(chǎn)品目錄置于地上,嗖,一個(gè)3D虛擬的草綠色宜家沙發(fā)出現(xiàn)了,然后你慢慢后退,發(fā)現(xiàn)這個(gè)沙發(fā)與背后真實(shí)的窗簾顏色很搭,與周邊柜子的距離也恰到好處。你再試著用兩個(gè)手指旋轉(zhuǎn)宜家沙發(fā),發(fā)現(xiàn)或許它換個(gè)朝向更合適落座……不用把這些產(chǎn)品搬到家里,用手機(jī)應(yīng)用就可以?huà)叱龃钆洌獾觅I(mǎi)回家發(fā)現(xiàn)不合適。
這僅是AR在消費(fèi)端應(yīng)用的一個(gè)小例子。從游戲、早教、醫(yī)療到各種工業(yè)制造,AR無(wú)處不在,而讓AR能夠沉浸到行業(yè)應(yīng)用,則是像Vuforia這樣的公司正在做的事情。
CNET近期采訪(fǎng)了PTC公司Vuforia總裁兼總經(jīng)理Jay Wright,“在市面上AR/VR類(lèi)應(yīng)用中,Vuforia公司的市場(chǎng)份額已超過(guò)了75%”,而其中很多應(yīng)用,已經(jīng)在市面上商用了。
PTC公司Vuforia總裁兼總經(jīng)理Jay Wright
現(xiàn)在,Vuforia是PTC的一家子公司,在2015年10月份,PTC以6500萬(wàn)美元的價(jià)格收購(gòu)了Vuforia。Vuforia既做軟件,也為智能眼鏡、平板、智能手機(jī)等硬件廠(chǎng)商提供AR解決方案,覆蓋iOS、安卓、Windows10等全平臺(tái)操作系統(tǒng),當(dāng)開(kāi)發(fā)者開(kāi)發(fā)出基于Vuforia的應(yīng)用之后,不管是小米手機(jī)、聯(lián)想手機(jī)還是蘋(píng)果的iPhone,都能兼容。
正如蓋房子中的地基部分,Vuforia的使命就是要做一個(gè)增強(qiáng)現(xiàn)實(shí)開(kāi)發(fā)技術(shù)的推手——開(kāi)發(fā)出各種AR應(yīng)用的底層技術(shù)模塊,橫跨不同的應(yīng)用領(lǐng)域、應(yīng)用場(chǎng)景和硬件平臺(tái)。
用Jay Wright的話(huà)來(lái)說(shuō),Vuforia每進(jìn)入一個(gè)產(chǎn)業(yè)鏈,就給這個(gè)產(chǎn)業(yè)按上一雙“電子眼”,換個(gè)角度“看見(jiàn)”這個(gè)世界,可以識(shí)別平面,可以透視立體,可以解讀事先編制的符號(hào),然后用更酷炫的方式跟它進(jìn)行交互。
說(shuō)到立體交互,當(dāng)下既有VR,又有AR,虛擬與現(xiàn)實(shí),難免“傻傻分不清楚”。
實(shí)際上VR和AR有一個(gè)非常大的技術(shù)重疊,特別是在頭戴的體驗(yàn)上:一方面是虛擬模型,兩者的開(kāi)發(fā)流程類(lèi)似,都是要布置場(chǎng)景;第二特別是在戴眼鏡的時(shí)候,有一個(gè)頭部動(dòng)作的追蹤,這個(gè)是AR和VR都需要的。
除此之外就很不一樣了。VR基本上就是切斷你與周?chē)F(xiàn)實(shí)世界的聯(lián)系,把你置身于一個(gè)完全虛擬的環(huán)境中,給你一種沉浸式的體驗(yàn)。這也是為什么VR體驗(yàn)往往更多的用于娛樂(lè)端,比如說(shuō)游戲和視頻直播;或者生產(chǎn)環(huán)節(jié),比如做產(chǎn)品評(píng)審,必須走進(jìn)去看看內(nèi)部的構(gòu)造。
Jay Wright指出,AR是基于現(xiàn)實(shí)的,所以需要一個(gè)設(shè)定的環(huán)境,在這個(gè)環(huán)境里去增強(qiáng)一部分信息。因此,AR應(yīng)用的場(chǎng)所和機(jī)會(huì)更多,市場(chǎng)空間更廣闊。比如,智能眼鏡能帶來(lái)更具顛覆性的AR體驗(yàn),其關(guān)鍵在于取代現(xiàn)有的各種屏幕,構(gòu)成所謂的第五屏或是第六屏,從而呈現(xiàn)虛擬和現(xiàn)實(shí)的重合疊加。
舉例AR在寶馬展示中的應(yīng)用,當(dāng)用AR應(yīng)用識(shí)別地上的目標(biāo)物之后,這個(gè)屋子就變成了一個(gè)4S店,真車(chē)大小的一個(gè)模型就出來(lái)了,你甚至可以模擬打開(kāi)它的車(chē)門(mén),踩踩油門(mén),進(jìn)行一種交互體驗(yàn)。
換句話(huà)說(shuō),以后就也許不需要筆記本電腦、顯示屏、投影儀等媒體了。人們既看實(shí)景,又看虛擬部分,用手勢(shì)等方式進(jìn)行交互。但是這些技術(shù)并不是一蹴而就的,需要一個(gè)很長(zhǎng)的循序漸進(jìn)。
這個(gè)循序漸進(jìn)的過(guò)程就是AR不斷發(fā)展的過(guò)程。比如很多人都感興趣的微軟HoloLens,作為一款A(yù)R設(shè)備,它提出的是概念是體積感知。“感”是靠傳感器感應(yīng),“知”是知道平面或立面,有縱深,有起伏。這只是一個(gè)層次。更高級(jí)層次就要靠識(shí)別,“識(shí)”是要有先驗(yàn)知識(shí),“別”是像我們用二維碼的信息,能分辨出不同的個(gè)體——以上,這就是理解層次不斷上升的過(guò)程。
僅僅是為了娛樂(lè),AR就顯得膚淺了,其實(shí)AR最能體現(xiàn)價(jià)值的地方,則在制造業(yè)領(lǐng)域,這一點(diǎn)卻往往被人們忽視,用Vuforia的技術(shù)開(kāi)發(fā)工業(yè)端的應(yīng)用,才是Vuforia的精髓所在。
工業(yè)應(yīng)用強(qiáng)調(diào)一個(gè)持續(xù)交互、按步驟進(jìn)行指南的過(guò)程,要把一個(gè)非常復(fù)雜的過(guò)程用AR這種方式簡(jiǎn)單地表現(xiàn)出來(lái),讓操作者跟著程序走,就能夠準(zhǔn)確無(wú)誤地完成一項(xiàng)操作。Vuforia與一個(gè)電動(dòng)公交車(chē)公司的合作就能解釋這一點(diǎn),公交車(chē)定期維護(hù)修理的過(guò)程中,經(jīng)常要做的是配電箱維護(hù)的操作,但是配電箱里到處是高壓高容量的電阻絲和電子器件,復(fù)雜而危險(xiǎn),而培訓(xùn)的環(huán)節(jié)就使用了AR技術(shù),這樣所有的步驟操作,包括要更換的電阻絲,都以三維模型的方式非常精準(zhǔn)地疊加在實(shí)物上,不用死記硬背,看著它進(jìn)行操作,就能準(zhǔn)確無(wú)誤地完成。
Jay Wright認(rèn)為Vuforia在工業(yè)應(yīng)用上的強(qiáng)項(xiàng)主要是兩點(diǎn)。第一是模型,模型來(lái)源自PLM,這是一個(gè)在線(xiàn)系統(tǒng),可以確保實(shí)時(shí)、最新的模型被隨時(shí)獲取,并非常容易地導(dǎo)入到AR的開(kāi)發(fā)環(huán)境里;另外一個(gè)是物聯(lián)網(wǎng),來(lái)自于互聯(lián)網(wǎng)的動(dòng)態(tài)信息可以最實(shí)時(shí)、最準(zhǔn)確地反映到AR的開(kāi)發(fā)過(guò)程中,同時(shí)非常簡(jiǎn)便地生成AR的內(nèi)容,并且在移動(dòng)端通過(guò)Vuforia 應(yīng)用進(jìn)行瀏覽。整個(gè)這個(gè)環(huán)節(jié)都統(tǒng)統(tǒng)的被Vuforia的一套工具打通,被認(rèn)為是業(yè)界的一個(gè)創(chuàng)舉。
而AR面臨的一個(gè)挑戰(zhàn)是,硬件沒(méi)跟上。比如工業(yè)特別是制造業(yè)當(dāng)中,最關(guān)心的是要解放工人的雙手,讓他看著指示進(jìn)行相應(yīng)的操作,那么這些體驗(yàn)一定要在眼鏡這個(gè)新硬件平臺(tái)上進(jìn)行,然而AR眼鏡還遠(yuǎn)沒(méi)有成熟到真正可以量產(chǎn)的階段,這是一個(gè)很大的課題。
由于AR應(yīng)用的不斷延伸,AR開(kāi)發(fā)者隊(duì)伍也在逐漸壯大。
Vuforia在全球大概是30萬(wàn)注冊(cè)開(kāi)發(fā)者,中國(guó)占了12%,今年中國(guó)注冊(cè)開(kāi)發(fā)者的總?cè)藬?shù)在去年一年翻了一番,這是非常強(qiáng)的勁頭,背后的原因當(dāng)然是AR/VR在中國(guó)的火爆。
在技術(shù)層面的訴求上,中國(guó)和其他國(guó)家地區(qū)沒(méi)有什么區(qū)別,但Jay Wright覺(jué)得,在市場(chǎng)方面,中國(guó)有非常強(qiáng)勁的上升勢(shì)頭,這個(gè)是在其他國(guó)家都觀(guān)測(cè)不到的情況,這是一個(gè)爆發(fā)性的趨勢(shì):“Vuforia用戶(hù)社區(qū)中,很大一個(gè)推動(dòng)力來(lái)自中國(guó),占整個(gè)下載量逾23%,超越了美國(guó),也超越了歐洲全體。在2016年,中國(guó)用戶(hù)的人數(shù)翻了一番。”
在消費(fèi)端市場(chǎng),AR即將變成一種主流的體驗(yàn)方式。就像前段時(shí)間現(xiàn)象級(jí)的AR游戲Pokemon Go,它的出現(xiàn)快速地啟發(fā)人們,讓大家都明白了什么叫AR,這種現(xiàn)象級(jí)的事件把AR確立成為一種主流體驗(yàn)?zāi)J健?/p>
中國(guó)隨之產(chǎn)生了很多AR的產(chǎn)業(yè)熱點(diǎn)。比如在玩具行業(yè)里,一個(gè)新趨勢(shì)就是把游戲和早教結(jié)合,這個(gè)領(lǐng)域涌進(jìn)來(lái)中國(guó)本土的一些初創(chuàng)團(tuán)隊(duì)。比如央數(shù)文化公司的“小熊尼奧”產(chǎn)品,它是最早的AR卡片產(chǎn)品,掃描每個(gè)卡片,會(huì)騰空出現(xiàn)一些動(dòng)物形象,跟著出現(xiàn)這個(gè)動(dòng)物的中英文名稱(chēng),幫助小朋友學(xué)習(xí)。現(xiàn)在,小熊尼奧往前又走了一步,不光做閃卡,還做了一個(gè)專(zhuān)用的AR設(shè)備,專(zhuān)給兒童打造的尼奧放大鏡,所以小孩自己就可以愉快的學(xué)習(xí)了。
產(chǎn)業(yè)熱點(diǎn)很多,圍繞這些熱點(diǎn)所要產(chǎn)生的商業(yè)模式,才是圈里人更關(guān)心的問(wèn)題。Vuforia做了一些探索,Vuforia目前是一個(gè)復(fù)合型的商業(yè)模式,并非完全單一的所謂銷(xiāo)售分成的模式,也不是每個(gè)應(yīng)用都收取授權(quán)費(fèi)的模式。
比如一般的營(yíng)銷(xiāo)工具,在很多情況下,大家在Vuforia網(wǎng)上直接買(mǎi)一個(gè)一次性499美金的應(yīng)用授權(quán)就可以了。還有其他一些情況,比如玩具廠(chǎng)商,通過(guò)AR的技術(shù)已經(jīng)獲取新的價(jià)值增長(zhǎng)點(diǎn),此時(shí)Vuforia的授權(quán)方法就轉(zhuǎn)變成了一種類(lèi)似于銷(xiāo)售分成的手段,大致可理解為在玩具銷(xiāo)售收入中收取提成費(fèi)。
從這個(gè)角度延伸來(lái)看,AR的發(fā)展空間很大。Jay Wright預(yù)測(cè)AR市場(chǎng)前景分兩個(gè)部分——手機(jī)或者是平板這種傳統(tǒng)終端設(shè)備上的AR技術(shù),實(shí)際上已經(jīng)到了開(kāi)始普及的前沿階段,到2017年或后年,AR技術(shù)將迎來(lái)大提升。但頭顯類(lèi)的AR,則需要更長(zhǎng)時(shí)間,它的爆發(fā)點(diǎn)應(yīng)該是在企業(yè)端,一是因?yàn)槠髽I(yè)端的用戶(hù)支付意愿強(qiáng),有利于變現(xiàn);其次因?yàn)槠髽I(yè)用戶(hù)要求酷炫的程度低一些,硬件還比較貴,需先在企業(yè)端進(jìn)行迭代,此后才演進(jìn)到消費(fèi)端。
“企業(yè)端AR普及的起爆點(diǎn),是新設(shè)備的產(chǎn)生,2017年人們將看到不少新設(shè)備出現(xiàn),從而加速AR推廣的進(jìn)程。”Jay Wright做出保守估計(jì),“AR工業(yè)端的成熟需要3到5年,而要傳到消費(fèi)端,則需要5到10年的演進(jìn)過(guò)程。”
根據(jù)這個(gè)數(shù)字,一言以蔽之,AR雖屬于前沿技術(shù),但是基于現(xiàn)實(shí),借著人工智能的發(fā)展勢(shì)頭,爆發(fā)期或許比任何人預(yù)想的要早,很多難題現(xiàn)在還未解決,但是大家正在解決。
好文章,需要你的鼓勵(lì)
騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng),首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長(zhǎng)篇音頻故事。該系統(tǒng)結(jié)合大語(yǔ)言模型的敘事推理能力與音頻生成技術(shù),通過(guò)交錯(cuò)式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場(chǎng)景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開(kāi)辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過(guò)讓AI同時(shí)學(xué)習(xí)外觀(guān)和運(yùn)動(dòng)信息,顯著解決了當(dāng)前視頻生成模型中動(dòng)作不連貫、違反物理定律的核心問(wèn)題。該技術(shù)僅需添加兩個(gè)線(xiàn)性層就能大幅提升運(yùn)動(dòng)質(zhì)量,在多項(xiàng)測(cè)試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語(yǔ)言模型人性化對(duì)話(huà)問(wèn)題。該研究創(chuàng)建了包含20萬(wàn)高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評(píng)測(cè)基準(zhǔn),通過(guò)創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平,為AI價(jià)值觀(guān)對(duì)齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊(duì)開(kāi)發(fā)的GraphCast是一個(gè)革命性的AI天氣預(yù)測(cè)模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào),準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過(guò)學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測(cè)方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來(lái)了效率和精度的雙重突破。
關(guān)注科技創(chuàng)新、技術(shù)投資。
以文會(huì)友,左手硬核科技,右手浪漫主義。