科技行者 1月14日 北京消息(文/周雅):科技思想家凱文·凱利認(rèn)為,技術(shù)是一種生命體,是動(dòng)物、植物等自然界生命體之外的第七生命體。似乎一語中的,技術(shù)的演進(jìn),從靈感的迸發(fā),到創(chuàng)意的落地,也宛如生命進(jìn)化一般,過程往往要經(jīng)歷漫長歲月,而非一蹴而就。
AR技術(shù)和AI技術(shù),就走了這樣一條路徑。AI技術(shù)則略年長一點(diǎn),1956年的8月,約翰·麥卡錫(John McCarthy)、馬文·閔斯基(Marvin Minsky)、克勞德·香農(nóng)(Claude Shannon)等學(xué)者,定義了一個(gè)技術(shù)概念,用機(jī)器來模仿人類學(xué)習(xí)以及其他方面的智能——人工智能。人工智能技術(shù),從創(chuàng)世,到落地,經(jīng)歷了三代技術(shù)的起起落落,足足等了接近70年的歲月。AR技術(shù)略年輕一點(diǎn),但它最早也要追溯到25年前,保羅·米爾格拉姆(Paul Milgram)和岸野文郎(Fumio Kishino)兩位學(xué)者提出的現(xiàn)實(shí)-虛擬連續(xù)統(tǒng)(Milgram's Reality-Virtuality Continuum),他們將真實(shí)環(huán)境和虛擬環(huán)境分別作為連續(xù)系統(tǒng)的兩端,其中最靠近真實(shí)環(huán)境的部分,就是增強(qiáng)現(xiàn)實(shí)(Augmented Reality),即用數(shù)字手段,豐富我們的真實(shí)世界體驗(yàn)。
有意思的是,一種技術(shù)的演進(jìn)突破,往往伴隨著另外一項(xiàng)技術(shù)的推波助瀾,如同生物界不同物種的互相伴生。AI技術(shù)的最終突破,就來源于大數(shù)據(jù),和計(jì)算能力的突飛猛進(jìn),由后兩者協(xié)力推動(dòng)而來。而現(xiàn)在,AI技術(shù)作為一個(gè)老大哥,也要開始充當(dāng)推動(dòng)者的角色,它推動(dòng)的對象,便是AR。當(dāng)然,在某種程度上,AR也反過來成為AI技術(shù)場景落地的絕佳舞臺(tái)。
2020年1月10日,Unity和商湯科技,兩家分別來自AR屆和AI屆的高科技公司,在上海舉辦了一場面向開發(fā)者的活動(dòng)——“AI+AR大派對”,就是這兩種技術(shù)互相成就的最新注解。
“AI+AR大派對”現(xiàn)場
商湯科技和Unity的合作時(shí)間雖不長,但進(jìn)度突飛猛進(jìn),源于兩家公司的各自底蘊(yùn)。
Unity是全球創(chuàng)作者使用最廣泛的實(shí)時(shí)內(nèi)容開發(fā)平臺(tái),成立以來,就一直為全世界的開發(fā)者提供豐富的以視覺為核心的開發(fā)工具,近年來對以VR、AR為代表的XR也是其技術(shù)發(fā)展的重中之重?,F(xiàn)在使用Unity制作的游戲和體驗(yàn)已在全球范圍內(nèi)覆蓋將近30億臺(tái)設(shè)備,并且其在過去一年的安裝量已超過330億次。在2019年圣丹斯電影節(jié)所有XR內(nèi)容中,65%是使用Unity制作的。
而商湯科技,則是人工智能領(lǐng)域的佼佼者,它是中國科技部指定的第一個(gè)“智能視覺”國家新一代人工智能開放創(chuàng)新平臺(tái),全球總?cè)谫Y額及估值等在行業(yè)都處于領(lǐng)先者陣營。或許正因?yàn)?ldquo;視覺”是商湯科技的內(nèi)核,所以AR技術(shù)也早早進(jìn)入它的視線:2016年,商湯就對外提供AR特效引擎的能力;到了2019年,商湯科技提供了更加完整的解決方案,如SenseAR開發(fā)者平臺(tái)等。
而商湯科技創(chuàng)始人湯曉鷗的一段話,恰好是Unity公司和商湯科技合作的最佳旁白,“ AI與AR 的深度融合,將能使虛擬世界和現(xiàn)實(shí)世界實(shí)現(xiàn)無縫對接;AI 賦能 AR,從 AR 化妝、AR 導(dǎo)航、AR 測量到 AR 游戲、AR 數(shù)字人等,一系列創(chuàng)新的 AR 應(yīng)用,有望覆蓋并改變你每天的生活和工作”。無獨(dú)有偶,國家新一代人工智能規(guī)劃,也有這樣的論斷: “在建立新一代人工智能關(guān)鍵共性技術(shù)體系時(shí),需要關(guān)注虛擬現(xiàn)實(shí)智能建模技術(shù),重點(diǎn)突破虛擬對象智能行為建模技術(shù),提升虛擬現(xiàn)實(shí)中智能對象行為的社會(huì)性、多樣性和交互逼真性,實(shí)現(xiàn)虛擬現(xiàn)實(shí)、增強(qiáng)現(xiàn)實(shí)等技術(shù)與人工智能的有機(jī)結(jié)合和高效互動(dòng)”。
有了這樣的前提,兩家公司自然一拍即合。2019年5月,商湯科技與Unity達(dá)成戰(zhàn)略合作,將商湯原創(chuàng)AR開發(fā)者平臺(tái)SenseAR 2.0與Unity引擎的Unity AR Foundation深度集,為開發(fā)者的內(nèi)容創(chuàng)作提供多維支持。
既然是生態(tài),自然是越繁榮越好。在“AI+AR大派對”上,商湯科技研發(fā)工程師廖錦毅介紹,商湯科技正在做生態(tài)方面的拓展:
第一, 有核心應(yīng)用場景需求的伙伴,比如電商、游戲。商湯和《王者榮耀》合作,和京東合作,和淘寶合作。顯然,這些在生活場景中有海量用戶的伙伴,急需AR技術(shù)提升用戶體驗(yàn)。
第二, 平臺(tái)間的相互協(xié)作,推動(dòng)整個(gè)AR產(chǎn)業(yè)鏈的聯(lián)動(dòng)。據(jù)悉,商湯科技于2019年初與業(yè)界合作伙伴共同發(fā)起并成立了中國增強(qiáng)現(xiàn)實(shí)核心技術(shù)產(chǎn)業(yè)聯(lián)盟,在行標(biāo)和國標(biāo)上發(fā)動(dòng)關(guān)于AR的一些立項(xiàng)。
第三, 與Unity相互集成,讓開發(fā)者用熟悉的開發(fā)工具,開發(fā)出更多優(yōu)質(zhì)的應(yīng)用,商湯和Unity,各自成為開發(fā)者裝備包里的另一端。
為了鼓勵(lì)開發(fā)者更加全面地了解、掌握和運(yùn)用商湯SenseAR 和 Unity AR Foundation平臺(tái),鼓勵(lì)開發(fā)者為這個(gè)世界帶來更多的原創(chuàng)AR作品,兩者還聯(lián)合召開“2019 AR應(yīng)用創(chuàng)作大賽”。
圖:Unity大中華區(qū)技術(shù)經(jīng)理殷崇英
針對這項(xiàng)賽事,Unity大中華區(qū)技術(shù)經(jīng)理殷崇英在“AI+AR”大派對上代表Unity對開發(fā)者們發(fā)出了這樣一個(gè)美好的主張:
“開發(fā)者其實(shí)就是創(chuàng)作者,Unity不把程序員定義成傳統(tǒng)的開發(fā)人員,AR技術(shù),不僅惠及游戲,還涉及千行百業(yè)。所以,我們歡迎每一個(gè)人,也希望我們的技術(shù)適用于每一個(gè)人。因此,我們希望每一位開發(fā)者,使用強(qiáng)大的開發(fā)工具,成為一個(gè)創(chuàng)造世界(真實(shí)和數(shù)字世界疊加的增強(qiáng)現(xiàn)實(shí)世界)的藝術(shù)家。”
圖:“AI+AR”大派對現(xiàn)場開發(fā)者與嘉賓合影
有了美好的愿景,接下來就是工具平臺(tái)的發(fā)力時(shí)刻了,對商湯科技和Unity兩家公司的專家來說,這方面一點(diǎn)都不虛。
殷崇英進(jìn)一步表示,Unity的AR Foundation平臺(tái)適用性非常廣泛,覆蓋娛樂行業(yè)、制造業(yè)、汽車業(yè)、教育、醫(yī)療、建筑,Unity都能為他們提供了非常強(qiáng)大的工具,包括協(xié)助創(chuàng)建內(nèi)容,提供運(yùn)維服務(wù),甚至助力開發(fā)者盈利。
比如汽車行業(yè),Unity的開發(fā)者工具可以實(shí)現(xiàn)通過VR對一款汽車進(jìn)行工程設(shè)計(jì),讓消費(fèi)者無需接觸實(shí)物便能體驗(yàn)一款汽車的使用,不受物理邊界限制進(jìn)行駕車演練,自動(dòng)駕駛汽車,以及未來的車內(nèi)體驗(yàn)。豐田汽車項(xiàng)目經(jīng)理Koichi曾對此發(fā)表這樣一番實(shí)際感受:在豐田,用Unity VR和AR開發(fā)提高設(shè)計(jì)、工程和培訓(xùn)的效率和質(zhì)量的工具,有高度的靈活性,效果非常好。
2018年10月,Unity 發(fā)布 AR Foundation 1.0,支持基本AR功能,包括平面追蹤、特征點(diǎn)云檢測、參考點(diǎn)/錨點(diǎn)、設(shè)備追蹤、光照估計(jì)、射線碰撞;2019年5月,AR Foundation 2.1 支持圖像追蹤、物體追蹤、面部追蹤、環(huán)境探針;2019年6月,AR Foundation 3.0 支持 ARKit 3.0,新增動(dòng)作捕捉、人物遮擋、多人協(xié)作等功能;2019年3月,AR Foundation 支持 Magic Leap 以及 HoloLens 1 和 2 (預(yù)覽),也增加了一些幫助XR開發(fā)加速迭代的工具,如:XR Interaction Toolkit (預(yù)覽),Unity as a Library;2019年Q4,SenseAR集成進(jìn)了Unity中國增強(qiáng)版2018.4.11C版本中,Unity中國增強(qiáng)版即Unity全球版 + 中國區(qū)獨(dú)特功能和服務(wù)。對于Unity來說,技術(shù)持續(xù)演進(jìn),從不停歇。
商湯科技研發(fā)工程師廖錦毅、商湯SenseAR戰(zhàn)略規(guī)劃負(fù)責(zé)人季浩宇關(guān)于《SenseAR-AI賦能AR,讓虛實(shí)融合更加多維》的主題演講里,讓開發(fā)者則清晰的了解到,商湯SenseAR平臺(tái)、SenseAR平臺(tái)技術(shù)的算法、SenseAR的AR生態(tài)、SenseAR 解決方案,如何把理解環(huán)境的能力從平面升級(jí)到多維,商湯科技多年來的AI功底,讓這些方案如虎添翼。
廖錦毅介紹, 商湯科技的SenseAR可以從兩個(gè)角度來看:
第一是信息形勢,從信息形勢對算法進(jìn)行分類,包括“對人的識(shí)別”與“對環(huán)境的識(shí)別”,可以對應(yīng)為“對人的理解的算法”以及“對環(huán)境理解的算法”。
第二是信息載體,主要的信息載體是手機(jī)平臺(tái)與眼鏡平臺(tái),“SenseAR平臺(tái)是世界上首個(gè)跨不同設(shè)備的AR平臺(tái),通過手機(jī)、眼鏡的一套SDK,可以在不同設(shè)備上適應(yīng)不同的算法。”
而季浩宇的一段話,或許可以作為商湯科技與Unity這場“AI+AR大派對”和“2019 AR應(yīng)用創(chuàng)作大賽”的初心總結(jié):“我們希望能夠和更多開發(fā)者溝通,讓大家在這個(gè)平臺(tái)上,分享需求,提出問題,亮出創(chuàng)意。我們也希望通過這些交流,拿出更好的技術(shù)方案貢獻(xiàn)給開發(fā)者“。
圖:商湯SenseAR戰(zhàn)略規(guī)劃負(fù)責(zé)人季浩宇
2019年11月6日,Unity與商湯科技共同宣布,由雙方聯(lián)合主辦、中國增強(qiáng)現(xiàn)實(shí)核心技術(shù)產(chǎn)業(yè)聯(lián)盟指導(dǎo)的“2019 AR應(yīng)用創(chuàng)作大賽”正式啟動(dòng)。大賽旨在幫助開發(fā)者更高效地挖掘AI技術(shù)在AR領(lǐng)域的應(yīng)用開發(fā)場景,以AI+AR創(chuàng)造更多創(chuàng)意內(nèi)容,推動(dòng)應(yīng)用的創(chuàng)新與落地。
即日起,開發(fā)者可登陸大賽官網(wǎng):https://connect.unity.com/challenges/2019ar-contest 報(bào)名并提交創(chuàng)意,優(yōu)秀作品及獲獎(jiǎng)結(jié)果將在2020年6月的 Unite Shanghai 2020上進(jìn)行公布。獲獎(jiǎng)團(tuán)隊(duì)不僅可贏取豐厚的獎(jiǎng)金與官方證書,更將有機(jī)會(huì)與商湯科技和Unity開展業(yè)務(wù)合作,或得到相關(guān)崗位實(shí)習(xí)的機(jī)會(huì),并在主辦方扶持下推動(dòng)優(yōu)秀作品的方案落地。
作為全球領(lǐng)先的人工智能平臺(tái)公司,商湯科技SenseTime是中國科技部指定的“智能視覺”國家新一代人工智能開放創(chuàng)新平臺(tái)。同時(shí),商湯科技也是全球總?cè)谫Y額及估值最高的人工智能創(chuàng)新企業(yè)。
商湯科技以“堅(jiān)持原創(chuàng),讓AI引領(lǐng)人類進(jìn)步”為愿景。公司自主研發(fā)并建立了全球頂級(jí)的深度學(xué)習(xí)平臺(tái)和超算中心,推出了一系列領(lǐng)先的人工智能技術(shù),包括:人臉識(shí)別、圖像識(shí)別、文本識(shí)別、醫(yī)療影像識(shí)別、視頻分析、無人駕駛和遙感等。商湯科技已成為亞洲最大的AI算法提供商。
商湯科技在多個(gè)垂直領(lǐng)域的市場占有率位居首位,業(yè)務(wù)涵蓋智能手機(jī)、互聯(lián)網(wǎng)娛樂、汽車、智慧城市、以及教育、醫(yī)療、零售、廣告、金融、地產(chǎn)等多個(gè)行業(yè)。目前,商湯科技已與國內(nèi)外700多家世界知名的企業(yè)和機(jī)構(gòu)建立合作,包括本田、SNOW、阿里巴巴、蘇寧、中國移動(dòng)、OPPO、vivo、小米、微博、萬科、融創(chuàng)等。
商湯科技現(xiàn)已在香港、上海、北京、深圳、成都、杭州、京都、東京、新加坡設(shè)立辦公室。更多信息,請?jiān)L問商湯科技網(wǎng)站、微信、微博和領(lǐng)英。
Unity是全球創(chuàng)作者使用最廣泛的實(shí)時(shí)內(nèi)容開發(fā)平臺(tái),為全世界的開發(fā)者提供創(chuàng)建豐富的、交互式2D、3D、VR和AR體驗(yàn)提供工具。公司千人規(guī)模的開發(fā)團(tuán)隊(duì)使Unity始終保持前沿科技的水平;而與眾多像Google、Facebook、Magic Leap、Oculus和Microsoft這樣的合作伙伴合作,也確保了它能夠?yàn)樽钚掳姹竞推脚_(tái)提供優(yōu)化的支持。使用Unity制作的游戲和體驗(yàn)已在全球范圍內(nèi)覆蓋將近30億臺(tái)設(shè)備,并且其在過去一年的安裝量已超過330億次。Unity強(qiáng)大的靈活性使開發(fā)者能夠?yàn)槌^25個(gè)平臺(tái)制作和優(yōu)化內(nèi)容,這些平臺(tái)包括Xbox One、PlayStation 4、SteamVR(PC & Mac)、Oculus、PSVR、Gear VR、HoloLens、ARKit(Apple)、ARCore(Google)。Unity還提供諸多解決方案和服務(wù)來與受眾群體建立聯(lián)系,這些解決方案包括Unity Ads廣告、Unity Analytics數(shù)據(jù)分析、Unity Asset Store資源商店、Unity云構(gòu)建、Unity Collaborate、Unity Connect和Unity認(rèn)證等。
好文章,需要你的鼓勵(lì)
新加坡國立大學(xué)研究團(tuán)隊(duì)開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實(shí)驗(yàn)顯示,僅訓(xùn)練AI玩簡單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟(jì)大學(xué)團(tuán)隊(duì)開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機(jī)噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實(shí)現(xiàn)37.9%的精度提升,并在真實(shí)設(shè)備上展現(xiàn)出色泛化能力,為機(jī)器人、AR和自動(dòng)駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團(tuán)隊(duì)通過對比實(shí)驗(yàn)發(fā)現(xiàn),經(jīng)過強(qiáng)化學(xué)習(xí)訓(xùn)練的視覺語言模型雖然表現(xiàn)出"頓悟時(shí)刻"現(xiàn)象,但這些自我糾錯(cuò)行為并不能實(shí)際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗(yàn)證差距",即生成答案的能力強(qiáng)于驗(yàn)證答案質(zhì)量的能力,且模型在自我驗(yàn)證時(shí)無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機(jī)構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動(dòng)態(tài)稀疏性實(shí)現(xiàn)大語言模型訓(xùn)練加速1.6倍,計(jì)算成本降低2.2倍。該方法使用SVD稀疏性估計(jì)器智能選擇重要計(jì)算部分,在保持模型性能的同時(shí)顯著提升訓(xùn)練效率,已在多個(gè)任務(wù)上驗(yàn)證有效性。
關(guān)注科技創(chuàng)新、技術(shù)投資。
以文會(huì)友,左手硬核科技,右手浪漫主義。