易訊理想科技公司今天發(fā)布了國內(nèi)第一款正式商業(yè)化應(yīng)用的增強現(xiàn)實產(chǎn)品”幻視“,該公司CEO史凌波在發(fā)布會上表示:“增強現(xiàn)實不再是多么神秘的技術(shù),技術(shù)普通人也能使用‘幻視’,親身體驗甚至制作增強現(xiàn)實內(nèi)容。”
國內(nèi)唯一掌握增強現(xiàn)實技術(shù)核心算法的團隊
眾所周知,增強現(xiàn)實技術(shù)的關(guān)鍵在于識別圖像的核心算法,而這正是易訊理想科技技術(shù)團隊所主攻的,團隊中絕大部分研究人員都相關(guān)領(lǐng)域的專家,并且擁有多年海外學(xué)習(xí)經(jīng)歷,部分還曾經(jīng)參與過Google Glass項目的研發(fā),積累了大量寶貴的科研經(jīng)驗。團隊申請相關(guān)專利百余項,除了在視覺識別領(lǐng)域,還在精確圖像學(xué)習(xí)、增強現(xiàn)實、可深度學(xué)習(xí)的人工智能等多個相關(guān)領(lǐng)域也有著深入的研究。這些都為”幻視“產(chǎn)品的誕生打下了堅實的技術(shù)基礎(chǔ)。
會上易訊理想科技的技術(shù)團隊向大家分享了一組數(shù)據(jù):幻視背后的核心算法,在實際情況下圖像識別率達到99.9%,云端內(nèi)容數(shù)據(jù)庫支持10億級的目標(biāo)圖像存儲,并且單機百萬級圖像識別率小于0.5s,多項技術(shù)指標(biāo)居世界第一位。
自主內(nèi)容編輯平臺,打造最易用的增強現(xiàn)實工具
強大的技術(shù)支持使得”幻視“擁有了其他同類產(chǎn)品不具備的功能,其中云端內(nèi)容編輯平臺便是最大亮點。以往的增強現(xiàn)實產(chǎn)品大多需要專門制作內(nèi)容,并需要針對不同的目標(biāo)圖片進行算法改動,不但費時、費力、成本高,其使用難度也是普通用戶短時間內(nèi)無法駕馭的,嚴重限制了增強現(xiàn)實技術(shù)的應(yīng)用。
而本次隨著”幻視“一同上線的云端內(nèi)容編輯平臺則具有:自主選擇目標(biāo)圖片、簡便制作增強現(xiàn)實內(nèi)容、快速預(yù)覽發(fā)布的強大功能。在發(fā)布會現(xiàn)場的體驗環(huán)節(jié)中,上傳一張圖片到云端編輯系統(tǒng),僅需要10s左右便可識別,隨后借助平臺提供的各類素材模塊,快速導(dǎo)入視頻、3D模型、音樂以及電話號碼,點擊發(fā)布。再使用”幻視“識別目標(biāo)圖片,便可以展現(xiàn)增強現(xiàn)實內(nèi)容,整個過程不超過5分鐘,即便是首次使用的用戶也可能快速編輯并發(fā)布內(nèi)容。
“任何一個好的科技產(chǎn)品如果不能服務(wù)大眾,只存在實驗室中或者只有少數(shù)人可以使用,那么它就不是一個好的產(chǎn)品。而我們的產(chǎn)品就如同office,簡單、易用、方便,未來它將成為一個可以改變我們生活的工具,更多的服務(wù)于大眾。增強現(xiàn)實也不再是多么神秘的技術(shù),技術(shù)普通人也能使用”幻視“,親身體驗甚至制作增強現(xiàn)實內(nèi)容。”易訊理想CEO史凌波先生舉了一個簡單的例子。
“互聯(lián)網(wǎng)+‘幻視’”創(chuàng)造無限可能
開放的云端編輯平臺給了更多商家、企業(yè)甚至個人用戶體驗增強現(xiàn)實技術(shù)的機會,也讓消費者擁有了更多可以獲取的內(nèi)容,其中形成的商業(yè)鏈條不但打通了O2O渠道,更迎合了時下“互聯(lián)網(wǎng)+”計劃的熱潮。發(fā)布會上,中國中小企業(yè)協(xié)會副會長李戰(zhàn)也表示了對”幻視“前景的展望:“隨著李克強總理‘互聯(lián)網(wǎng)+’計劃的提出,一方面?zhèn)鹘y(tǒng)行業(yè)急需像互聯(lián)網(wǎng)變革,而互聯(lián)網(wǎng)行業(yè)更需要實實在在的落地。
另一方面,更是對技術(shù)研發(fā)、自主知識產(chǎn)權(quán)乃至國家科研實力的挑戰(zhàn)。技術(shù)上無形的壁壘一直是我們無法打破的,而易訊理想科技自主研發(fā)的增項現(xiàn)實技術(shù)卻直接讓我國在視覺識別領(lǐng)域達到世界先進水平,以往別人做我們買,后來別人做我們學(xué),但是現(xiàn)在我們有底氣說‘自己做讓別人學(xué)’,中國制造的標(biāo)簽也不再代表著傳統(tǒng)的制造業(yè)、快消業(yè),在全球最尖端的科技領(lǐng)域,我們是領(lǐng)跑世界的‘中國制造’”。
在商業(yè)化領(lǐng)域,李會長也表示了對”幻視“的信心:“‘互聯(lián)網(wǎng)+’的‘+’也不僅僅是一個符號,更是代表著現(xiàn)代互聯(lián)網(wǎng)體系的升級與進化,而”幻視“正是見證這一系列變革的里程碑。中小企協(xié)作為中國最大的商業(yè)協(xié)會,統(tǒng)領(lǐng)超過30萬家企業(yè)資源,而這些企業(yè)將率先試水”幻視“,涵蓋婚紗攝影、餐飲娛樂、汽車銷售、銀行金融、電商、家居乃至教育等多個行業(yè),這個移動互聯(lián)網(wǎng)時代也更加跟真切的展現(xiàn)在我們眼前。”
好文章,需要你的鼓勵
騰訊ARC實驗室推出AudioStory系統(tǒng),首次實現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù),通過交錯式推理生成、解耦橋接機制和漸進式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時學(xué)習(xí)外觀和運動信息,顯著解決了當(dāng)前視頻生成模型中動作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個線性層就能大幅提升運動質(zhì)量,在多項測試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實驗室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評測基準(zhǔn),通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時顯著提升人性化交互水平,為AI價值觀對齊提供了可行技術(shù)路徑。
谷歌DeepMind團隊開發(fā)的GraphCast是一個革命性的AI天氣預(yù)測模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報,準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來了效率和精度的雙重突破。