易訊理想科技公司今天發(fā)布了國內第一款正式商業(yè)化應用的增強現實產品”幻視“,該公司CEO史凌波在發(fā)布會上表示:“增強現實不再是多么神秘的技術,技術普通人也能使用‘幻視’,親身體驗甚至制作增強現實內容。”
國內唯一掌握增強現實技術核心算法的團隊
眾所周知,增強現實技術的關鍵在于識別圖像的核心算法,而這正是易訊理想科技技術團隊所主攻的,團隊中絕大部分研究人員都相關領域的專家,并且擁有多年海外學習經歷,部分還曾經參與過Google Glass項目的研發(fā),積累了大量寶貴的科研經驗。團隊申請相關專利百余項,除了在視覺識別領域,還在精確圖像學習、增強現實、可深度學習的人工智能等多個相關領域也有著深入的研究。這些都為”幻視“產品的誕生打下了堅實的技術基礎。
會上易訊理想科技的技術團隊向大家分享了一組數據:幻視背后的核心算法,在實際情況下圖像識別率達到99.9%,云端內容數據庫支持10億級的目標圖像存儲,并且單機百萬級圖像識別率小于0.5s,多項技術指標居世界第一位。
自主內容編輯平臺,打造最易用的增強現實工具
強大的技術支持使得”幻視“擁有了其他同類產品不具備的功能,其中云端內容編輯平臺便是最大亮點。以往的增強現實產品大多需要專門制作內容,并需要針對不同的目標圖片進行算法改動,不但費時、費力、成本高,其使用難度也是普通用戶短時間內無法駕馭的,嚴重限制了增強現實技術的應用。
而本次隨著”幻視“一同上線的云端內容編輯平臺則具有:自主選擇目標圖片、簡便制作增強現實內容、快速預覽發(fā)布的強大功能。在發(fā)布會現場的體驗環(huán)節(jié)中,上傳一張圖片到云端編輯系統,僅需要10s左右便可識別,隨后借助平臺提供的各類素材模塊,快速導入視頻、3D模型、音樂以及電話號碼,點擊發(fā)布。再使用”幻視“識別目標圖片,便可以展現增強現實內容,整個過程不超過5分鐘,即便是首次使用的用戶也可能快速編輯并發(fā)布內容。
“任何一個好的科技產品如果不能服務大眾,只存在實驗室中或者只有少數人可以使用,那么它就不是一個好的產品。而我們的產品就如同office,簡單、易用、方便,未來它將成為一個可以改變我們生活的工具,更多的服務于大眾。增強現實也不再是多么神秘的技術,技術普通人也能使用”幻視“,親身體驗甚至制作增強現實內容。”易訊理想CEO史凌波先生舉了一個簡單的例子。
“互聯網+‘幻視’”創(chuàng)造無限可能
開放的云端編輯平臺給了更多商家、企業(yè)甚至個人用戶體驗增強現實技術的機會,也讓消費者擁有了更多可以獲取的內容,其中形成的商業(yè)鏈條不但打通了O2O渠道,更迎合了時下“互聯網+”計劃的熱潮。發(fā)布會上,中國中小企業(yè)協會副會長李戰(zhàn)也表示了對”幻視“前景的展望:“隨著李克強總理‘互聯網+’計劃的提出,一方面?zhèn)鹘y行業(yè)急需像互聯網變革,而互聯網行業(yè)更需要實實在在的落地。
另一方面,更是對技術研發(fā)、自主知識產權乃至國家科研實力的挑戰(zhàn)。技術上無形的壁壘一直是我們無法打破的,而易訊理想科技自主研發(fā)的增項現實技術卻直接讓我國在視覺識別領域達到世界先進水平,以往別人做我們買,后來別人做我們學,但是現在我們有底氣說‘自己做讓別人學’,中國制造的標簽也不再代表著傳統的制造業(yè)、快消業(yè),在全球最尖端的科技領域,我們是領跑世界的‘中國制造’”。
在商業(yè)化領域,李會長也表示了對”幻視“的信心:“‘互聯網+’的‘+’也不僅僅是一個符號,更是代表著現代互聯網體系的升級與進化,而”幻視“正是見證這一系列變革的里程碑。中小企協作為中國最大的商業(yè)協會,統領超過30萬家企業(yè)資源,而這些企業(yè)將率先試水”幻視“,涵蓋婚紗攝影、餐飲娛樂、汽車銷售、銀行金融、電商、家居乃至教育等多個行業(yè),這個移動互聯網時代也更加跟真切的展現在我們眼前。”
好文章,需要你的鼓勵
新加坡國立大學研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓練AI玩簡單撲克游戲就能讓其數學推理能力提升8.6%,通用推理提升8.4%,且無需任何數學題目作為訓練材料。研究發(fā)現游戲中的三種推理模式能成功轉移到數學解題中,為AI訓練提供了新思路。
同濟大學團隊開發(fā)的GIGA-ToF技術通過融合多幀圖像的"圖結構"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術利用圖像間的不變幾何關系,結合深度學習和數學優(yōu)化方法,在合成數據集上實現37.9%的精度提升,并在真實設備上展現出色泛化能力,為機器人、AR和自動駕駛等領域提供更可靠的3D視覺解決方案。
伊利諾伊大學研究團隊通過對比實驗發(fā)現,經過強化學習訓練的視覺語言模型雖然表現出"頓悟時刻"現象,但這些自我糾錯行為并不能實際提升推理準確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構聯合提出SparseLoRA技術,通過動態(tài)稀疏性實現大語言模型訓練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓練效率,已在多個任務上驗證有效性。