Facebook的未來來說,仍然是至關(guān)重要的。
Facebook最近收購了Scape Technologies,一家專注于構(gòu)建有助于AR(增強現(xiàn)實)的計算機視覺應(yīng)用公司。
Scape成立于2016年,將自己的技術(shù)稱為視覺定位服務(wù)(可通過SDK獲得)。Scape實際上是利用攝像頭提高GPS精度,這項技術(shù)對于Facebook VR頭戴設(shè)備甚至是機器人技術(shù)來說都是有幫助的。
Loomly首席執(zhí)行官兼聯(lián)合創(chuàng)始人Thibaud Clement表示:“雖然GPS可以鳥瞰某個區(qū)域,但Scape Technologies的VPS實際上更接近行人的視野。這個獨特的計算機視覺引擎,再加上Facebook的影響力,將有助于推動在AR和VR領(lǐng)域的發(fā)展。”
接下來,F(xiàn)acebook收購了Atlas ML開發(fā)商Deeptide。Deeptide成立于2018年7月,是一家科學論文和開源資源庫公司。
Clement表示:“與Facebook AI合作意味著該平臺將能夠更快地發(fā)展,支持更多語言并吸引更多用戶,同時讓Facebook可以隨時掌握該領(lǐng)域中發(fā)生的一切。這是網(wǎng)絡(luò)協(xié)同效應(yīng)一個很好的例子。”
Deeptide聯(lián)合創(chuàng)始人Robert Stojnic在Medium帖子中寫道:“Papers with Code仍然是中立的、開放的、免費的。這項服務(wù)的運行方式、社區(qū)與網(wǎng)站的互動方式,都將保持不變。”
Scape和Deeptide都位于英國。Sorenson Ventures負責人Vidya Raman說:“一段時間以來,英國一直是開創(chuàng)性AI研究的溫床。還記得DeepMind嗎,谷歌為DeepMind投入了多少錢?”
實際上早在2018年的時候,F(xiàn)acebook就收購了另一家英國公司Bloomsbury AI。這家初創(chuàng)公司構(gòu)建了用于問答應(yīng)用的NLP自然語言處理系統(tǒng)。
SAS首席解決方案架構(gòu)師Tom Sabo表示:“任何希望更好地將內(nèi)容與用戶利益掛鉤的企業(yè)組織,都將從投資領(lǐng)先的自然語言處理能力中受益。想想你是如何在互聯(lián)網(wǎng)上搜索某個度假勝地或者汽車品牌,你當時搜索過的商品,是如何顯示在接下來幾周瀏覽的頁面廣告中的。這并不復雜?;贏I的精準數(shù)字廣告策略,根據(jù)搜索、內(nèi)容、位置數(shù)據(jù)中識別出來的用戶興趣,為用戶提供了更有針對性的廣告體驗。”
>>>現(xiàn)在呢?
Facebook的一系列收購表明,人才之爭正在升級。
RexMundi創(chuàng)始人Vincent Peters表示:“Elon Musk正在招募機器學習人才加入Tesla。Facebook收購Scape Technologies和Deeptide都是為了機器學習人才的,為了讓機器可以從視覺上識別周圍環(huán)境,直接獲得那些經(jīng)常使用機器學習資源的AI和ML人才。很少有企業(yè)擁有充足的、有能力理解不同類型人工智能、知道如何有效運用機器學習的人才。”
所以并購看起來是個不錯的選擇。畢竟,F(xiàn)acebook在很多領(lǐng)域都可以增強自己的AI實力。
“Facebook曾在F8 2019大會主題演講中明確指出,他們前所未有的運營規(guī)模意味著必須解決前所未有的技術(shù)挑戰(zhàn),不僅要利用現(xiàn)有技術(shù),還要突破技術(shù)現(xiàn)有的能力范疇。因此,我們可以想象,隨著Facebook開始新的動作,全球面臨前所未有的社交挑戰(zhàn),未來Facebook還需要填補這些空杯:要考慮付款欺詐檢測、選舉期間的信息真實性、在網(wǎng)速較慢的地區(qū)交付內(nèi)容——所有這些都可以通過結(jié)合各種AI系統(tǒng)實現(xiàn)自動化和優(yōu)化。”
好文章,需要你的鼓勵
新加坡國立大學研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓練AI玩簡單撲克游戲就能讓其數(shù)學推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學題目作為訓練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學解題中,為AI訓練提供了新思路。
同濟大學團隊開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學習和數(shù)學優(yōu)化方法,在合成數(shù)據(jù)集上實現(xiàn)37.9%的精度提升,并在真實設(shè)備上展現(xiàn)出色泛化能力,為機器人、AR和自動駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學研究團隊通過對比實驗發(fā)現(xiàn),經(jīng)過強化學習訓練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實際提升推理準確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質(zhì)量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動態(tài)稀疏性實現(xiàn)大語言模型訓練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓練效率,已在多個任務(wù)上驗證有效性。