Ryff是一家位于洛杉磯的初創(chuàng)企業(yè),他們開發(fā)出一套系統(tǒng),可使用計算機視覺、人工智能與機器學習技術實現(xiàn)對電影、電視、體育及YouTube用戶生成內(nèi)容進行語義理解。
Ryff的這套全新Placer平臺能夠提取大量現(xiàn)成內(nèi)容,進而建立一種新的廣告資源。隨著干擾性商業(yè)廣告價值的持續(xù)下降,集成營銷(也被稱為片內(nèi)產(chǎn)品展示位營銷)的價值則有所提升。當然,這種方法仍成本高昂而且需要隨時跟上產(chǎn)品本身的變化——以因本輪新冠疫情流行而被迫延期的最新一部007電影為例,為了讓產(chǎn)品能夠與當下形勢相適應,制作團隊不得不投入巨資重拍大量鏡頭。
使用“同類整合”方法,RYff能夠分析數(shù)十萬小時的內(nèi)容。Placer平臺可以轉錄對話單元、創(chuàng)建場景元數(shù)據(jù)、檢測說了些什么、由誰在說以及當前畫面如何拍攝而來。以此為基礎,它會自動生成虛擬展位機會(VPO)并交付給內(nèi)容所有者及相關品牌,供他們核準其中最適合品牌宣傳需求的場景。最后,Ryff能夠?qū)⑷我馄放苹虍a(chǎn)品以數(shù)字方式大規(guī)模插入拍攝的內(nèi)容當中。通過Ryff的技術,廣告宣傳活動將始終與時俱進,保證內(nèi)容在文化與背景方面的良好相關性。
▲ Roy Taylor, Ryff公司創(chuàng)始人兼CEO
Ryff公司創(chuàng)始人兼CEO Roy Taylor于1998年在歐洲建立起英偉達,又于2016年在好萊塢成立了AMD Studios。憑借他在計算機視覺與娛樂業(yè)務的深刻理解,他于2018年創(chuàng)立了Ryff。此后,Ryff籌集到840萬美元資金,投資方包括來自芝加哥的Valor VC、已故Paul Allen管理的Vulcan Ventures、Mac[sic] Ventrues以及來自薩克拉門多的Moneta VC。
▲ 同一場景、同樣的駕駛員、不同的車輛
公司CTO Susan Hewitt于2018年8月正式加入。作為一位曾經(jīng)的半導體工程師,她曾先后效力于德州儀器、ATI、ARM以及AMD公司,并在這里遇到了Taylor。Hewitt告訴我們,在大型企業(yè)工作多年之后,這份創(chuàng)業(yè)崗位給她的生活帶來重大改變。
“對于一家初創(chuàng)企業(yè),最令人興奮的就是我們像一張白紙,當下的工作內(nèi)容也不受制于任何原有計劃。我們只是一路摸索前行,這實在讓人斗志滿滿。”Hewitt目前居住在英國劍橋地區(qū),這片人才聚集的土地很快吸引到了微軟、蘋果、Amazon等頂尖科技巨頭的關注。劍橋大學以及劍橋小鎮(zhèn)則逐步成長為獨特的新興技術孵化器。Hewitt解釋道,“這里很小,但卻像是一個焦點,有著比超大型城市更強烈的吸引力。這里充斥著各種學習與成長的機會。”
Moor Insights and Strategy公司高級分析師Anshel Sag認為,Ryff公司掌握著“在現(xiàn)有市場之間開辟新藍海的巨大機會空間。其方案將給流媒體世界帶來重大助力,內(nèi)容所有者可以隨時向庫內(nèi)無縫添加新內(nèi)容。這代表著一種重要的全新收入機會,媒體領域的不少從業(yè)企業(yè)也正好迫切需要這種技術。”
最新一部007電影《無暇赴死》原定于2020年上映,但由于新冠疫情的爆發(fā)而被迫推遲。Tech Radar此前報道稱,制造方正在重新拍攝一系列關鍵場景,“希望盡可能調(diào)整其中某些與時間相關的元素與內(nèi)容。”根據(jù)相關傳聞,包括諾基亞、歐米茄手表、阿迪達斯以及堡林爵香檳在內(nèi)的各贊助商,都不希望在影片中展示一年前的舊產(chǎn)品。而使用Ryff的技術,制作方可能節(jié)約下數(shù)百萬美元。
事實上,Ryff的方案足以將以往每一部007電影中的小物件都替換為較新的對象。如果愿意,諾基亞、歐米茄、阿迪達斯乃至堡林爵甚至可以將自己的最新產(chǎn)品出現(xiàn)在1962年的《諾博士》當中。
Taylor總結道,“傳統(tǒng)的影片內(nèi)嵌廣告涉及付款、擺位拍攝以及內(nèi)容發(fā)布等多個步驟,整個流程可能耗時數(shù)月甚至數(shù)年,既麻煩又效率低下。Ryff帶來的對象替換技術也許類似于Amazon之于圖書以及iTunes之于音樂,預示著廣告行業(yè)也將迎來新一波重大革命。”
好文章,需要你的鼓勵
新加坡國立大學研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓練AI玩簡單撲克游戲就能讓其數(shù)學推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學題目作為訓練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉移到數(shù)學解題中,為AI訓練提供了新思路。
同濟大學團隊開發(fā)的GIGA-ToF技術通過融合多幀圖像的"圖結構"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術利用圖像間的不變幾何關系,結合深度學習和數(shù)學優(yōu)化方法,在合成數(shù)據(jù)集上實現(xiàn)37.9%的精度提升,并在真實設備上展現(xiàn)出色泛化能力,為機器人、AR和自動駕駛等領域提供更可靠的3D視覺解決方案。
伊利諾伊大學研究團隊通過對比實驗發(fā)現(xiàn),經(jīng)過強化學習訓練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實際提升推理準確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質(zhì)量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構聯(lián)合提出SparseLoRA技術,通過動態(tài)稀疏性實現(xiàn)大語言模型訓練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓練效率,已在多個任務上驗證有效性。