互聯(lián)網(wǎng)是一個奇妙的世界,沒人知道你的照片何時拍下、從哪里來。
通過神乎其技的P圖處理,圖片可以被重復(fù)利用,或重新組合,而不留痕跡——這對那些試圖為自己的分享增添趣味的人很有幫助,但對虛假信息的提供者也很有幫助。前陣子紅極一時的“上海名媛”事件就是一個例子。
來自圣迭戈的初創(chuàng)企業(yè)Truepic公司希望讓智能手機上的照片與視頻更加可信。Truepic與移動芯片制造商高通合作,為智能手機的相機添加一種全新模式,能夠根據(jù)拍攝的時間與地點,對圖像進行安全標記,確保他人能夠檢查圖像或視頻的真實性。以此為基礎(chǔ),社交媒體上種種聳人聽聞的消息及圖片或?qū)⒌玫接行Ф糁啤?/p>
這項新功能旨在支持一個名為「內(nèi)容真實性倡議(Content Authenticity Initiative,下文簡稱“CAI”)」的組織正在開發(fā)的數(shù)字圖像標準,該組織成員包括Twitter、Adobe以及《紐約時報》。該系統(tǒng)將允許圖像和視頻被標記上以加密方式編碼的信息,包括真實位置與捕捉方式。一切編輯操作都會留下痕跡,新聞機構(gòu)或其他組織則可借此跟蹤篡改活動,或者驗證來自其他組織的圖像是否真實可信。
但任何標準只有得到廣泛應(yīng)用,才可能發(fā)揮影響力。Adobe表示將在旗下旗艦圖像增強工具Photoshop中建立支持,《泰晤士報》則計劃測試攝影記者與編輯如何使用此項技術(shù)。Truepic和高通的首個展示項目,將介紹如何將該方案集中至硬件當中。Truepic公司副總裁Sherif Hanna表示,“我們認為實現(xiàn)這一目標的重要方法,在于將其轉(zhuǎn)化為人們移動設(shè)備上的原生功能。”
這項合作可能帶來廣泛的應(yīng)用潛力,因為高通公司的芯片一直在為包括三星在內(nèi)的各類大牌Android智能手機提供支持。高通公司副總裁Manvinder Singh表示,設(shè)備制造商完全可以將這項技術(shù)集成至公司芯片的未來設(shè)計中。Singh透露,“已經(jīng)有幾家企業(yè)對此表示興趣。”當然,考慮到蘋果公司一直采用定制化設(shè)計的芯片,因此若想在蘋果設(shè)備上支持類似功能,需要配合單獨的實施方案。
圖:Truepic技術(shù)將支持Adobe及其他廠商正在開發(fā)的系統(tǒng),借此以加密編碼信息的形式向圖像及視頻中添加拍攝地點、如何拍攝等標記。
Truepic開發(fā)的照片標記代碼,將在設(shè)備處理器的安全區(qū)域內(nèi)運行,預(yù)計將使用負責(zé)支付操作或指紋掃描等任務(wù)的專項處理器運行。當人們將相機切換為安全模式時,像素捕捉會繞過設(shè)備操作系統(tǒng),借此保證圖像內(nèi)容不受操縱。使用該設(shè)備的人仍可照常拍攝普通照片及視頻。Hanna表示,該系統(tǒng)的出現(xiàn),將使人們更加信息照片內(nèi)容來自“真實場景,而非由編輯工具或者AI生成”。
但實際應(yīng)用中的一大障礙,在于該應(yīng)用需要接入互聯(lián)網(wǎng),才能通過政府時間服務(wù)器將經(jīng)過驗證的時間戳添加至照片上。整個過程不會添加任何可用于定位當前設(shè)備或用戶身份的信息。此外,位置標記的精確度可能在幾米范圍,具體取決于拍攝設(shè)備的GPS信號質(zhì)量。該應(yīng)用創(chuàng)建的標簽,將對支持CAI方案的軟件直接可見,但具體標準的最終細節(jié)仍在開發(fā)當中。
里海大學(xué)助理教授Aparna Bharati一直從事圖像取證工作,她表示使用圖像來源對信息進行標準化標記的工具,將為在線媒體發(fā)布內(nèi)容的可信度構(gòu)建帶來有益的貢獻。但實際吸引力如何,恐怕仍有待觀察。
在她看來,希望保護自己工作及聲譽的媒體專家當然會歡迎這種工具,號稱自己親眼目睹或者經(jīng)歷了某些自然災(zāi)害的人們也會在照片加添加標簽,讓素材在新聞轉(zhuǎn)載中變得更為可信。
但Bharati強調(diào),任何基于真實性標準構(gòu)建的標記工具,都有可能遭受攻擊。未來,很可能有惡意攻擊者、特別是政府支持的惡意組織嘗試破壞這些控制方法。她認為,“我們必須嘗試從敵對方的視角考慮問題。”
根據(jù)CAI的說法,他們正在制定措施,以防止對圖像標記的濫用或操縱。Hanna則指出,將新功能與手機硬件集成起來,能夠有效防止標記遭到干擾。
另外,Truepic還希望通過多種方式提高這種照片安全模式的知名度。這家初創(chuàng)企業(yè)已經(jīng)與保險公司及電商平臺開展合作,通過這項功能,確保人們上傳真實有效的索賠素材或者退貨申請。
好文章,需要你的鼓勵
新加坡國立大學(xué)研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓(xùn)練AI玩簡單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟大學(xué)團隊開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實現(xiàn)37.9%的精度提升,并在真實設(shè)備上展現(xiàn)出色泛化能力,為機器人、AR和自動駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團隊通過對比實驗發(fā)現(xiàn),經(jīng)過強化學(xué)習(xí)訓(xùn)練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實際提升推理準確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質(zhì)量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動態(tài)稀疏性實現(xiàn)大語言模型訓(xùn)練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓(xùn)練效率,已在多個任務(wù)上驗證有效性。