科技行者 11月25日 北京消息:自工業(yè)化學(xué)家Leo Baekeland于1097年首次嘗試合成苯酚與甲醛以來,全世界就開始了對塑料這種新材料的愛恨糾葛。
話說,塑料性質(zhì)出眾、耐用且便宜,但在全部塑料制品中,高達50%(全世界每年約1.5億噸)的比例在使用一次后即被丟棄。雖然不少人一直致力于回收水瓶與塑料袋,但對于龐大的廢棄總量而言,只能算是杯水車薪。大風(fēng)和雨水將無數(shù)塑料廢物沿著市政街道與排水系統(tǒng)進入小溪、河流、海灣乃至海洋,而且目前我們?nèi)匀荒貌怀龊唵我仔械乃芰线^濾手段。
▲ 圖:加利福尼亞州海沃德
舊金山河口學(xué)院(SFEI)環(huán)境信息學(xué)系主任Tony Hale表示,“塑料制品丟棄問題已經(jīng)相當(dāng)嚴重,但現(xiàn)有雨水處理與清理設(shè)施仍然非常有限。”
因此,SFEI決定嘗試利用無人機尋求解決之道。
SFEI設(shè)想的解決方案是結(jié)合人力與機器,包括派人徒步計數(shù)并收集當(dāng)?shù)厮乐械睦?/span>,且利用配備攝像頭的無人機對垃圾排放情況進行大規(guī)模評估。
Hale解釋道,“大多數(shù)排水處理行業(yè)的地勤人員每年只進行一次垃圾監(jiān)測,幸運的話也就兩次而已。由于人力太過有限,我們自然很難了解垃圾總量及其給社區(qū)生活帶來的具體影響。”
利用無人機攝像技術(shù),“我們能夠跟蹤小溪、河流乃至大江中的垃圾存在量,分析垃圾的分布方式,而后根據(jù)需要利用機器學(xué)習(xí)算法進一步剖析圖像內(nèi)容。”
無人機研究是SFEI及其姊妹組織南加州沿海水研究項目組全新計劃中的一部分。新計劃將在海洋保護委員會的資助下驗證現(xiàn)有垃圾監(jiān)測方法,并開發(fā)出可供社區(qū)環(huán)衛(wèi)部門、市政項目、環(huán)保機構(gòu)以及生態(tài)學(xué)家使用的垃圾監(jiān)測新方案。此項計劃涵蓋多種實驗性舉措,例如禁止在城市的雨林區(qū)內(nèi)使用塑料袋等。
Hale指出,“我們的任務(wù)是幫助城市規(guī)劃者找到最理想的雨水過濾辦法,阻止垃圾及塑料等雜物進入受保護的濕地以及公共水道。”
深度學(xué)習(xí)支持環(huán)衛(wèi)清理
通過在舊金山灣以及附近支流區(qū)域內(nèi)派遣無人機,SFEI在初次實驗中立即收集到約35000張圖像。
Hale還提到,“以這么快的速度覆蓋巨大的土地面積,著實令人驚訝。”但他的興奮之情很快消失,因為在合理的時間內(nèi)處理如此巨量的數(shù)據(jù),同樣難度極大。“我們用了將近一個月時間來處理這些圖像。”
為此,Hale和他的團隊利用2000條注釋描述各種垃圾類別,并借此訓(xùn)練一種開源TensorFlow機器學(xué)習(xí)算法,用于在這35000張圖像當(dāng)中識別具體垃圾類別、數(shù)量與位置。
為了進一步加快分析速度,SFEI還與數(shù)據(jù)分析初創(chuàng)企業(yè)Kinetica開展合作。Kinetica公司CMO Daniel Raskin表示:他們首先將SFEI的垃圾檢測模型旋轉(zhuǎn)在Docker容器當(dāng)中;而后對接Kinetica的“主動分析”工作臺;利用Python API,Kinetica即可將圖像流傳輸至表內(nèi),并以此為基礎(chǔ)對圖像進行存儲、分類與標(biāo)記。
Raskin指出,“除了圖像的提取與分發(fā)之外,我們還運行SFEI的垃圾檢測模型,對數(shù)據(jù)庫內(nèi)的全部圖像進行分類。”
如此一來,SFEI構(gòu)建起一套龐大的圖像目錄。加利福尼亞水質(zhì)監(jiān)管機構(gòu)如今可以根據(jù)地理位置與垃圾丟棄情況,直接使用這35000張圖像帶來的可視化分析結(jié)果。
最初,Kinetica利用一臺四核計算機通過分布式CPU框架運行托管Kubernetes,用以支撐SFEI的部署模型。Kinetica公司SFEI項目解決方案工程師Nick Alonso指出,“我們用了約十天時間運行整個模擬流程。”雖然他們后來將該應(yīng)用遷移至單GPU服務(wù)器(GPU能夠高效處理機器學(xué)習(xí)類工作負載),但模擬過程仍然耗費了近一周時間。
為此,Kinetica決定加快效率,將SFEI工作負載交由Oracle Cloud Infrastructure提供的八個V100 GPU實例之上。Alonso回憶道,“整個模擬過程的速度得到迅猛提升,以往需要近一周的工作,現(xiàn)在能夠在18小時26分內(nèi)順利完成。”
好文章,需要你的鼓勵
新加坡國立大學(xué)研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓(xùn)練AI玩簡單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟大學(xué)團隊開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實現(xiàn)37.9%的精度提升,并在真實設(shè)備上展現(xiàn)出色泛化能力,為機器人、AR和自動駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團隊通過對比實驗發(fā)現(xiàn),經(jīng)過強化學(xué)習(xí)訓(xùn)練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質(zhì)量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動態(tài)稀疏性實現(xiàn)大語言模型訓(xùn)練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓(xùn)練效率,已在多個任務(wù)上驗證有效性。