科技行者 11月25日 北京消息:自工業(yè)化學(xué)家Leo Baekeland于1097年首次嘗試合成苯酚與甲醛以來(lái),全世界就開(kāi)始了對(duì)塑料這種新材料的愛(ài)恨糾葛。
話說(shuō),塑料性質(zhì)出眾、耐用且便宜,但在全部塑料制品中,高達(dá)50%(全世界每年約1.5億噸)的比例在使用一次后即被丟棄。雖然不少人一直致力于回收水瓶與塑料袋,但對(duì)于龐大的廢棄總量而言,只能算是杯水車薪。大風(fēng)和雨水將無(wú)數(shù)塑料廢物沿著市政街道與排水系統(tǒng)進(jìn)入小溪、河流、海灣乃至海洋,而且目前我們?nèi)匀荒貌怀龊?jiǎn)單易行的塑料過(guò)濾手段。
▲ 圖:加利福尼亞州海沃德
舊金山河口學(xué)院(SFEI)環(huán)境信息學(xué)系主任Tony Hale表示,“塑料制品丟棄問(wèn)題已經(jīng)相當(dāng)嚴(yán)重,但現(xiàn)有雨水處理與清理設(shè)施仍然非常有限。”
因此,SFEI決定嘗試?yán)脽o(wú)人機(jī)尋求解決之道。
SFEI設(shè)想的解決方案是結(jié)合人力與機(jī)器,包括派人徒步計(jì)數(shù)并收集當(dāng)?shù)厮乐械睦?/span>,且利用配備攝像頭的無(wú)人機(jī)對(duì)垃圾排放情況進(jìn)行大規(guī)模評(píng)估。
Hale解釋道,“大多數(shù)排水處理行業(yè)的地勤人員每年只進(jìn)行一次垃圾監(jiān)測(cè),幸運(yùn)的話也就兩次而已。由于人力太過(guò)有限,我們自然很難了解垃圾總量及其給社區(qū)生活帶來(lái)的具體影響。”
利用無(wú)人機(jī)攝像技術(shù),“我們能夠跟蹤小溪、河流乃至大江中的垃圾存在量,分析垃圾的分布方式,而后根據(jù)需要利用機(jī)器學(xué)習(xí)算法進(jìn)一步剖析圖像內(nèi)容。”
無(wú)人機(jī)研究是SFEI及其姊妹組織南加州沿海水研究項(xiàng)目組全新計(jì)劃中的一部分。新計(jì)劃將在海洋保護(hù)委員會(huì)的資助下驗(yàn)證現(xiàn)有垃圾監(jiān)測(cè)方法,并開(kāi)發(fā)出可供社區(qū)環(huán)衛(wèi)部門(mén)、市政項(xiàng)目、環(huán)保機(jī)構(gòu)以及生態(tài)學(xué)家使用的垃圾監(jiān)測(cè)新方案。此項(xiàng)計(jì)劃涵蓋多種實(shí)驗(yàn)性舉措,例如禁止在城市的雨林區(qū)內(nèi)使用塑料袋等。
Hale指出,“我們的任務(wù)是幫助城市規(guī)劃者找到最理想的雨水過(guò)濾辦法,阻止垃圾及塑料等雜物進(jìn)入受保護(hù)的濕地以及公共水道。”
深度學(xué)習(xí)支持環(huán)衛(wèi)清理
通過(guò)在舊金山灣以及附近支流區(qū)域內(nèi)派遣無(wú)人機(jī),SFEI在初次實(shí)驗(yàn)中立即收集到約35000張圖像。
Hale還提到,“以這么快的速度覆蓋巨大的土地面積,著實(shí)令人驚訝。”但他的興奮之情很快消失,因?yàn)樵诤侠淼臅r(shí)間內(nèi)處理如此巨量的數(shù)據(jù),同樣難度極大。“我們用了將近一個(gè)月時(shí)間來(lái)處理這些圖像。”
為此,Hale和他的團(tuán)隊(duì)利用2000條注釋描述各種垃圾類別,并借此訓(xùn)練一種開(kāi)源TensorFlow機(jī)器學(xué)習(xí)算法,用于在這35000張圖像當(dāng)中識(shí)別具體垃圾類別、數(shù)量與位置。
為了進(jìn)一步加快分析速度,SFEI還與數(shù)據(jù)分析初創(chuàng)企業(yè)Kinetica開(kāi)展合作。Kinetica公司CMO Daniel Raskin表示:他們首先將SFEI的垃圾檢測(cè)模型旋轉(zhuǎn)在Docker容器當(dāng)中;而后對(duì)接Kinetica的“主動(dòng)分析”工作臺(tái);利用Python API,Kinetica即可將圖像流傳輸至表內(nèi),并以此為基礎(chǔ)對(duì)圖像進(jìn)行存儲(chǔ)、分類與標(biāo)記。
Raskin指出,“除了圖像的提取與分發(fā)之外,我們還運(yùn)行SFEI的垃圾檢測(cè)模型,對(duì)數(shù)據(jù)庫(kù)內(nèi)的全部圖像進(jìn)行分類。”
如此一來(lái),SFEI構(gòu)建起一套龐大的圖像目錄。加利福尼亞水質(zhì)監(jiān)管機(jī)構(gòu)如今可以根據(jù)地理位置與垃圾丟棄情況,直接使用這35000張圖像帶來(lái)的可視化分析結(jié)果。
最初,Kinetica利用一臺(tái)四核計(jì)算機(jī)通過(guò)分布式CPU框架運(yùn)行托管Kubernetes,用以支撐SFEI的部署模型。Kinetica公司SFEI項(xiàng)目解決方案工程師Nick Alonso指出,“我們用了約十天時(shí)間運(yùn)行整個(gè)模擬流程。”雖然他們后來(lái)將該應(yīng)用遷移至單GPU服務(wù)器(GPU能夠高效處理機(jī)器學(xué)習(xí)類工作負(fù)載),但模擬過(guò)程仍然耗費(fèi)了近一周時(shí)間。
為此,Kinetica決定加快效率,將SFEI工作負(fù)載交由Oracle Cloud Infrastructure提供的八個(gè)V100 GPU實(shí)例之上。Alonso回憶道,“整個(gè)模擬過(guò)程的速度得到迅猛提升,以往需要近一周的工作,現(xiàn)在能夠在18小時(shí)26分內(nèi)順利完成。”
好文章,需要你的鼓勵(lì)
騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng),首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長(zhǎng)篇音頻故事。該系統(tǒng)結(jié)合大語(yǔ)言模型的敘事推理能力與音頻生成技術(shù),通過(guò)交錯(cuò)式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場(chǎng)景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開(kāi)辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過(guò)讓AI同時(shí)學(xué)習(xí)外觀和運(yùn)動(dòng)信息,顯著解決了當(dāng)前視頻生成模型中動(dòng)作不連貫、違反物理定律的核心問(wèn)題。該技術(shù)僅需添加兩個(gè)線性層就能大幅提升運(yùn)動(dòng)質(zhì)量,在多項(xiàng)測(cè)試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語(yǔ)言模型人性化對(duì)話問(wèn)題。該研究創(chuàng)建了包含20萬(wàn)高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評(píng)測(cè)基準(zhǔn),通過(guò)創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平,為AI價(jià)值觀對(duì)齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊(duì)開(kāi)發(fā)的GraphCast是一個(gè)革命性的AI天氣預(yù)測(cè)模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào),準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過(guò)學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測(cè)方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來(lái)了效率和精度的雙重突破。