科技行者 12月30日 北京消息:智能元素正在向邊緣位置推進(jìn)。
隨著數(shù)據(jù)采集速度的提升,更靠近邊緣位置的計(jì)算遷移方案,能夠在降低延遲以及減少基礎(chǔ)設(shè)施成本的前提下,更加高效地利用數(shù)據(jù)資源。另一方面,計(jì)算機(jī)視覺(jué)則是人工智能中的一大分支,旨在通過(guò)訓(xùn)練機(jī)器幫助其解釋及理解視覺(jué)內(nèi)容。
計(jì)算機(jī)視覺(jué)的目標(biāo)之一,在于利用機(jī)器通過(guò)與人類相同的方式查看并處理圖像。在通過(guò)機(jī)器學(xué)習(xí)實(shí)現(xiàn)的計(jì)算機(jī)視覺(jué)當(dāng)中,有一類采用所謂監(jiān)督學(xué)習(xí)方法,其中采用規(guī)??捎^且附帶注釋的圖像集來(lái)構(gòu)建計(jì)算模型。盡管模型訓(xùn)練往往相當(dāng)耗時(shí)并占用大量資源,不過(guò)一旦訓(xùn)練完成,該模型即可快速高效地執(zhí)行各類識(shí)別任務(wù)。
圖像與視頻分析的具體示例包括:
識(shí)別、分類、計(jì)數(shù)以及評(píng)估對(duì)象姿態(tài);壓縮并編碼視覺(jué)信息,以進(jìn)行傳輸或匹配;估算攝像機(jī)視角;前景與背景二維分割;估算深度并執(zhí)行3D分割;以及還原圖像中的遮擋區(qū)域或者推斷視覺(jué)數(shù)據(jù)等等。
隨著邊緣AI技術(shù)的最新發(fā)展,與以往將數(shù)據(jù)流傳輸至云端的做法相反,如今我們得以立足本地?cái)z像機(jī)完成數(shù)據(jù)的處理與分析。而這種新興且無(wú)比強(qiáng)大的處理能力,也讓計(jì)算機(jī)視覺(jué)在木板架行業(yè)擁有了施展拳腳的可能。
目前存在三種計(jì)算機(jī)視覺(jué)架構(gòu)類型:
將視頻或圖像發(fā)送至云端進(jìn)行計(jì)算;
在邊緣位置進(jìn)行部分計(jì)算,僅將少量模式信息傳輸至云端進(jìn)行搜索、排序及計(jì)算;
邊緣AI,在邊緣位置計(jì)算所有圖像數(shù)據(jù)。最后一種方法難度較高,需要訓(xùn)練出能夠安裝在邊緣設(shè)備上,且能夠經(jīng)常更新的模型。這些架構(gòu)各有自己的優(yōu)勢(shì)與缺點(diǎn),但隨著計(jì)算機(jī)視覺(jué)研究機(jī)構(gòu)的不斷發(fā)展,相信未來(lái)可能出現(xiàn)一種同時(shí)適合各類場(chǎng)景的應(yīng)用模型。
木制板架是世界各地貨物運(yùn)輸,乃至供應(yīng)鏈物流行業(yè)中不可或缺的組成部分。歐洲木制板架與包裝制造商聯(lián)合會(huì)(FEFPEB)報(bào)告稱,歐盟目前正在流通的木制板架超過(guò)30億個(gè),而美國(guó)每天使用的板架就超過(guò)20億個(gè),其中大部分由資源儲(chǔ)備巨頭掌握。客戶從共享資源池中租用板架,從而降低了供應(yīng)鏈產(chǎn)品管理廠商在采購(gòu)、管理以及回收等環(huán)節(jié)中的復(fù)雜性。
當(dāng)然,這些巨頭企業(yè)希望監(jiān)控整個(gè)供應(yīng)鏈,了解板架在其中的流動(dòng)趨勢(shì),及時(shí)發(fā)現(xiàn)丟失及回收點(diǎn),準(zhǔn)確核算出板架的損壞問(wèn)題與使用周期。為了實(shí)現(xiàn)全面監(jiān)控,各個(gè)板架之上都可以貼上唯一的標(biāo)記或者跟蹤設(shè)備。如果板架具有唯一ID(例如條形碼或者二維碼),那么當(dāng)該板架流經(jīng)供應(yīng)鏈時(shí),廠商就可以利用計(jì)算機(jī)視覺(jué)技術(shù)跟蹤板架的動(dòng)向。如果在上面安裝跟蹤設(shè)備,那么在板架流經(jīng)服務(wù)中心的分類流水線時(shí),系統(tǒng)還可通過(guò)計(jì)算機(jī)視覺(jué)檢測(cè)該板架是否需要更換或者維護(hù)。
木制板架所選用的木材多種多樣,包括山毛櫸、白蠟?zāi)尽讞?、松木以及云杉等等?/span>板架的木材選擇決定了紋理輪廓與質(zhì)地特征,我們不僅能夠借此評(píng)估單個(gè)板架的堅(jiān)固程度與耐用性,同時(shí)也可為板架提供唯一的可跟蹤標(biāo)記。此外,用于固定板材的釘子也會(huì)形成一種拓?fù)浣Y(jié)構(gòu),反映出關(guān)于板材使用壽命的信息——例如在板架在供應(yīng)鏈中使用多長(zhǎng)時(shí)間之后,才有必要進(jìn)行一次檢查維修。
利用經(jīng)過(guò)訓(xùn)練的計(jì)算機(jī)視覺(jué)模型,我們可以在板架制作完成時(shí)即對(duì)其獨(dú)特的紋理模式進(jìn)行識(shí)別,并以此為基礎(chǔ)對(duì)其進(jìn)行貫穿整個(gè)生命周期的標(biāo)記與管理。當(dāng)板架在供應(yīng)鏈流程中受到損壞并得以修復(fù)時(shí),我們也可以進(jìn)一步記錄這些環(huán)節(jié)對(duì)板材紋理及結(jié)構(gòu)產(chǎn)生的影響。計(jì)算機(jī)視覺(jué)不僅能夠以此為基礎(chǔ)跟蹤板架,還可以判斷板架的強(qiáng)度與耐用性。利用這種低成本解決方案,板架廠商將能夠采取措施,對(duì)制造完成或者經(jīng)過(guò)一段時(shí)間使用的板架進(jìn)行篩查。此外,板架廠商還可以收集客戶以及垂直行業(yè)提供的損壞數(shù)量與損壞類型等相關(guān)問(wèn)題的洞察見(jiàn)解,借此增加業(yè)務(wù)模型并改進(jìn)設(shè)計(jì),從而顯著提升自身服務(wù)的可靠性。
目前,有95%的受訪組織機(jī)構(gòu)報(bào)告稱,未來(lái)木制板架將繼續(xù)在供應(yīng)鏈?zhǔn)袌?chǎng)中占據(jù)主導(dǎo)地位。木材是目前唯一一種百分之百可再生、可回收、可重復(fù)利用且可安全承載多種貨品的盛裝材料。
另外,計(jì)算機(jī)視覺(jué)還能夠在維持倉(cāng)庫(kù)內(nèi)板架確切庫(kù)存量方面發(fā)揮關(guān)鍵性作用。利用包含眾多板架的單一圖像,經(jīng)過(guò)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)能夠以遠(yuǎn)超專業(yè)員工的速度與精度提供可靠的板架計(jì)數(shù)結(jié)果。
除了供應(yīng)鏈關(guān)鍵績(jī)效指標(biāo)(KPI)之外,計(jì)算機(jī)視覺(jué)還可應(yīng)用于板架存放、檢查以及維修等層面,幫助服務(wù)中心內(nèi)的工人提高安全性與工作效率。包括敲釘固定在內(nèi)的各類重復(fù)性任務(wù),都可被輸入至神經(jīng)模型當(dāng)中,借此從實(shí)時(shí)視頻當(dāng)中判斷工人的準(zhǔn)確性、疲勞度以及更多其他狀態(tài)性特征。此外,這項(xiàng)技術(shù)也可經(jīng)由實(shí)時(shí)視頻判斷工作人員是否進(jìn)入了未經(jīng)授權(quán)的區(qū)域、存在危險(xiǎn)行為或者是否穿著適當(dāng)?shù)膫€(gè)人防護(hù)裝備。這僅大大降低發(fā)生工作事故的風(fēng)險(xiǎn),幫助相關(guān)企業(yè)維持生產(chǎn)流程的可靠運(yùn)轉(zhuǎn)。
好文章,需要你的鼓勵(lì)
新加坡國(guó)立大學(xué)研究團(tuán)隊(duì)開(kāi)發(fā)了SPIRAL框架,通過(guò)讓AI與自己對(duì)弈零和游戲來(lái)提升推理能力。實(shí)驗(yàn)顯示,僅訓(xùn)練AI玩簡(jiǎn)單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無(wú)需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟(jì)大學(xué)團(tuán)隊(duì)開(kāi)發(fā)的GIGA-ToF技術(shù)通過(guò)融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機(jī)噪聲問(wèn)題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實(shí)現(xiàn)37.9%的精度提升,并在真實(shí)設(shè)備上展現(xiàn)出色泛化能力,為機(jī)器人、AR和自動(dòng)駕駛等領(lǐng)域提供更可靠的3D視覺(jué)解決方案。
伊利諾伊大學(xué)研究團(tuán)隊(duì)通過(guò)對(duì)比實(shí)驗(yàn)發(fā)現(xiàn),經(jīng)過(guò)強(qiáng)化學(xué)習(xí)訓(xùn)練的視覺(jué)語(yǔ)言模型雖然表現(xiàn)出"頓悟時(shí)刻"現(xiàn)象,但這些自我糾錯(cuò)行為并不能實(shí)際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗(yàn)證差距",即生成答案的能力強(qiáng)于驗(yàn)證答案質(zhì)量的能力,且模型在自我驗(yàn)證時(shí)無(wú)法有效利用視覺(jué)信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機(jī)構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過(guò)動(dòng)態(tài)稀疏性實(shí)現(xiàn)大語(yǔ)言模型訓(xùn)練加速1.6倍,計(jì)算成本降低2.2倍。該方法使用SVD稀疏性估計(jì)器智能選擇重要計(jì)算部分,在保持模型性能的同時(shí)顯著提升訓(xùn)練效率,已在多個(gè)任務(wù)上驗(yàn)證有效性。