上海,中國 – 2021年1月19日- 在國際權威的多目標跟蹤挑戰(zhàn)(Multiple Object Tracking Challenge,MOT)MOT20榜單上,紫光展銳多媒體算法的mota指標超過70分,拿下全球冠軍。這也是MOT20 Challenge榜單上唯一一家超過70分的企業(yè),彰顯了紫光展銳在多目標跟蹤領域的業(yè)界領先水平。
MOT Challenge是多目標跟蹤領域最權威的國際測評平臺,由慕尼黑工業(yè)大學、阿德萊德大學、蘇黎世聯(lián)邦理工學院以及達姆施塔特工業(yè)大學聯(lián)合創(chuàng)辦。MOT Challenge 提供了非常準確的標注數(shù)據(jù)和全面的評估指標,用以評估跟蹤算法、行人檢測器的性能。
其中,MOT 20 benchmark包含8份新的視頻序列、密集且極具挑戰(zhàn)性的場景。這份數(shù)據(jù)集在4th BMTT MOT Challenge Workshop,CVPR 2019上首次發(fā)布,平均每幀高達246個行人,相比之前的挑戰(zhàn)賽數(shù)據(jù)集增加了夜晚數(shù)據(jù)集,對現(xiàn)有SOTA的MOT算法在解決極端稠密場景、算法泛化性等方面提出了艱巨挑戰(zhàn)。
紫光展銳在多媒體算法中針對網(wǎng)絡結構設計、損失函數(shù)、訓練數(shù)據(jù)處理等方面進行了大量的創(chuàng)新和探索。針對競賽中訓練集沒有涉及到的場景,紫光展銳創(chuàng)新性的采用端到端同時檢測、行人識別策略,保障了算法在實際落地時的實時性,同時針對不同的端側(cè)算力靈活調(diào)整網(wǎng)絡大小,可靈活配套多種芯片方案的部署。
同時參與本次競賽的還包括牛津大學、卡耐基梅隆大學、清華大學、慕尼黑工業(yè)大學、中科院、微軟等多家企業(yè)、大學和科研機構的相關團隊。
多目標追蹤技術作為承載監(jiān)控、車載、無人機、賽事直播等應用的關鍵技術,可準確捕捉視頻中的關鍵信息,為進一步的信息提取提供支持,將在智慧城市、物聯(lián)網(wǎng)等領域得到越來越廣泛的應用。
在智能監(jiān)控場景中,算法可實現(xiàn)復雜場景下的目標自動提取、跟蹤、識別,理解目標的活動狀態(tài),進而實現(xiàn)場景狀態(tài)監(jiān)測、識別等。多目標追蹤技術的應用可大幅減少人工重復勞動、提高工作效率和監(jiān)控系統(tǒng)的智能性、安全性;在賽事直播場景中,算法可自動提取運動員的運動狀態(tài),從而實現(xiàn)數(shù)據(jù)統(tǒng)計、自動導播等功能,挖掘更多的數(shù)據(jù)價值;在智能車載場景中,算法可獲取道路中車輛、行人的運動信息,為自動駕駛、安全輔助等應用提供必要的決策數(shù)據(jù)支持。
圖像算法正在深度融合到越來越多的垂直行業(yè),形成乘法效應,衍生出創(chuàng)新的業(yè)務和應用,讓人們的生活更加美好和便捷。
MOT challenge榜單官網(wǎng):https://motchallenge.net/results/MOT20/?det=All
好文章,需要你的鼓勵
新加坡國立大學研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓練AI玩簡單撲克游戲就能讓其數(shù)學推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學題目作為訓練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學解題中,為AI訓練提供了新思路。
同濟大學團隊開發(fā)的GIGA-ToF技術通過融合多幀圖像的"圖結構"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術利用圖像間的不變幾何關系,結合深度學習和數(shù)學優(yōu)化方法,在合成數(shù)據(jù)集上實現(xiàn)37.9%的精度提升,并在真實設備上展現(xiàn)出色泛化能力,為機器人、AR和自動駕駛等領域提供更可靠的3D視覺解決方案。
伊利諾伊大學研究團隊通過對比實驗發(fā)現(xiàn),經(jīng)過強化學習訓練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實際提升推理準確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質(zhì)量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構聯(lián)合提出SparseLoRA技術,通過動態(tài)稀疏性實現(xiàn)大語言模型訓練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓練效率,已在多個任務上驗證有效性。