科技行者 10月26日 北京消息(文/Miss周):下圖這一幕,在安防行業(yè)再常見不過,每當有重要案件或重要活動時,大量的公安干警就會守在屏幕面前,用肉眼搜索海量視頻,效率極其低下,精準度依然不高。
現(xiàn)在,有一項技術(shù)正在解決這個問題——步態(tài)識別技術(shù)。如果說肉眼觀察步態(tài)區(qū)分人靠的是大腦,那么教機器觀察步態(tài)區(qū)分人靠的就是高科技了。而銀河水滴正是這樣一家教機器識別步態(tài)的公司,且一教就是近20年,可謂誨機不倦。
今天下午,銀河水滴在北京發(fā)布了多款擁有獨立自主知識產(chǎn)權(quán)的新產(chǎn)品:
· 銀河水滴步態(tài)檢索智能一體機“水滴神鑒”:通過步態(tài)識別技術(shù),在海量視頻中快速進行目標人物檢索和身份識別,是全球首款步態(tài)識別商用產(chǎn)品;
· 銀河水滴軌道交通綜合智能檢測車“水滴智檢”:可替代工人對地鐵軌道與隧道等完成智能化巡檢,是中國首臺小型化軌道交通綜合智能監(jiān)測車;
· 銀河水滴智能安檢儀。
· 銀河水滴工業(yè)視覺平臺“IndustryAI”的工業(yè)視覺檢測算法將面向工業(yè)用戶三年免費開放。
成立于2016年6月的銀河水滴,由中科院自動化所孵化,是一家專注于計算機視覺與視頻大數(shù)據(jù)分析的人工智能企業(yè),它的殺手锏是“步態(tài)識別技術(shù)”和“工業(yè)視覺技術(shù)”。雖創(chuàng)辦不久,但這家公司稱,其創(chuàng)始團隊在人工智能技術(shù)領(lǐng)域積累20多年,在步態(tài)識別領(lǐng)域積累17年。
扎實的技術(shù)功底,恰恰應證了銀河水滴創(chuàng)始人兼CEO黃永禎今天在會上對于“銀河水滴”名稱的解讀:一是高科技,二是水滴石穿的精神。
關(guān)于“步態(tài)識別”技術(shù)的開發(fā),就不得不提到銀河水滴一位成員——中國首個步態(tài)識別博士、模式識別國家重點實驗室副主任、國家重大研發(fā)項目首席科學家,王亮。
2000年,剛從安徽大學碩士畢業(yè)的王亮,進入了譚鐵牛院士的課題組攻讀博士學位。開學后不久,譚院士就讓自己的學生選擇博士開題的研究方向。就這樣,王亮十余年的“步態(tài)識別”研究之旅,就此啟程。
從此,譚鐵牛院士、王亮博士和他的團隊獲得的,是五個震驚世界的“第一”:發(fā)表了第一篇刊登在國際模式識別期刊上的、有關(guān)步態(tài)識別研究的文章;創(chuàng)建了國際上第一個多視角步態(tài)識別數(shù)據(jù)庫(CASIA-A);出版了第一部步態(tài)識別專著;創(chuàng)立了第一間步態(tài)識別公司(銀河水滴)。
銀河水滴成立之初,獲得中科院旗下資本中科智能和聯(lián)想創(chuàng)投6000萬元天使投資;9月20日,銀河水滴還連續(xù)第二次進入了清科和投資界聯(lián)合發(fā)起的中國最具投資價值企業(yè)50強(Venture50)榜單;10月16日,銀河水滴完成1億元Pre-A輪融資,由恒邦資本與華和資本領(lǐng)投,南山創(chuàng)賽基金跟投。
銀河水滴的業(yè)務板塊主要分三塊:智慧安防(主要以步態(tài)識別帶來顛覆性變革);智慧交通(主抓軌道交通領(lǐng)域的智能駕駛系統(tǒng));智慧工業(yè)(獨特的小樣本深度學習技術(shù),為工業(yè)互聯(lián)網(wǎng)賦能)。
以步態(tài)識別技術(shù)舉例,這項默默無聞的技術(shù)與虹膜識別、人臉識別同為三大識別技術(shù)。實際上,我們生活中就有“步態(tài)識別”的影子:當你在人群中尋找熟悉的人,往往并不一定要看清楚每個人的臉,而根據(jù)走路的姿勢、大概的輪廓,就可以辨別出來。
而銀河水滴的“步態(tài)識別”技術(shù),則是將識別判斷的主體變成了機器:通過對同一個人走路姿勢的數(shù)據(jù)收集,形成一個龐大的數(shù)據(jù)庫,當機器識別時,只需要將現(xiàn)場的數(shù)據(jù)與數(shù)據(jù)庫中的數(shù)據(jù)進行比對,就能夠縮小范圍,從而最終確定一個人的身份。據(jù)銀河水滴資料顯示,其擁有全球最大的步態(tài)數(shù)據(jù)庫,步態(tài)識別精度94%,可實現(xiàn)普通2K攝像機下最遠50米的遠距離,跨視角識別,且無需識別對象主動配合。
我們再來看看今天的新品——銀河水滴步態(tài)檢索智能一體機“水滴神鑒”:
據(jù)官方資料顯示:
它是“集算法、軟件和硬件為一體的便攜式安防專用設(shè)備,以人的步態(tài)特征作為注冊對象、通過步態(tài)識別技術(shù)在海量視頻中快速進行人物檢索和身份識別、快速實現(xiàn)目標人物查找,可廣泛應用于公安、國安、檢察院、法院、消防、武警、邊防、海關(guān)、軍隊、監(jiān)獄、機場、車站、港口等領(lǐng)域。”。“水滴神鑒”可替代人類從海量監(jiān)控視頻中快速查找目標人物,這樣就能提升檢索和識別的效率和準確度;當出現(xiàn)遠距離、非配合、全視角(如只有側(cè)面和背面身形)、弱光線、人臉隱蔽/遮擋、目標人物多次換裝等一種或多種情況時,用步態(tài)識別技術(shù)搜檢目標人物,則成了最優(yōu)或唯一的選擇。“水滴神鑒”能支持多段視頻同時檢索,也可支持對一個視頻分段同時檢索,最快支持六倍速度檢索,1小時視頻最快可用10分鐘檢索完畢。目前該產(chǎn)品已在公安系統(tǒng)累計試用超過1000小時,試驗/參與了20多個案件的偵破,累計檢索了2000G公安視頻。”
黃永禎回憶道,“水滴神鑒”的誕生并不容易,研發(fā)人員參加了超過100場技術(shù)交流會,與30多個公安刑偵客戶進行了深度交流,收到近300條反饋建議,半年內(nèi)軟件版本迭代更新幾十次。也正是這種水滴石穿的精神,“水滴神鑒”獲得了多方買單:目前累計訂單1.35億元,且今天與來自12個省市的合作伙伴簽署了合作協(xié)議。
談及長期規(guī)劃,黃永禎說,基于步態(tài)識別技術(shù),未來銀河水滴還將在智慧醫(yī)療、智能家居、機器人等領(lǐng)域布局,將充分釋放人工智能的技術(shù)優(yōu)勢,不斷打磨更多優(yōu)秀的產(chǎn)品服務社會。
好文章,需要你的鼓勵
新加坡國立大學研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓練AI玩簡單撲克游戲就能讓其數(shù)學推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學題目作為訓練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學解題中,為AI訓練提供了新思路。
同濟大學團隊開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學習和數(shù)學優(yōu)化方法,在合成數(shù)據(jù)集上實現(xiàn)37.9%的精度提升,并在真實設(shè)備上展現(xiàn)出色泛化能力,為機器人、AR和自動駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學研究團隊通過對比實驗發(fā)現(xiàn),經(jīng)過強化學習訓練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實際提升推理準確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質(zhì)量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動態(tài)稀疏性實現(xiàn)大語言模型訓練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓練效率,已在多個任務上驗證有效性。