科技行者 10月26日 北京消息(文/Miss周):下圖這一幕,在安防行業(yè)再常見(jiàn)不過(guò),每當(dāng)有重要案件或重要活動(dòng)時(shí),大量的公安干警就會(huì)守在屏幕面前,用肉眼搜索海量視頻,效率極其低下,精準(zhǔn)度依然不高。
現(xiàn)在,有一項(xiàng)技術(shù)正在解決這個(gè)問(wèn)題——步態(tài)識(shí)別技術(shù)。如果說(shuō)肉眼觀察步態(tài)區(qū)分人靠的是大腦,那么教機(jī)器觀察步態(tài)區(qū)分人靠的就是高科技了。而銀河水滴正是這樣一家教機(jī)器識(shí)別步態(tài)的公司,且一教就是近20年,可謂誨機(jī)不倦。
今天下午,銀河水滴在北京發(fā)布了多款擁有獨(dú)立自主知識(shí)產(chǎn)權(quán)的新產(chǎn)品:
· 銀河水滴步態(tài)檢索智能一體機(jī)“水滴神鑒”:通過(guò)步態(tài)識(shí)別技術(shù),在海量視頻中快速進(jìn)行目標(biāo)人物檢索和身份識(shí)別,是全球首款步態(tài)識(shí)別商用產(chǎn)品;
· 銀河水滴軌道交通綜合智能檢測(cè)車“水滴智檢”:可替代工人對(duì)地鐵軌道與隧道等完成智能化巡檢,是中國(guó)首臺(tái)小型化軌道交通綜合智能監(jiān)測(cè)車;
· 銀河水滴智能安檢儀。
· 銀河水滴工業(yè)視覺(jué)平臺(tái)“IndustryAI”的工業(yè)視覺(jué)檢測(cè)算法將面向工業(yè)用戶三年免費(fèi)開(kāi)放。
成立于2016年6月的銀河水滴,由中科院自動(dòng)化所孵化,是一家專注于計(jì)算機(jī)視覺(jué)與視頻大數(shù)據(jù)分析的人工智能企業(yè),它的殺手锏是“步態(tài)識(shí)別技術(shù)”和“工業(yè)視覺(jué)技術(shù)”。雖創(chuàng)辦不久,但這家公司稱,其創(chuàng)始團(tuán)隊(duì)在人工智能技術(shù)領(lǐng)域積累20多年,在步態(tài)識(shí)別領(lǐng)域積累17年。
扎實(shí)的技術(shù)功底,恰恰應(yīng)證了銀河水滴創(chuàng)始人兼CEO黃永禎今天在會(huì)上對(duì)于“銀河水滴”名稱的解讀:一是高科技,二是水滴石穿的精神。
關(guān)于“步態(tài)識(shí)別”技術(shù)的開(kāi)發(fā),就不得不提到銀河水滴一位成員——中國(guó)首個(gè)步態(tài)識(shí)別博士、模式識(shí)別國(guó)家重點(diǎn)實(shí)驗(yàn)室副主任、國(guó)家重大研發(fā)項(xiàng)目首席科學(xué)家,王亮。
2000年,剛從安徽大學(xué)碩士畢業(yè)的王亮,進(jìn)入了譚鐵牛院士的課題組攻讀博士學(xué)位。開(kāi)學(xué)后不久,譚院士就讓自己的學(xué)生選擇博士開(kāi)題的研究方向。就這樣,王亮十余年的“步態(tài)識(shí)別”研究之旅,就此啟程。
從此,譚鐵牛院士、王亮博士和他的團(tuán)隊(duì)獲得的,是五個(gè)震驚世界的“第一”:發(fā)表了第一篇刊登在國(guó)際模式識(shí)別期刊上的、有關(guān)步態(tài)識(shí)別研究的文章;創(chuàng)建了國(guó)際上第一個(gè)多視角步態(tài)識(shí)別數(shù)據(jù)庫(kù)(CASIA-A);出版了第一部步態(tài)識(shí)別專著;創(chuàng)立了第一間步態(tài)識(shí)別公司(銀河水滴)。
銀河水滴成立之初,獲得中科院旗下資本中科智能和聯(lián)想創(chuàng)投6000萬(wàn)元天使投資;9月20日,銀河水滴還連續(xù)第二次進(jìn)入了清科和投資界聯(lián)合發(fā)起的中國(guó)最具投資價(jià)值企業(yè)50強(qiáng)(Venture50)榜單;10月16日,銀河水滴完成1億元Pre-A輪融資,由恒邦資本與華和資本領(lǐng)投,南山創(chuàng)賽基金跟投。
銀河水滴的業(yè)務(wù)板塊主要分三塊:智慧安防(主要以步態(tài)識(shí)別帶來(lái)顛覆性變革);智慧交通(主抓軌道交通領(lǐng)域的智能駕駛系統(tǒng));智慧工業(yè)(獨(dú)特的小樣本深度學(xué)習(xí)技術(shù),為工業(yè)互聯(lián)網(wǎng)賦能)。
以步態(tài)識(shí)別技術(shù)舉例,這項(xiàng)默默無(wú)聞的技術(shù)與虹膜識(shí)別、人臉識(shí)別同為三大識(shí)別技術(shù)。實(shí)際上,我們生活中就有“步態(tài)識(shí)別”的影子:當(dāng)你在人群中尋找熟悉的人,往往并不一定要看清楚每個(gè)人的臉,而根據(jù)走路的姿勢(shì)、大概的輪廓,就可以辨別出來(lái)。
而銀河水滴的“步態(tài)識(shí)別”技術(shù),則是將識(shí)別判斷的主體變成了機(jī)器:通過(guò)對(duì)同一個(gè)人走路姿勢(shì)的數(shù)據(jù)收集,形成一個(gè)龐大的數(shù)據(jù)庫(kù),當(dāng)機(jī)器識(shí)別時(shí),只需要將現(xiàn)場(chǎng)的數(shù)據(jù)與數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行比對(duì),就能夠縮小范圍,從而最終確定一個(gè)人的身份。據(jù)銀河水滴資料顯示,其擁有全球最大的步態(tài)數(shù)據(jù)庫(kù),步態(tài)識(shí)別精度94%,可實(shí)現(xiàn)普通2K攝像機(jī)下最遠(yuǎn)50米的遠(yuǎn)距離,跨視角識(shí)別,且無(wú)需識(shí)別對(duì)象主動(dòng)配合。
我們?cè)賮?lái)看看今天的新品——銀河水滴步態(tài)檢索智能一體機(jī)“水滴神鑒”:
據(jù)官方資料顯示:
它是“集算法、軟件和硬件為一體的便攜式安防專用設(shè)備,以人的步態(tài)特征作為注冊(cè)對(duì)象、通過(guò)步態(tài)識(shí)別技術(shù)在海量視頻中快速進(jìn)行人物檢索和身份識(shí)別、快速實(shí)現(xiàn)目標(biāo)人物查找,可廣泛應(yīng)用于公安、國(guó)安、檢察院、法院、消防、武警、邊防、海關(guān)、軍隊(duì)、監(jiān)獄、機(jī)場(chǎng)、車站、港口等領(lǐng)域。”。“水滴神鑒”可替代人類從海量監(jiān)控視頻中快速查找目標(biāo)人物,這樣就能提升檢索和識(shí)別的效率和準(zhǔn)確度;當(dāng)出現(xiàn)遠(yuǎn)距離、非配合、全視角(如只有側(cè)面和背面身形)、弱光線、人臉隱蔽/遮擋、目標(biāo)人物多次換裝等一種或多種情況時(shí),用步態(tài)識(shí)別技術(shù)搜檢目標(biāo)人物,則成了最優(yōu)或唯一的選擇。“水滴神鑒”能支持多段視頻同時(shí)檢索,也可支持對(duì)一個(gè)視頻分段同時(shí)檢索,最快支持六倍速度檢索,1小時(shí)視頻最快可用10分鐘檢索完畢。目前該產(chǎn)品已在公安系統(tǒng)累計(jì)試用超過(guò)1000小時(shí),試驗(yàn)/參與了20多個(gè)案件的偵破,累計(jì)檢索了2000G公安視頻。”
黃永禎回憶道,“水滴神鑒”的誕生并不容易,研發(fā)人員參加了超過(guò)100場(chǎng)技術(shù)交流會(huì),與30多個(gè)公安刑偵客戶進(jìn)行了深度交流,收到近300條反饋建議,半年內(nèi)軟件版本迭代更新幾十次。也正是這種水滴石穿的精神,“水滴神鑒”獲得了多方買單:目前累計(jì)訂單1.35億元,且今天與來(lái)自12個(gè)省市的合作伙伴簽署了合作協(xié)議。
談及長(zhǎng)期規(guī)劃,黃永禎說(shuō),基于步態(tài)識(shí)別技術(shù),未來(lái)銀河水滴還將在智慧醫(yī)療、智能家居、機(jī)器人等領(lǐng)域布局,將充分釋放人工智能的技術(shù)優(yōu)勢(shì),不斷打磨更多優(yōu)秀的產(chǎn)品服務(wù)社會(huì)。
好文章,需要你的鼓勵(lì)
騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng),首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長(zhǎng)篇音頻故事。該系統(tǒng)結(jié)合大語(yǔ)言模型的敘事推理能力與音頻生成技術(shù),通過(guò)交錯(cuò)式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場(chǎng)景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開(kāi)辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過(guò)讓AI同時(shí)學(xué)習(xí)外觀和運(yùn)動(dòng)信息,顯著解決了當(dāng)前視頻生成模型中動(dòng)作不連貫、違反物理定律的核心問(wèn)題。該技術(shù)僅需添加兩個(gè)線性層就能大幅提升運(yùn)動(dòng)質(zhì)量,在多項(xiàng)測(cè)試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語(yǔ)言模型人性化對(duì)話問(wèn)題。該研究創(chuàng)建了包含20萬(wàn)高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評(píng)測(cè)基準(zhǔn),通過(guò)創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平,為AI價(jià)值觀對(duì)齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊(duì)開(kāi)發(fā)的GraphCast是一個(gè)革命性的AI天氣預(yù)測(cè)模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào),準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過(guò)學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測(cè)方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來(lái)了效率和精度的雙重突破。