近日,專注于計算機視覺和視頻大數(shù)據(jù)分析的人工智能企業(yè)——銀河水滴宣布,公司成功研發(fā)了全球首款步態(tài)邊緣計算機芯,該產(chǎn)品可以廣泛應用于智能家居、智慧醫(yī)療及智能安防等諸多領域。
目前,銀河水滴正與智能家居廠商及醫(yī)療康復機構合作推進該產(chǎn)品的快速落地。
隨著移動互聯(lián)網(wǎng)的普及,人工智能技術的縱深發(fā)展,5G通信和物聯(lián)網(wǎng)技術的逐漸落地,邊緣計算技術受到越來越多技術廠商的重視。
在這種技術浪潮背景下,基于ARM技術架構,歷時近一年時間的研發(fā),銀河水滴研發(fā)的全球首款步態(tài)邊緣計算機芯于近期問世,該機芯是獨創(chuàng)的支持深度學習算法的嵌入式高性能ARM平臺,將硬件、算法、軟件高度集成為一體,支持外接攝像機進行視頻流分析。
據(jù)了解,該“智能機芯”同時也是國內(nèi)首個步態(tài)識別硬件模組,尺寸僅為86mm*56mm*18mm,功耗3W。該機芯模組具有如下功能:完整的人體生物識別方案;可集成完整的步態(tài)、人臉、防摔倒、跌倒檢測等算法;可以作為獨立的人體信息采集終端;擁有獨立的計算能力,可以作為大型系統(tǒng)的子運算節(jié)點,并支持任務分配,作為獨立采集終端上傳結果,可以廣泛應用于智能家居、智慧醫(yī)療、智能安防等諸多領域。
2018年10月底,銀河水滴還正式發(fā)布了多款擁有獨立自主知識產(chǎn)權的重磅產(chǎn)品:通過步態(tài)識別技術在海量視頻中快速進行目標人物檢索和身份識別的銀河水滴步態(tài)檢索智能一體機“水滴神鑒”,這是全球首款步態(tài)識別商用產(chǎn)品;可替代工人對地鐵軌道與隧道等完成智能化巡檢的銀河水滴軌道交通綜合智能檢測車“水滴智檢”,這是中國首臺小型化軌道交通綜合智能檢測車。
其中,水滴神鑒是集算法、軟件和硬件為一體的便攜式安防專用設備,以人的步態(tài)特征作為注冊對象、通過步態(tài)識別技術在海量視頻中快速進行人物檢索和身份識別、快速實現(xiàn)目標人物查找。該產(chǎn)品依托于銀河水滴全球領先的步態(tài)識別技術:全球最高的步態(tài)識別精度94%、全球最大的步態(tài)數(shù)據(jù)庫、可實現(xiàn)普通2K攝像機下最遠50米的遠距離、跨視角識別,且無需識別對象主動配合。
據(jù)了解,水滴神鑒可替代人工從海量監(jiān)控視頻中快速查找目標人物,并且大幅提升了檢索的效率和準確度;當出現(xiàn)遠距離、非配合、全視角(如只有側面和背面身形)、弱光線、人臉隱蔽/遮擋、目標人物多次換裝等一種或多種情況時,用步態(tài)識別技術搜檢目標人物,則成了最優(yōu)或唯一的選擇。
水滴智檢則可對地鐵軌道、隧道等完成智能化巡檢。該檢測車以AI為核心,基于中科院自動化所二十年的技術積累,打破國外技術壟斷,擁有完全自主知識產(chǎn)權,集成鋼軌及鎖扣缺陷檢測、鋼軌內(nèi)部缺陷檢測、車輛限界檢測、隧道環(huán)境異常檢測、接觸網(wǎng)缺陷檢測、軌距檢測六大功能模塊。該檢測車采用靈活的產(chǎn)品設計方案,既可整車售賣,也可分功能按模塊售賣。
另據(jù)了解,銀河水滴已開發(fā)工業(yè)視覺開放平臺(IndustryAI)配套的線下檢測生產(chǎn)線,集成各種常用的成像設備和自動化執(zhí)行機構,配合開放的視覺檢測算法,為制造行業(yè)提供先進的軟硬件一體化視覺檢測方案。
好文章,需要你的鼓勵
新加坡國立大學研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓練AI玩簡單撲克游戲就能讓其數(shù)學推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學題目作為訓練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉移到數(shù)學解題中,為AI訓練提供了新思路。
同濟大學團隊開發(fā)的GIGA-ToF技術通過融合多幀圖像的"圖結構"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術利用圖像間的不變幾何關系,結合深度學習和數(shù)學優(yōu)化方法,在合成數(shù)據(jù)集上實現(xiàn)37.9%的精度提升,并在真實設備上展現(xiàn)出色泛化能力,為機器人、AR和自動駕駛等領域提供更可靠的3D視覺解決方案。
伊利諾伊大學研究團隊通過對比實驗發(fā)現(xiàn),經(jīng)過強化學習訓練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實際提升推理準確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質(zhì)量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構聯(lián)合提出SparseLoRA技術,通過動態(tài)稀疏性實現(xiàn)大語言模型訓練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓練效率,已在多個任務上驗證有效性。