(2021年7月19日,北京)在近日舉辦的 ICME 2021 上,墨奇科技 CEO 及聯(lián)合創(chuàng)始人邰騁、墨奇科技 CTO 及聯(lián)合創(chuàng)始人湯林鵬受邀發(fā)表 Tutorial 演講,介紹了如何將指紋識別問題轉(zhuǎn)化為高精度圖像搜索問題,基于先進(jìn)的多尺度特征表示、極少樣本的自學(xué)習(xí)框架、超高性能的異構(gòu)搜索系統(tǒng),首次實(shí)現(xiàn)了無需細(xì)節(jié)特征的指紋比對系統(tǒng),達(dá)到20 億量級上的秒級、高精度、自動化比對,并揭示了這一技術(shù)泛化到其他自然圖像和非結(jié)構(gòu)化數(shù)據(jù)上的可能性。
演講還介紹了利用多目視覺和結(jié)構(gòu)光的非接觸指紋采集技術(shù)的原理,以及下一代保護(hù)隱私的生物識別技術(shù)特性和實(shí)現(xiàn)途徑探索。
指紋識別傳統(tǒng)方法的挑戰(zhàn)、基于機(jī)器學(xué)習(xí)的改進(jìn)與局限性
指紋識別是一種典型生物特征比對方式,一般來說有兩種類型任務(wù):第一種是驗(yàn)證,也稱之為 1:1 的比對,是看這個人是不是他所宣稱的人,例如手機(jī)解鎖等,這相對比較容易。第二種是識別,也稱之為 1:N 的比對,要回答的是這個人是誰。從以下系統(tǒng)錯比率和漏比率就可以看到,1:N 的問題比 1:1 的問題要困難得多,而且隨著庫容增大,這一問題會變得更加困難。
現(xiàn)有的比對系統(tǒng)主要是基于衡量輸入的相似度取閾值,一個真的比對分?jǐn)?shù)是比較高的,通常會形成偏右的分布。而錯誤比對的分?jǐn)?shù)會比較低,形成偏左邊分布。這兩個分布可能有重疊,所以系統(tǒng)會犯兩種錯誤:錯比(false match/false accept):把不同的人當(dāng)成同一個人;漏比(false nonmatch/false reject):把同一個人當(dāng)成不同的人。以下公式中,下標(biāo) N 是指有 N 個人的 1:1 的識別,可以看到兩類系統(tǒng)漏比率基本相當(dāng),而錯比率 1:N 系統(tǒng)近似于是 1:1 系統(tǒng)的 N 倍。
現(xiàn)場指紋(latent-print)比對是一個典型的1:N 識別的問題,對這一問題,傳統(tǒng)指紋系統(tǒng)尚未能很好地解決。傳統(tǒng)指紋識別方法主要有三方面問題:如何實(shí)現(xiàn)現(xiàn)場指紋圖像自動增強(qiáng)、如何進(jìn)行畸變校正,如何加速流程實(shí)現(xiàn)在大庫中的快速比對。
這三方面問題存在于指紋識別的不同環(huán)節(jié):
針對這些問題,近年來,研究者們在利用機(jī)器學(xué)習(xí)技術(shù)來改進(jìn)傳統(tǒng)的指紋識別上做了大量的工作,包括利用生成對抗網(wǎng)絡(luò)(GAN)進(jìn)行現(xiàn)場指紋圖像增強(qiáng),使用基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)進(jìn)行畸變校正,以及通過 FingerNet 端到端細(xì)節(jié)特征提取方法直接從圖像中提取特征點(diǎn)。這些基于深度學(xué)習(xí)的方法是對傳統(tǒng)方法的一種改進(jìn)。
然而,這些方法在精確度、訓(xùn)練數(shù)據(jù)和性能上仍存在局限:
新一代指紋識別技術(shù):將指紋比對問題轉(zhuǎn)化為高精度圖像搜索問題
墨奇科技一直致力于探尋新的技術(shù)路徑來解決這些問題,并發(fā)現(xiàn)了一種可行的方式:除了傳統(tǒng)細(xì)節(jié)特征外,指紋上還有很多信息,例如紋線的曲率、疏密分布、宏觀的走向、拓?fù)浣Y(jié)構(gòu)等等,這些信息對于身份識別都很重要。如果指紋比對看作一個特殊的圖像搜索問題,就會發(fā)現(xiàn)解決問題的關(guān)鍵在于多尺度表示,即對不同信息運(yùn)用不同尺度予以表示。然而圖像搜索問題更多是相似性搜索問題,對于準(zhǔn)確率的要求遠(yuǎn)沒有指紋比對這么高。
圖:多尺度特征
那么如何實(shí)現(xiàn)高精度的圖像搜索呢?
首先需要一個更有效的數(shù)學(xué)框架為指紋圖像構(gòu)建最佳的多尺度表示,可以更搜索友好而非壓縮友好,讓高精度、高性能的圖像搜索成為可能。這里運(yùn)用的是自適應(yīng)小波框架。新的表達(dá)方法具有三個顯著優(yōu)勢:一是可以學(xué)習(xí)向量、圖和標(biāo)簽的多尺度特征。二是更容易構(gòu)造多個特征。例如,在從像素到整體圖像的每一個中間尺度上,都提取了標(biāo)簽(label)、向量(vector)和圖(graph)等不同的特征,極大地擴(kuò)充了指紋信息。三是表示更具冗余性,并且具有完全重構(gòu)特性,因此,可以對其應(yīng)用不同的操作以獲得更多特征,例如一個點(diǎn)在不同尺度上,可以包含標(biāo)簽等信息。
其次,只需要極少樣本的自學(xué)習(xí)框架,讓系統(tǒng)可以自學(xué)習(xí)。單張圖片的訓(xùn)練信號大大增加,因而學(xué)習(xí)所需的標(biāo)記數(shù)據(jù)很少;給定一對指紋圖像,在全部尺度都可以開展學(xué)習(xí);當(dāng)專家使用系統(tǒng)時,會不斷提供匹配/非匹配對,從而實(shí)現(xiàn)系統(tǒng)自驅(qū)動;特征具有局部性,無需再使用細(xì)節(jié)特征。因而,適應(yīng)多尺度特征的 AI 自學(xué)習(xí)框架,能夠從搜索候選中不斷自學(xué),達(dá)到無監(jiān)督學(xué)習(xí)。
另外,超高性能的異構(gòu)系統(tǒng)和架構(gòu),讓準(zhǔn)確性和速度提升。專門用于視覺搜索的異構(gòu)多層分布式系統(tǒng),針對多尺度特征進(jìn)行了優(yōu)化。在比對過程中,向量和標(biāo)簽被首先分配到 GPU/NPU 中去,利用其強(qiáng)大的并行計算能力,對特征進(jìn)行初步的比對和過濾;對結(jié)果使用 CPU 進(jìn)行圖等幾何特征的比對和精確匹配,以及對于多種算法的候選列表進(jìn)行再排序以優(yōu)化最終的結(jié)果,最終實(shí)現(xiàn)指紋圖像的高速比對。
上圖:需要人工標(biāo)注細(xì)節(jié)特征
下圖:無標(biāo)注比對自動搜索指紋圖像相似的區(qū)域
憑借這些底層的技術(shù)創(chuàng)新,墨奇科技的新一代指紋識別系統(tǒng)徹底改變了傳統(tǒng)系統(tǒng)的工作流程,且突破性地不需要人工標(biāo)注,與現(xiàn)有絕大部分依賴人工的指紋系統(tǒng)都有本質(zhì)的差別。
以前,人們必須去現(xiàn)場收集指紋,帶回到辦公室,讓指紋專家標(biāo)記特征并將這些模板發(fā)送到系統(tǒng)進(jìn)行比對、等待結(jié)果。而現(xiàn)在只需要在現(xiàn)場用一些攝影設(shè)備(例如手機(jī))來拍攝指紋,就可處理更多特征數(shù)量和特征維度,但比對效率和響應(yīng)速度卻更高,可以秒級返回高精度結(jié)果,突破性地實(shí)現(xiàn)了 20 億量級大庫的秒級、高精度、自動化比對。這一技術(shù)目前已運(yùn)用到了指紋以外的更多圖像,如掌紋識別上,未來還可能推廣到更廣泛的圖像搜索應(yīng)用中。
相較于傳統(tǒng)系統(tǒng),雖然墨奇科技下一代指紋識別系統(tǒng)需要處理的特征數(shù)量和特征維度更多,但比對效率和響應(yīng)速度卻更高。基于以上的技術(shù)突破,該系統(tǒng)是目前行業(yè)內(nèi)比對速度更快、精度更高的系統(tǒng),同時降低了大庫衰減率。
新一代指紋采集技術(shù):將指紋采集升級到非接觸 3D 時代
疫情期間,非接觸指紋采集和識別技術(shù)受到越來越多的關(guān)注。傳統(tǒng)指紋采集大多是接觸式的,需要手指按壓在儀器表面。而非接觸指紋采集具有更明顯的優(yōu)勢:
非接觸式指紋技術(shù)涉及到幾個關(guān)鍵技術(shù),包括三維曲面重建和三維到二維曲面映射。指紋三維曲面重建目前主要有兩種方案:第一種是利用多目視覺技術(shù),在指紋采集時,手指的每一部分都需要出現(xiàn)在至少兩個攝像頭的視野中;另外一種則基于結(jié)構(gòu)光技術(shù),通過向被測物體表面投射特定圖案的光線,通過對光的反射構(gòu)建三維曲面。
墨奇科技提出了將多目視覺和結(jié)構(gòu)光結(jié)合使用的新方法。其中,多目視覺聚焦于中間部分,結(jié)構(gòu)光聚焦于邊緣部分,并與多目視覺的三維結(jié)果進(jìn)行交叉驗(yàn)證,這樣就實(shí)現(xiàn)了從不同角度對指紋的三維曲面進(jìn)行高精密度的重建。
圖:多目視覺技術(shù)+結(jié)構(gòu)光
三維到二維曲面映射技術(shù),主要有兩種展開方式:參數(shù)化展開和非參數(shù)化展開。參數(shù)化展開將手指看做一個圓柱體,將圓柱體從三維鋪平到二維平面。該方法簡單有效,但是它無法保持手指垂直方向上的曲線距離,況且指尖部分也和圓柱體有很大的不同,所以會有有很多失真和誤差。非參數(shù)化展開實(shí)際上是模擬手指如何在平面上展開,構(gòu)建從三維表面到二維平面的非參數(shù)映射。這種方法需要的計算量更大,對三維曲面的精度要求也更高。
墨奇科技組合運(yùn)用了這兩種方式。
圖:墨奇首創(chuàng)了高圖像質(zhì)量的非接觸式指紋掃描儀
第一行左邊結(jié)果來自傳統(tǒng)的掃描儀
中間圖像來自墨奇非接觸指紋掃描儀
第二行來自業(yè)界其他非接觸設(shè)備
基于這些技術(shù),墨奇首創(chuàng)了高圖像質(zhì)量、與滾動捺印采集面積相當(dāng)?shù)姆墙佑|式指紋掃描儀。它融合了世界領(lǐng)先的非接觸光學(xué)采集技術(shù)和三維視覺技術(shù),通過高精度曲面重建算法,使手指表面三維建模達(dá)到亞毫米精度,擁有采集速度快、采集質(zhì)量高、無需滾動捺印、無形變、采集面積更大等核心優(yōu)勢,是國際領(lǐng)先、國內(nèi)首創(chuàng)的自主科技創(chuàng)新成果,將指紋技術(shù)全面升級到非接觸 3D 時代。
保護(hù)隱私的生物識別技術(shù)
生物識別技術(shù)在許多應(yīng)用中帶來了便利和安全,但另一方面,對由此引發(fā)的隱私問題的關(guān)注也在不斷增長,而且重要日益凸顯。和密碼不同,生物特征與每個人都永久相連,具有終生不變的特性,一旦泄露就永遠(yuǎn)泄露。因此,生物特征識別技術(shù)需要一種更有效的隱私保護(hù)機(jī)制。
用戶的原始特征和采集到的模板都是用戶的隱私信息,都應(yīng)該被保護(hù)。用來比對的是使用變換函數(shù)變換后的特征,并只將變換后的特征存在數(shù)據(jù)庫里。對照密碼常使用的哈希加密,我們可以用類似的方法,使用加密哈希變換和存儲生物特征信息嗎?
實(shí)際上,典型的哈希函數(shù)在生物特征識別上并不起作用,因?yàn)樯锾卣鲾?shù)據(jù)會隨著時間變化,例如同一個人的指紋可以有不同的形狀和面積,面部圖像可以有不同的角度和亮度,虹膜數(shù)據(jù)也可能隨睜眼或閉眼而變化,而例如用一個SHA256 的哈希值,即使原始數(shù)據(jù)改變了一位,哈希值也完全改變了。
既然典型的哈希函數(shù)不起作用,保護(hù)隱私的生物識別技術(shù)應(yīng)該具有哪些特性?墨奇科技認(rèn)為,一個真正保護(hù)隱私的生物識別系統(tǒng)需要具備如下三點(diǎn):
如果滿足了上述三點(diǎn),那么這樣的方案才可被稱為可撤銷的生物識別技術(shù),其中有三種方案最具代表性:Biohashing 、Fuzzy Commitment 和 Fuzzy Vault。
圖:Biohashing 、Fuzzy Commitment 和 Fuzzy Vault
由此可見,研發(fā)保護(hù)隱私的生物識別相當(dāng)困難,現(xiàn)有系統(tǒng)很難達(dá)到。另一方面,對于所有保護(hù)隱私的生物識別系統(tǒng),都存在錯比率(FMR)和漏比率(FNMR)之間的權(quán)衡問題,可以視為安全性和便利性之間的權(quán)衡。
事實(shí)上,任何可撤銷的生物識別系統(tǒng)的安全級別實(shí)際上都受 1/FMR 的限制,因?yàn)楣粽呖赡軙梢粋€數(shù)量超過1/FMR 合成生物特征樣本數(shù)據(jù)庫,然后在如此大量的樣本中,可以只找到一個與原始樣本具有足夠相似度的樣本,然后我們就可以找到匹配并破解系統(tǒng),還原原始的生物特征樣本。因此,我們需要一個具有非常低的 FMR 錯比率的系統(tǒng),才能確保安全。
對于指紋識別系統(tǒng)來說,未來可撤銷的保護(hù)隱私的指紋識別系統(tǒng),未來發(fā)展方向包括:
墨奇科技正在將圖像比對和密碼學(xué)相組合,引領(lǐng)下一代保護(hù)隱私的生物特征識別技術(shù)。盡管保護(hù)隱私的生物識別技術(shù)由于各種技術(shù)困難尚未被廣泛采用,但必是生物識別技術(shù)的未來。
ICME 2021 簡介:
全球計算機(jī)多媒體頂級會議 ICME 全稱 IEEE International Conference on Multimedia and Expo,2021 年于 7 月 5 日 - 9 日于線上召開。
ICME 是計算機(jī)多媒體領(lǐng)域最重要和權(quán)威的兩大國際旗艦會議之一,會議輪流由美洲、歐洲、亞洲城市主辦,至今已連續(xù)舉辦 20 屆,每年都有約 500 位學(xué)者參會,收到約 1000 份論文,涵蓋文本分析、圖形圖像、視頻處理、語音和音頻信號處理等主題。
關(guān)于墨奇科技
墨奇科技是領(lǐng)先的 AI 基礎(chǔ)技術(shù)和平臺公司。自 2016 年創(chuàng)建,始終以“探尋人工智能本身的機(jī)理,以創(chuàng)新改變世界”為使命。在這個使命下,墨奇科技致力于構(gòu)建先進(jìn)的新型 AI 知識數(shù)據(jù)庫,自動化地處理機(jī)器知識,讓企業(yè)可以便捷地應(yīng)用人工智能獲得數(shù)據(jù)洞察,加快 AI 時代的智慧產(chǎn)業(yè)升級步伐。同時,墨奇基于 AI 知識數(shù)據(jù)庫,構(gòu)建了能為數(shù)十億人提供保護(hù)隱私、安全可靠的下一代身份識別和認(rèn)證平臺,統(tǒng)一物理和數(shù)字身份,為建設(shè)智慧信用社會提供技術(shù)支撐。
好文章,需要你的鼓勵
新加坡國立大學(xué)研究團(tuán)隊(duì)開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實(shí)驗(yàn)顯示,僅訓(xùn)練AI玩簡單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟(jì)大學(xué)團(tuán)隊(duì)開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機(jī)噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實(shí)現(xiàn)37.9%的精度提升,并在真實(shí)設(shè)備上展現(xiàn)出色泛化能力,為機(jī)器人、AR和自動駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團(tuán)隊(duì)通過對比實(shí)驗(yàn)發(fā)現(xiàn),經(jīng)過強(qiáng)化學(xué)習(xí)訓(xùn)練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實(shí)際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗(yàn)證差距",即生成答案的能力強(qiáng)于驗(yàn)證答案質(zhì)量的能力,且模型在自我驗(yàn)證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機(jī)構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動態(tài)稀疏性實(shí)現(xiàn)大語言模型訓(xùn)練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓(xùn)練效率,已在多個任務(wù)上驗(yàn)證有效性。