理論上,你只需要看一眼手機(jī),啟用了FaceID功能的iPhone X就會(huì)在一秒鐘內(nèi)識別出你的臉部特征,并自行解鎖,同時(shí),這一技術(shù)也將被用于Apple Pay支付和第三方應(yīng)用等場景中。
有吐槽說,這一功能可能讓iPhone失去一批男性用戶(尤其是已婚男士),反之,這也有可能讓一批男性“被迫”提前用上iPhone X。
蘋果公司在iPhone X中使用了“TrueDepth攝像機(jī)系統(tǒng)”(也就是“齊劉海”部分),通過使用里面的傳感器和點(diǎn)陣投影儀,投射出3萬多個(gè)點(diǎn),就能形成一張完整的3D“臉譜”用來識別用戶臉部。據(jù)悉, iPhone X將采用定制的芯片來處理人工智能工作負(fù)載,這是一個(gè)雙核的“ A11生物神經(jīng)網(wǎng)絡(luò)引擎”芯片,每秒運(yùn)算次數(shù)最高可達(dá)6000億次,該芯片賦能的最重要的事情就是使Face ID身份認(rèn)證功能能夠快速識別人臉。而為保證用戶的隱私,讓用戶更放心,蘋果稱所有相關(guān)的數(shù)據(jù)運(yùn)算都將發(fā)生在本地,不會(huì)被上傳到云端或是回傳到蘋果公司。
同時(shí),經(jīng)過不斷被訓(xùn)練的神經(jīng)網(wǎng)絡(luò)建模識別人臉,當(dāng)你的iPhone X識別你的臉部次數(shù)越多,它就會(huì)對你越熟悉。不管你是換發(fā)型、留胡子、戴帽子、戴眼鏡,還是光線強(qiáng)弱不同,它都會(huì)認(rèn)出你。
同為生物識別技術(shù),TouchID的解鎖錯(cuò)誤率是五萬分之一,而FaceID則是一百萬分之一,成功率極高(雖然蘋果高級副總裁Craig Federighi在發(fā)布會(huì)上嘗試使用FaceID功能解鎖手機(jī)卻失?。?。對此,大家也不必過度“恐慌”。庫克在發(fā)布會(huì)上表示,FaceID要求使用者在刷臉解鎖時(shí)必須“集中注意力”(require“user attention”),所以,當(dāng)手機(jī)遠(yuǎn)離眼睛,或者用戶閉著眼睛時(shí)就不會(huì)解鎖,你根本不用擔(dān)心在自己睡覺時(shí)手機(jī)被解鎖(除非你像張飛一樣睜著眼睛睡覺)。
事實(shí)上,近幾年來以來,業(yè)界對于臉部識別的應(yīng)用“屢試不爽”,但一直因?yàn)榘踩珕栴}被詬病。比如只需要通過一張電腦所有者的照片,就可以輕松進(jìn)入設(shè)置了臉部識別登錄方式的電腦;再比如流行科學(xué)作家丹·莫倫(Dan Moren)通過一個(gè)視頻就擊敗了阿里巴巴的面部識別系統(tǒng)。
然而,一直以“安全”標(biāo)榜自己的蘋果,定然也不會(huì)允許這樣一個(gè)“萬眾矚目”的新功能讓自己的“人設(shè)”輕易垮掉。在這周小米的新品發(fā)布會(huì)上,小米也推出了人臉識別解鎖方面的方案,雖然都是“人臉識別”,但具體技術(shù)卻有很大的差距。
蘋果的FaceID,采用的是結(jié)構(gòu)光雙攝方案,通過將3萬多個(gè)光點(diǎn)的網(wǎng)絡(luò)投射到人臉上,并隨著用戶轉(zhuǎn)動(dòng)頭部以映射臉部3D形狀,最終形成的是一個(gè)三維圖像,這也是目前安全性最高的人臉識別方案。而小米Note更多還是二維人臉解鎖的方案。
當(dāng)然,即使是三維面部識別系統(tǒng)也并不是“萬無一失”。就在兩年前,柏林的SR實(shí)驗(yàn)室使用石膏模具,破解了微軟的Hello面部識別系統(tǒng)。這一嘗試在多個(gè)使用相同類型紅外深度感應(yīng)攝像機(jī)的品牌筆記本中都成功了。SR 實(shí)驗(yàn)室的創(chuàng)始人Karsten Nohl指出,他們使用的模具不僅模仿了用戶的臉部形狀,還模仿了皮膚的光反射性能。
為了證明自己,蘋果甚至與好萊塢模型團(tuán)隊(duì)進(jìn)行了人臉模型對比驗(yàn)證,以保證FaceID所識別的人臉不能被包括蠟像、模具等在內(nèi)的任何仿制品所替代。在發(fā)布會(huì)現(xiàn)場,F(xiàn)ederighi展示了一些非常逼真的面具制品,并表示經(jīng)過測試,即使是這些面具再逼真也無法破解FaceID系統(tǒng)。他說,從理論上來說,也許這個(gè)世界上有人能夠跟你長的非常相似,他可以破解你的手機(jī)系統(tǒng),但是這種概率大概是一百萬分之一。當(dāng)然,如果是雙胞胎,這個(gè)概率就會(huì)大大提高。
其實(shí),關(guān)于人臉識別的安全性問題很多人心里依然沒底,也許只有經(jīng)過公開測試才能真正打破用戶的疑慮。 但即便如此,目前,已經(jīng)有很多金融機(jī)構(gòu)開始采用人臉識別幫助用戶進(jìn)行開戶、轉(zhuǎn)賬、付款,包括支付寶、券商、銀行等等。以招商銀行為例,目前人臉識別已經(jīng)能夠?qū)崿F(xiàn)手機(jī)端超過 50 萬的轉(zhuǎn)賬;對于標(biāo)準(zhǔn)化的個(gè)人業(yè)務(wù),配置了人臉識別系統(tǒng)的智能柜臺也已經(jīng)在招行的線下網(wǎng)點(diǎn)投入使用(人臉識別時(shí),系統(tǒng)會(huì)要求用戶做出對應(yīng)動(dòng)作,如點(diǎn)頭或者眨眼)。
總之,安全與體驗(yàn)也許永遠(yuǎn)沒法兩全。但,這并不意味著這道題無解,如果你的手機(jī)數(shù)據(jù)確實(shí)非常敏感,你完全可以選擇關(guān)閉FaceID識別功能,或者,你也可以選擇允許FaceID進(jìn)行解鎖,但不用于付款(此解同樣適用于篇頭的“恐慌人群”)。
當(dāng)然,還有網(wǎng)友對于卸了妝還能不能解鎖表示擔(dān)憂,對此,我想說的是——卸了妝能不能解鎖,你心里沒點(diǎn)數(shù)嗎?其實(shí),我自己比較擔(dān)心的是,如果我只是想用手機(jī)屏幕照個(gè)鏡子怎么辦?
話說回來,事實(shí)上,蘋果在人臉識別技術(shù)方面的布局已經(jīng)不是一年兩年,最近幾年來先后收購了 PolarRose、PrimeSense、Perceptio、Faceshift、Emotient、Turi 等人臉識別相關(guān)技術(shù)公司。其中,2013 年收購的 3D 傳感技術(shù)公司 PrimeSense,曾經(jīng)還因?yàn)榻o微軟的 Kinect 提供了傳感器而走紅。通過傳感器和中間件,可以讓設(shè)備感知周邊的三維環(huán)境,實(shí)現(xiàn)人機(jī)交互。這也是此次FaceID所涉及的關(guān)鍵技術(shù)之一。
除此之外,在去年年底,蘋果還發(fā)布了第一份關(guān)于人工智能的學(xué)術(shù)論文《Learning from Simulated and Unsupervised Images through Adversarial Training》。這篇論文闡述了如何通過計(jì)算機(jī)生成圖像而非真實(shí)圖像來訓(xùn)練算法的圖像識別能力。
蘋果在論文中稱,在機(jī)器學(xué)習(xí)研究中,使用合成圖像(例如來自一款視頻游戲)來訓(xùn)練神經(jīng)網(wǎng)絡(luò)要比使用真實(shí)圖像更有效。因?yàn)楹铣蓤D像數(shù)據(jù)已經(jīng)被標(biāo)記和注釋,而真實(shí)的圖像數(shù)據(jù)需要有人耗費(fèi)巨大的精力去標(biāo)記計(jì)算機(jī)看到的每件事物,如一棵樹、一條狗或一輛自行車。
當(dāng)然,使用合成圖像也存在一定的弊端,導(dǎo)致一種算法所了解的內(nèi)容與真實(shí)世界中的場景有所不同。比如,合成圖像數(shù)據(jù)如果不夠真實(shí),就會(huì)導(dǎo)致神經(jīng)網(wǎng)絡(luò)只能了解到合成圖像中所呈現(xiàn)的細(xì)節(jié),而對真實(shí)圖像的認(rèn)識有所不足。
為解決該問題,提高合成圖像數(shù)據(jù)的訓(xùn)練效果,蘋果研究人員推出了“模擬+無監(jiān)督”的學(xué)習(xí)方法,以提高模擬圖像的真實(shí)感。蘋果研究人員使用一種經(jīng)過修改的新型機(jī)器學(xué)習(xí)技術(shù),被稱為“生成對抗網(wǎng)絡(luò)”(GAN),讓兩個(gè)神經(jīng)網(wǎng)絡(luò)彼此對抗,從而生成更逼真的圖像。
大膽地推想,蘋果應(yīng)該把這樣一套方法論應(yīng)用在了iPhone X 的 FaceID功能中。
關(guān)于人臉識別技術(shù)
人臉識別技術(shù)是指利用分析比較的計(jì)算機(jī)技術(shù)識別人臉,其中包括人臉追蹤偵測,自動(dòng)調(diào)整影像放大,夜間紅外偵測,自動(dòng)調(diào)整曝光強(qiáng)度等技術(shù)。廣義的人臉識別包括構(gòu)建人臉識別系統(tǒng)的一系列相關(guān)技術(shù),包括人臉圖像采集、人臉定位、人臉識別預(yù)處理、身份確認(rèn)以及身份查找等;而狹義的人臉識別特指通過人臉進(jìn)行身份確認(rèn)或者身份查找的技術(shù)或系統(tǒng)。
技術(shù)流程:
關(guān)鍵技術(shù)
基本方法:
算法分類:
好文章,需要你的鼓勵(lì)
新加坡國立大學(xué)研究團(tuán)隊(duì)開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實(shí)驗(yàn)顯示,僅訓(xùn)練AI玩簡單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟(jì)大學(xué)團(tuán)隊(duì)開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機(jī)噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實(shí)現(xiàn)37.9%的精度提升,并在真實(shí)設(shè)備上展現(xiàn)出色泛化能力,為機(jī)器人、AR和自動(dòng)駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團(tuán)隊(duì)通過對比實(shí)驗(yàn)發(fā)現(xiàn),經(jīng)過強(qiáng)化學(xué)習(xí)訓(xùn)練的視覺語言模型雖然表現(xiàn)出"頓悟時(shí)刻"現(xiàn)象,但這些自我糾錯(cuò)行為并不能實(shí)際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗(yàn)證差距",即生成答案的能力強(qiáng)于驗(yàn)證答案質(zhì)量的能力,且模型在自我驗(yàn)證時(shí)無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機(jī)構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動(dòng)態(tài)稀疏性實(shí)現(xiàn)大語言模型訓(xùn)練加速1.6倍,計(jì)算成本降低2.2倍。該方法使用SVD稀疏性估計(jì)器智能選擇重要計(jì)算部分,在保持模型性能的同時(shí)顯著提升訓(xùn)練效率,已在多個(gè)任務(wù)上驗(yàn)證有效性。