理論上,你只需要看一眼手機(jī),啟用了FaceID功能的iPhone X就會(huì)在一秒鐘內(nèi)識(shí)別出你的臉部特征,并自行解鎖,同時(shí),這一技術(shù)也將被用于Apple Pay支付和第三方應(yīng)用等場(chǎng)景中。
有吐槽說(shuō),這一功能可能讓iPhone失去一批男性用戶(hù)(尤其是已婚男士),反之,這也有可能讓一批男性“被迫”提前用上iPhone X。
蘋(píng)果公司在iPhone X中使用了“TrueDepth攝像機(jī)系統(tǒng)”(也就是“齊劉海”部分),通過(guò)使用里面的傳感器和點(diǎn)陣投影儀,投射出3萬(wàn)多個(gè)點(diǎn),就能形成一張完整的3D“臉譜”用來(lái)識(shí)別用戶(hù)臉部。據(jù)悉, iPhone X將采用定制的芯片來(lái)處理人工智能工作負(fù)載,這是一個(gè)雙核的“ A11生物神經(jīng)網(wǎng)絡(luò)引擎”芯片,每秒運(yùn)算次數(shù)最高可達(dá)6000億次,該芯片賦能的最重要的事情就是使Face ID身份認(rèn)證功能能夠快速識(shí)別人臉。而為保證用戶(hù)的隱私,讓用戶(hù)更放心,蘋(píng)果稱(chēng)所有相關(guān)的數(shù)據(jù)運(yùn)算都將發(fā)生在本地,不會(huì)被上傳到云端或是回傳到蘋(píng)果公司。
同時(shí),經(jīng)過(guò)不斷被訓(xùn)練的神經(jīng)網(wǎng)絡(luò)建模識(shí)別人臉,當(dāng)你的iPhone X識(shí)別你的臉部次數(shù)越多,它就會(huì)對(duì)你越熟悉。不管你是換發(fā)型、留胡子、戴帽子、戴眼鏡,還是光線強(qiáng)弱不同,它都會(huì)認(rèn)出你。
同為生物識(shí)別技術(shù),TouchID的解鎖錯(cuò)誤率是五萬(wàn)分之一,而FaceID則是一百萬(wàn)分之一,成功率極高(雖然蘋(píng)果高級(jí)副總裁Craig Federighi在發(fā)布會(huì)上嘗試使用FaceID功能解鎖手機(jī)卻失?。?。對(duì)此,大家也不必過(guò)度“恐慌”。庫(kù)克在發(fā)布會(huì)上表示,FaceID要求使用者在刷臉解鎖時(shí)必須“集中注意力”(require“user attention”),所以,當(dāng)手機(jī)遠(yuǎn)離眼睛,或者用戶(hù)閉著眼睛時(shí)就不會(huì)解鎖,你根本不用擔(dān)心在自己睡覺(jué)時(shí)手機(jī)被解鎖(除非你像張飛一樣睜著眼睛睡覺(jué))。
事實(shí)上,近幾年來(lái)以來(lái),業(yè)界對(duì)于臉部識(shí)別的應(yīng)用“屢試不爽”,但一直因?yàn)榘踩珕?wèn)題被詬病。比如只需要通過(guò)一張電腦所有者的照片,就可以輕松進(jìn)入設(shè)置了臉部識(shí)別登錄方式的電腦;再比如流行科學(xué)作家丹·莫倫(Dan Moren)通過(guò)一個(gè)視頻就擊敗了阿里巴巴的面部識(shí)別系統(tǒng)。
然而,一直以“安全”標(biāo)榜自己的蘋(píng)果,定然也不會(huì)允許這樣一個(gè)“萬(wàn)眾矚目”的新功能讓自己的“人設(shè)”輕易垮掉。在這周小米的新品發(fā)布會(huì)上,小米也推出了人臉識(shí)別解鎖方面的方案,雖然都是“人臉識(shí)別”,但具體技術(shù)卻有很大的差距。
蘋(píng)果的FaceID,采用的是結(jié)構(gòu)光雙攝方案,通過(guò)將3萬(wàn)多個(gè)光點(diǎn)的網(wǎng)絡(luò)投射到人臉上,并隨著用戶(hù)轉(zhuǎn)動(dòng)頭部以映射臉部3D形狀,最終形成的是一個(gè)三維圖像,這也是目前安全性最高的人臉識(shí)別方案。而小米Note更多還是二維人臉解鎖的方案。
當(dāng)然,即使是三維面部識(shí)別系統(tǒng)也并不是“萬(wàn)無(wú)一失”。就在兩年前,柏林的SR實(shí)驗(yàn)室使用石膏模具,破解了微軟的Hello面部識(shí)別系統(tǒng)。這一嘗試在多個(gè)使用相同類(lèi)型紅外深度感應(yīng)攝像機(jī)的品牌筆記本中都成功了。SR 實(shí)驗(yàn)室的創(chuàng)始人Karsten Nohl指出,他們使用的模具不僅模仿了用戶(hù)的臉部形狀,還模仿了皮膚的光反射性能。
為了證明自己,蘋(píng)果甚至與好萊塢模型團(tuán)隊(duì)進(jìn)行了人臉模型對(duì)比驗(yàn)證,以保證FaceID所識(shí)別的人臉不能被包括蠟像、模具等在內(nèi)的任何仿制品所替代。在發(fā)布會(huì)現(xiàn)場(chǎng),F(xiàn)ederighi展示了一些非常逼真的面具制品,并表示經(jīng)過(guò)測(cè)試,即使是這些面具再逼真也無(wú)法破解FaceID系統(tǒng)。他說(shuō),從理論上來(lái)說(shuō),也許這個(gè)世界上有人能夠跟你長(zhǎng)的非常相似,他可以破解你的手機(jī)系統(tǒng),但是這種概率大概是一百萬(wàn)分之一。當(dāng)然,如果是雙胞胎,這個(gè)概率就會(huì)大大提高。
其實(shí),關(guān)于人臉識(shí)別的安全性問(wèn)題很多人心里依然沒(méi)底,也許只有經(jīng)過(guò)公開(kāi)測(cè)試才能真正打破用戶(hù)的疑慮。 但即便如此,目前,已經(jīng)有很多金融機(jī)構(gòu)開(kāi)始采用人臉識(shí)別幫助用戶(hù)進(jìn)行開(kāi)戶(hù)、轉(zhuǎn)賬、付款,包括支付寶、券商、銀行等等。以招商銀行為例,目前人臉識(shí)別已經(jīng)能夠?qū)崿F(xiàn)手機(jī)端超過(guò) 50 萬(wàn)的轉(zhuǎn)賬;對(duì)于標(biāo)準(zhǔn)化的個(gè)人業(yè)務(wù),配置了人臉識(shí)別系統(tǒng)的智能柜臺(tái)也已經(jīng)在招行的線下網(wǎng)點(diǎn)投入使用(人臉識(shí)別時(shí),系統(tǒng)會(huì)要求用戶(hù)做出對(duì)應(yīng)動(dòng)作,如點(diǎn)頭或者眨眼)。
總之,安全與體驗(yàn)也許永遠(yuǎn)沒(méi)法兩全。但,這并不意味著這道題無(wú)解,如果你的手機(jī)數(shù)據(jù)確實(shí)非常敏感,你完全可以選擇關(guān)閉FaceID識(shí)別功能,或者,你也可以選擇允許FaceID進(jìn)行解鎖,但不用于付款(此解同樣適用于篇頭的“恐慌人群”)。
當(dāng)然,還有網(wǎng)友對(duì)于卸了妝還能不能解鎖表示擔(dān)憂(yōu),對(duì)此,我想說(shuō)的是——卸了妝能不能解鎖,你心里沒(méi)點(diǎn)數(shù)嗎?其實(shí),我自己比較擔(dān)心的是,如果我只是想用手機(jī)屏幕照個(gè)鏡子怎么辦?
話說(shuō)回來(lái),事實(shí)上,蘋(píng)果在人臉識(shí)別技術(shù)方面的布局已經(jīng)不是一年兩年,最近幾年來(lái)先后收購(gòu)了 PolarRose、PrimeSense、Perceptio、Faceshift、Emotient、Turi 等人臉識(shí)別相關(guān)技術(shù)公司。其中,2013 年收購(gòu)的 3D 傳感技術(shù)公司 PrimeSense,曾經(jīng)還因?yàn)榻o微軟的 Kinect 提供了傳感器而走紅。通過(guò)傳感器和中間件,可以讓設(shè)備感知周邊的三維環(huán)境,實(shí)現(xiàn)人機(jī)交互。這也是此次FaceID所涉及的關(guān)鍵技術(shù)之一。
除此之外,在去年年底,蘋(píng)果還發(fā)布了第一份關(guān)于人工智能的學(xué)術(shù)論文《Learning from Simulated and Unsupervised Images through Adversarial Training》。這篇論文闡述了如何通過(guò)計(jì)算機(jī)生成圖像而非真實(shí)圖像來(lái)訓(xùn)練算法的圖像識(shí)別能力。
蘋(píng)果在論文中稱(chēng),在機(jī)器學(xué)習(xí)研究中,使用合成圖像(例如來(lái)自一款視頻游戲)來(lái)訓(xùn)練神經(jīng)網(wǎng)絡(luò)要比使用真實(shí)圖像更有效。因?yàn)楹铣蓤D像數(shù)據(jù)已經(jīng)被標(biāo)記和注釋?zhuān)鎸?shí)的圖像數(shù)據(jù)需要有人耗費(fèi)巨大的精力去標(biāo)記計(jì)算機(jī)看到的每件事物,如一棵樹(shù)、一條狗或一輛自行車(chē)。
當(dāng)然,使用合成圖像也存在一定的弊端,導(dǎo)致一種算法所了解的內(nèi)容與真實(shí)世界中的場(chǎng)景有所不同。比如,合成圖像數(shù)據(jù)如果不夠真實(shí),就會(huì)導(dǎo)致神經(jīng)網(wǎng)絡(luò)只能了解到合成圖像中所呈現(xiàn)的細(xì)節(jié),而對(duì)真實(shí)圖像的認(rèn)識(shí)有所不足。
為解決該問(wèn)題,提高合成圖像數(shù)據(jù)的訓(xùn)練效果,蘋(píng)果研究人員推出了“模擬+無(wú)監(jiān)督”的學(xué)習(xí)方法,以提高模擬圖像的真實(shí)感。蘋(píng)果研究人員使用一種經(jīng)過(guò)修改的新型機(jī)器學(xué)習(xí)技術(shù),被稱(chēng)為“生成對(duì)抗網(wǎng)絡(luò)”(GAN),讓兩個(gè)神經(jīng)網(wǎng)絡(luò)彼此對(duì)抗,從而生成更逼真的圖像。
大膽地推想,蘋(píng)果應(yīng)該把這樣一套方法論應(yīng)用在了iPhone X 的 FaceID功能中。
關(guān)于人臉識(shí)別技術(shù)
人臉識(shí)別技術(shù)是指利用分析比較的計(jì)算機(jī)技術(shù)識(shí)別人臉,其中包括人臉追蹤偵測(cè),自動(dòng)調(diào)整影像放大,夜間紅外偵測(cè),自動(dòng)調(diào)整曝光強(qiáng)度等技術(shù)。廣義的人臉識(shí)別包括構(gòu)建人臉識(shí)別系統(tǒng)的一系列相關(guān)技術(shù),包括人臉圖像采集、人臉定位、人臉識(shí)別預(yù)處理、身份確認(rèn)以及身份查找等;而狹義的人臉識(shí)別特指通過(guò)人臉進(jìn)行身份確認(rèn)或者身份查找的技術(shù)或系統(tǒng)。
技術(shù)流程:
關(guān)鍵技術(shù)
基本方法:
算法分類(lèi):
好文章,需要你的鼓勵(lì)
騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng),首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長(zhǎng)篇音頻故事。該系統(tǒng)結(jié)合大語(yǔ)言模型的敘事推理能力與音頻生成技術(shù),通過(guò)交錯(cuò)式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場(chǎng)景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開(kāi)辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過(guò)讓AI同時(shí)學(xué)習(xí)外觀和運(yùn)動(dòng)信息,顯著解決了當(dāng)前視頻生成模型中動(dòng)作不連貫、違反物理定律的核心問(wèn)題。該技術(shù)僅需添加兩個(gè)線性層就能大幅提升運(yùn)動(dòng)質(zhì)量,在多項(xiàng)測(cè)試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語(yǔ)言模型人性化對(duì)話問(wèn)題。該研究創(chuàng)建了包含20萬(wàn)高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評(píng)測(cè)基準(zhǔn),通過(guò)創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平,為AI價(jià)值觀對(duì)齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊(duì)開(kāi)發(fā)的GraphCast是一個(gè)革命性的AI天氣預(yù)測(cè)模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào),準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過(guò)學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測(cè)方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來(lái)了效率和精度的雙重突破。