人工智能對(duì)計(jì)算需求的高速增長(zhǎng),給了英偉達(dá)這家24歲的公司巨大的機(jī)會(huì)。以GPU計(jì)算為基點(diǎn),其正在把圖像處理能力推向無(wú)人機(jī)、高級(jí)自動(dòng)駕駛、自主機(jī)器人、AI城市等領(lǐng)域。
在過(guò)去的兩年里,英偉達(dá)市值一路飆升,令許多企業(yè)“分外眼紅”。而在今天的GTC CHINA大會(huì)上,英偉達(dá)又發(fā)布了Tesla V100 GPU、可編程推理平臺(tái)TensorRT 3,自動(dòng)駕駛平臺(tái)、自主機(jī)器處理器 Xavier及虛擬機(jī)器人訓(xùn)練環(huán)境這五個(gè)新項(xiàng)目,可以說(shuō)是向AI各個(gè)領(lǐng)域全面鋪開(kāi)。
英偉達(dá)CEO黃仁勛在會(huì)上說(shuō):“人工智能計(jì)算的新紀(jì)元,就是要讓企業(yè)省錢(qián)。”老黃之于英偉達(dá),就如喬布斯之于蘋(píng)果。他領(lǐng)導(dǎo)下的英偉達(dá),仍然像一個(gè)初創(chuàng)公司一樣不斷創(chuàng)新、果斷決策、快速執(zhí)行,這與他敏銳的戰(zhàn)略直覺(jué)和個(gè)性不無(wú)關(guān)系。在外人看來(lái),他親切隨和,但對(duì)待工作卻十分嚴(yán)苛。
在長(zhǎng)達(dá)2小時(shí)的演講過(guò)后,黃仁勛接受了媒體采訪(fǎng),沒(méi)有追求“形式感”的入場(chǎng),而是伴著一聲“Hey you guys!”,未見(jiàn)其人先聞其聲。然后隨性地往椅子上一坐,輕松地開(kāi)啟了“話(huà)匣子”。
他表示,傳統(tǒng)的計(jì)算機(jī)產(chǎn)業(yè)正在被顛覆,大數(shù)據(jù)、深度學(xué)習(xí)、人工智能等新技術(shù)的出現(xiàn),使得硬件的制造方式被改變,軟件運(yùn)行也不再完全依賴(lài)于代碼。目前我們遇面臨著一個(gè)百年一遇的也是令人興奮的機(jī)會(huì)。
記者:英偉達(dá)接下來(lái)將在A(yíng)I領(lǐng)域全面布局,那么各項(xiàng)業(yè)務(wù)之間是否有側(cè)重,下一個(gè)階段的重點(diǎn)的什么?
黃仁勛:英偉達(dá)今天發(fā)布的五個(gè)重點(diǎn)項(xiàng)目,有個(gè)共同點(diǎn)就是沒(méi)有GPU是不可能實(shí)現(xiàn)的。這五個(gè)領(lǐng)域的研究本身挑戰(zhàn)性就非常高,同時(shí),英偉達(dá)給予它們的也都是獨(dú)一無(wú)二的價(jià)值。雖然,目前我們還不敢保證所有這些項(xiàng)目都會(huì)100%成功,但可以確定的是,如果一旦成功它們一定會(huì)給社會(huì)帶來(lái)巨大的價(jià)值,這也將給英偉達(dá)帶來(lái)非常大的滿(mǎn)足感。
記者:英偉達(dá)所發(fā)布的自主機(jī)器什么時(shí)候能夠進(jìn)行商用和普及?
黃仁勛:目前,對(duì)于自主機(jī)器而言需要解決三大關(guān)鍵的問(wèn)題。首先,是為自主機(jī)器打造一個(gè)人工智能平臺(tái),類(lèi)似于增強(qiáng)學(xué)習(xí)等等;另外,是提供一個(gè)能夠讓自主機(jī)器進(jìn)行自主學(xué)習(xí)的虛擬環(huán)境;在此基礎(chǔ)上,第三步再將人工智能的“大腦”放到自主機(jī)器的框架中。
坦率說(shuō),目前這三個(gè)問(wèn)題還沒(méi)有完全解決,但是三項(xiàng)工作在英偉達(dá)正在并行中。比如說(shuō)今天推出的自主機(jī)器處理器 Xavier,虛擬的學(xué)習(xí)環(huán)境、以及英偉達(dá)的人工智能平臺(tái)等等,都是在為自主機(jī)器的商用和普及做準(zhǔn)備工作。
明年,英偉達(dá)會(huì)將這三方面的基礎(chǔ)都打好,之后就可以進(jìn)行自主機(jī)器的生產(chǎn)。另外,我也相信,在未來(lái)的十到十五年,我們還會(huì)看到更加令人難以置信的創(chuàng)新和進(jìn)步。
記者:您認(rèn)為未來(lái)的人工智能發(fā)展是端主導(dǎo)的還是云主導(dǎo)的?
黃仁勛:可以肯定的是,智能將無(wú)處不在。它會(huì)在麥克風(fēng)上、手表上、鞋子上、保溫杯中,甚至是耳環(huán)里。但是,智能又分為通用型和專(zhuān)用型。如果是小型的終端設(shè)備,比如說(shuō)保溫杯、咖啡機(jī),就是專(zhuān)門(mén)型的智能,只需要滿(mǎn)足某個(gè)方面的需求,更側(cè)重物聯(lián)網(wǎng)和邊緣計(jì)算。而云端的智能是通用型的,通常具備各種各樣的軟件,并且必須是靈活、可編程的,需要滿(mǎn)足跨領(lǐng)域的需求。因此,未來(lái),端上的智能和云上的智能都會(huì)非常重要。
記者:GPU的出現(xiàn)顛覆了CPU的架構(gòu)核心。您認(rèn)為將來(lái)GPU是否可以覆蓋所有的場(chǎng)景,或者將來(lái)還會(huì)有更多的新型的GPU出現(xiàn)為更多的計(jì)算需求提供支持?
黃仁勛:首先,GPU不會(huì)替代CPU,而是與CPU更好地結(jié)合實(shí)現(xiàn)計(jì)算,這也是我們?yōu)槭裁窗袵PU稱(chēng)為加速器的原因。它們二者各有優(yōu)勢(shì)和分工,CPU是通用的,什么場(chǎng)景都可以適用。而GUP在一些專(zhuān)門(mén)問(wèn)題的處理上會(huì)發(fā)揮非常大的作用,它非常擅長(zhǎng)圖形處理和人工智能類(lèi)型的工作,比如在圖像識(shí)別中GUP的性能是CPU的十倍、五十倍甚至百倍。因此我們認(rèn)為事實(shí)上最完美的架構(gòu)是把CPU和GPU結(jié)合起來(lái)。從這方面來(lái)說(shuō),英偉達(dá)的研究重心其實(shí)不是升級(jí)每次只好一點(diǎn)點(diǎn)的通用型處理器,而是推出在專(zhuān)門(mén)的領(lǐng)域能夠提供超強(qiáng)性能的處理器,也就是我們推出的CUDA的架構(gòu),即CPU+GPU。
記者:是否可以談一下GPU與FPGA的區(qū)別?
黃仁勛:這兩者的區(qū)別很大。FPGA非常靈活,可以在是在以太網(wǎng)卡里、音頻卡中、或者視頻卡中,是可配置的。在設(shè)計(jì)階段,它就可以被設(shè)計(jì)用于成各種各樣的用途。但是,GPU沒(méi)有那么大的靈活性,它是一種并行計(jì)算的加速器,是“術(shù)業(yè)有專(zhuān)攻”。當(dāng)然,F(xiàn)PGA也可以被轉(zhuǎn)變?yōu)镚PU,但是性能無(wú)法滿(mǎn)足要求,它的速度要比GPU慢1000倍。
三年前,英偉達(dá)決定把GPU做成Tensor執(zhí)行處理器。而如今,它已經(jīng)成為世界上最優(yōu)秀的Tensor處理器,但它只是一個(gè)芯片,要做高性能的計(jì)算處理還需要軟件。因?yàn)槊恳粡圓I計(jì)算的圖片都是不一樣的,并且每一張圖片在指定處理器上為了達(dá)到性能的調(diào)優(yōu),都必須進(jìn)行編譯解碼。
當(dāng)然,你還有另一個(gè)選擇,就是為每一個(gè)神經(jīng)網(wǎng)絡(luò)都可以設(shè)計(jì)一個(gè)專(zhuān)門(mén)的FPGA,只是設(shè)計(jì)起來(lái)很困難,工作量也很大。如果市場(chǎng)上沒(méi)有人可以為你提供一個(gè)可編程的、推理的加速器,F(xiàn)PGA就成了唯一的選擇。這也是為什么幾年前,BAT對(duì)自己的人工智能推理進(jìn)行加速時(shí),只能通過(guò)定制FPGA來(lái)實(shí)現(xiàn)。而現(xiàn)在有了TensorRT,就為企業(yè)提供了非常大的便利。
記者:TensorRT與TPU的性能對(duì)比有什么優(yōu)勢(shì)?
黃仁勛:TPU只有一款,并且只支持Tensorflow,而GPU還可以支持其它的任務(wù),如視頻編解碼、圖像處理等等。比如在上午演示的《權(quán)力的游戲》影片中,GPU就可以做視頻的解碼,并根據(jù)解碼進(jìn)行搜索。GPU可以做的事情比TPU多得多。正因?yàn)槲覀冇蠺ensorRT,GPU架構(gòu)又是完全靈活可編程的,支持任何人工智能的框架如TensorFlow、Microsoft Cognitive Tookit、MXNet、PyTorch、Caffe2、PaddlePaddle 、Theano等等,因此,從長(zhǎng)遠(yuǎn)來(lái)看,我們認(rèn)為能夠針對(duì)深度學(xué)習(xí)進(jìn)行優(yōu)化的GPU能夠獲得最大的成功。
記者:英偉達(dá)在選擇投資的公司時(shí)會(huì)有什么樣的考慮?
黃仁勛:英偉達(dá)投資的公司非常多,我們?cè)谶x擇時(shí)有三個(gè)基本標(biāo)準(zhǔn):一是與英偉達(dá)有一樣的愿景和目標(biāo),二是這些公司確實(shí)需要英偉達(dá)的幫助(這一點(diǎn)是我們非常看重的),三是這個(gè)公司本身必須是非常優(yōu)秀的公司。
記者:英偉達(dá)在與很多大型企業(yè)合作的同時(shí)也在與許多創(chuàng)業(yè)公司合作,在這個(gè)過(guò)程中英偉達(dá)的目的是?
黃仁勛:英偉達(dá)提供的是一個(gè)平臺(tái),希望賦予其它公司更多的能力,希望大家都成功。作為一個(gè)平臺(tái)提供者,我們的任務(wù)主要是為了讓平臺(tái)不斷升級(jí)、與時(shí)俱進(jìn)。同時(shí),這個(gè)平臺(tái)是開(kāi)放的,任何一個(gè)人和公司都可以進(jìn)來(lái)。英偉達(dá)不是自閉公司,也不是垂直的集成公司,而是一個(gè)開(kāi)放的平臺(tái)公司。我們非常樂(lè)于與大眾、豐田合作、奧迪這樣的大型企業(yè)合作,同時(shí)也非常希望與很多初創(chuàng)企業(yè)合作,我們甚至還在與空客合作,因?yàn)槲覀冋J(rèn)為如果能發(fā)明出一個(gè)可以飛的汽車(chē),這是非??岬摹N艺J(rèn)為,英偉達(dá)所做的這些事沒(méi)有“愛(ài)”是無(wú)法做成的。
記者:英偉達(dá)在自動(dòng)駕駛領(lǐng)域是如何布局的?
黃仁勛:對(duì)于英偉達(dá)自動(dòng)駕駛來(lái)說(shuō),DRIVE PX是硬件基礎(chǔ),DRIVE OS是操作系統(tǒng),DRIVEWORKS SDK是API,而DRIVE AV是最頂層的無(wú)人駕駛應(yīng)用,把所有的這些結(jié)合在一起我們統(tǒng)稱(chēng)為英偉達(dá)的DRIVE。以上說(shuō)的每一個(gè)層面都可以單獨(dú)開(kāi)放,適用于不同類(lèi)型、不同公司的需求。你可以選擇用DRIVE PX硬件基礎(chǔ),其它部分自己開(kāi)發(fā),也可以選擇用DRIVE AV應(yīng)用,其它底層堆棧自己搭建,這些都是沒(méi)有問(wèn)題的。
我們認(rèn)為,自動(dòng)駕駛在未來(lái)是一個(gè)非常大的市場(chǎng),中國(guó)也有很多在算法或是認(rèn)知等領(lǐng)域非常擅長(zhǎng)的公司,眾人拾柴火焰高,我們也希望能夠與更多的公司在這方面展開(kāi)合作。
記者:汽車(chē)電子產(chǎn)品對(duì)于使用環(huán)境的要求非常高,您認(rèn)為如果要推出符合L5自動(dòng)駕駛級(jí)別的汽車(chē),價(jià)格適合大眾需求,同時(shí)可以量產(chǎn),還需要多長(zhǎng)時(shí)間?
黃仁勛:我認(rèn)為這在不到10年時(shí)間內(nèi)就會(huì)實(shí)現(xiàn),自動(dòng)駕駛汽車(chē)是軟件定義的,這要比現(xiàn)在“黑盒子式”行車(chē)電腦的汽車(chē)生產(chǎn)起來(lái)要方便得多。我們看到現(xiàn)在的汽車(chē)的儀表板、無(wú)線(xiàn)電系統(tǒng)、后視鏡等都是獨(dú)立的,而未來(lái)自動(dòng)駕駛汽車(chē)的“超級(jí)電腦”各個(gè)功能都是軟件定義的,軟件是輕量級(jí)的、綠色的,更便于設(shè)計(jì)和使用。
記者:英偉達(dá)是否看好自動(dòng)駕駛在中國(guó)的發(fā)展前景?未來(lái)在中國(guó)還將投資哪些領(lǐng)域的公司?
黃仁勛:事實(shí)上,英偉達(dá)最核心的業(yè)務(wù)還是GPU計(jì)算,這是英偉達(dá)的基礎(chǔ),它正在被用于各種各樣的應(yīng)用領(lǐng)域,比如科學(xué)探索發(fā)現(xiàn)、計(jì)算圖譜、人工智能等等。因此,英偉達(dá)提供的是一個(gè)基于GPU計(jì)算的服務(wù)。
我們目前重點(diǎn)關(guān)注的垂直領(lǐng)域是人工智能和交通運(yùn)輸行業(yè)。我們認(rèn)為,交通運(yùn)輸行業(yè)不只包括交通工具,還包括了人工智能化的交通,所以滴滴是一家大型的人工智能公司。未來(lái),無(wú)論是物流、還是交通,所有海陸空的領(lǐng)域都可以是自主的,都可以是人工智能的。這一點(diǎn)是非常重要的。
英偉達(dá)已經(jīng)有三個(gè)非常大、有潛力的業(yè)務(wù)的市場(chǎng),即游戲、人工智能和交通運(yùn)輸。,三個(gè)市場(chǎng)本身的體量非常大。未來(lái)我們關(guān)注的重點(diǎn)是醫(yī)療衛(wèi)生和健康產(chǎn)業(yè),我們希望幫助健康產(chǎn)業(yè)從三個(gè)方面實(shí)現(xiàn)變革:首先是新藥研發(fā),包括新藥制造本身的研發(fā),以及通過(guò)人工智能技術(shù)讓醫(yī)生以更少的成本和時(shí)間發(fā)現(xiàn)哪些新藥是可以對(duì)癥的;其二是疾病的早期檢測(cè),這就涉及到醫(yī)療影像問(wèn)題;其三,新藥臨床效果的實(shí)驗(yàn)中大規(guī)模取樣的問(wèn)題。我們認(rèn)為在這三個(gè)健康產(chǎn)業(yè)的重要問(wèn)題之上,人工智能都是大有所為的,并且這個(gè)時(shí)間很快就會(huì)到來(lái)。
仔細(xì)想一下,無(wú)論是交通、物流還是醫(yī)療領(lǐng)域,很多很多以前我們認(rèn)為不能解決的問(wèn)題,通過(guò)人工智能都在慢慢被解決。這就是為什么我們說(shuō)未來(lái)將變得難以置信的原因。
記者:發(fā)展自動(dòng)駕駛,安全問(wèn)題如何考慮?
黃仁勛:安全分為兩個(gè)概念,一種是人身的安全、一種是系統(tǒng)安全。對(duì)于車(chē)而言,如果車(chē)被黑了,人的安全也會(huì)受到威脅,這才是最關(guān)鍵的。其實(shí),如果一個(gè)黑客黑了一臺(tái)車(chē),本身這個(gè)問(wèn)題并不大,但如果把威脅擴(kuò)大到云端,通過(guò)云來(lái)控制所有的車(chē),就比較危險(xiǎn)了。當(dāng)然我們也可以通過(guò)各種方法降低這樣的風(fēng)險(xiǎn),未來(lái)想黑一臺(tái)車(chē)并不那么容易,因?yàn)槊颗_(tái)車(chē)都是有防火墻的,我們也會(huì)給傳輸?shù)男畔⒆黾用埽诳兔滥敲慈菀缀诘酵ㄓ嵍丝凇?/p>
記者:AR相關(guān)的技術(shù)發(fā)展與人工智能有哪些交叉?
黃仁勛:我們上午介紹的虛擬機(jī)器人訓(xùn)練環(huán)境是為了機(jī)器人學(xué)習(xí)而創(chuàng)造的在虛擬世界,本身就是虛擬現(xiàn)實(shí)。但如果要讓人進(jìn)入到虛擬環(huán)境去對(duì)機(jī)器人進(jìn)行訓(xùn)練,還需要用到很多其它的技術(shù)。總體而言,AI和AR兩者是互補(bǔ)的,互相不可或缺。未來(lái)的AI需要AR,未來(lái)的AR也需要AI。
記者:既然AI領(lǐng)域是多個(gè)領(lǐng)域技術(shù)的結(jié)合,英偉達(dá)會(huì)考慮用什么樣的方式促進(jìn)這方面的發(fā)展?
黃仁勛:英偉達(dá)是一家平臺(tái)公司,這也意味著必須與很多生態(tài)內(nèi)的公司進(jìn)行合作,并在這個(gè)過(guò)程中提供自己最為專(zhuān)長(zhǎng)的技術(shù)。
記者:英偉達(dá)將如何與學(xué)界展開(kāi)合作,共同推動(dòng)ai領(lǐng)域的發(fā)展?
黃仁勛:事實(shí)上,英偉達(dá)最初做人工智能時(shí)就是把它當(dāng)作學(xué)術(shù)研究而不是業(yè)務(wù)。5-7年前,深度學(xué)習(xí)取得的進(jìn)展主要都是由大學(xué)主導(dǎo)的,如斯坦福、多倫多、紐約大學(xué)等等。因此,我們認(rèn)為在人工智能領(lǐng)域,學(xué)術(shù)領(lǐng)域的作用是非常大的。目前,英偉達(dá)也在與全球?qū)W術(shù)界的研究人員展開(kāi)深度合作,與他們共同做開(kāi)發(fā)、為他們的研究項(xiàng)目提供資金,甚至也邀請(qǐng)這些學(xué)者到英偉達(dá)進(jìn)行研究,我們把它稱(chēng)為英偉達(dá)人工智能實(shí)驗(yàn)室。在中國(guó),我們也與中科院、清華、香港中文大學(xué)正在展開(kāi)合作。
好文章,需要你的鼓勵(lì)
新加坡國(guó)立大學(xué)研究團(tuán)隊(duì)開(kāi)發(fā)了SPIRAL框架,通過(guò)讓AI與自己對(duì)弈零和游戲來(lái)提升推理能力。實(shí)驗(yàn)顯示,僅訓(xùn)練AI玩簡(jiǎn)單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無(wú)需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟(jì)大學(xué)團(tuán)隊(duì)開(kāi)發(fā)的GIGA-ToF技術(shù)通過(guò)融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機(jī)噪聲問(wèn)題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實(shí)現(xiàn)37.9%的精度提升,并在真實(shí)設(shè)備上展現(xiàn)出色泛化能力,為機(jī)器人、AR和自動(dòng)駕駛等領(lǐng)域提供更可靠的3D視覺(jué)解決方案。
伊利諾伊大學(xué)研究團(tuán)隊(duì)通過(guò)對(duì)比實(shí)驗(yàn)發(fā)現(xiàn),經(jīng)過(guò)強(qiáng)化學(xué)習(xí)訓(xùn)練的視覺(jué)語(yǔ)言模型雖然表現(xiàn)出"頓悟時(shí)刻"現(xiàn)象,但這些自我糾錯(cuò)行為并不能實(shí)際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗(yàn)證差距",即生成答案的能力強(qiáng)于驗(yàn)證答案質(zhì)量的能力,且模型在自我驗(yàn)證時(shí)無(wú)法有效利用視覺(jué)信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機(jī)構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過(guò)動(dòng)態(tài)稀疏性實(shí)現(xiàn)大語(yǔ)言模型訓(xùn)練加速1.6倍,計(jì)算成本降低2.2倍。該方法使用SVD稀疏性估計(jì)器智能選擇重要計(jì)算部分,在保持模型性能的同時(shí)顯著提升訓(xùn)練效率,已在多個(gè)任務(wù)上驗(yàn)證有效性。