科技行者 10月29日 北京消息(文/Miss周):似乎一夜之間,人工智能(AI)滲透進了我們的生活,這種滲透力無疑是革命性的。看新聞或者網(wǎng)購時,它根據(jù)算法推送你喜歡的內(nèi)容;出行時,它通過大數(shù)據(jù)避開所有擁堵的道路;企業(yè)辦公時,它又化身為智能化與高效率的集合體……從家庭到商業(yè)場景,AI不斷進步,智能設(shè)備快速涌現(xiàn),它們甚至無需一直連接云端,就已經(jīng)具備看、聽、說、抉擇、預(yù)測的能力。
你或許會問,AI誕生數(shù)十年,為何遲遲才落地?這背后的推動力來自于技術(shù)能力的指數(shù)級增長(如摩爾定律)、智慧的分析引擎及數(shù)據(jù)激增等。與之相對應(yīng)的,算力、算法、數(shù)據(jù)被視為人工智能的“三駕馬車”,三者相輔相成,算法是關(guān)鍵,數(shù)據(jù)是前提,算力是支撐。在過去幾年里,我們知道AI比以前使用了更多的算力,如同 OpenAI 最近的一份報告所述,自2012年以來,AI訓(xùn)練運行(從 AlexNet 到 AlphaGo Zero)使用的計算量呈指數(shù)增長,為3.5個月的倍增時間(相比之下,摩爾定律有18個月的倍增期),該指標增長了300,000多個(18個月的倍增期僅增長了12倍)。OpenAI 因此得出,計算的改進是人工智能進步的關(guān)鍵因素。
圖片來自O(shè)penAI公開報告
正如華為IT產(chǎn)品線副總裁黃瑾最近在2018華為全聯(lián)接大會(HUAWEI CONNECT)上所說:“算力開啟AI的未來”,AI正在改變軟件開發(fā)的方式,有些人把它叫做軟件2.0,例如傳統(tǒng)的翻譯軟件擁有超過50萬行的代碼,但通過合適的AI訓(xùn)練之后,只需500行代碼就能搞定。“如果你有更多的算力來實現(xiàn)更多層的神經(jīng)網(wǎng)絡(luò),那你就會獲得更準確的結(jié)果。算力會創(chuàng)造新的可能。”
然而擺在產(chǎn)業(yè)眼前的一個難題是,隨著AI應(yīng)用的普及,傳統(tǒng)通過數(shù)據(jù)中心提供集中式處理的算力,已經(jīng)不能滿足自動駕駛等大帶寬、低時延場景的需求。
于是,華為Atlas智能計算平臺應(yīng)運而生,它提供了端、邊、云的分級計算能力,既為AI應(yīng)用創(chuàng)造了更多的可能性,也降低了企業(yè)應(yīng)用AI的門檻。
提及Atlas,很多人第一印象或許是古希臘神話中的擎天巨神,他用雙肩支撐蒼天,仿佛有無窮的神力。而華為將自己的智能計算平臺取名“Atlas”,背后的寓意呼之欲出:希望它能像擎天巨神一樣提供無窮的計算力。
華為Atlas智能云硬件平臺首次出現(xiàn)于2017華為全聯(lián)接大會上,當時它使出一系列“殺手锏”——資源池化、異構(gòu)計算、秒級部署:支持GPU、HDD、SSD、FPGA等資源池化,根據(jù)業(yè)務(wù)模型按需提供硬件資源,提升一半資源利用率,同時降低客戶使用成本。
與之相比,今年亮相的Atlas智能計算平臺有了“升級”,它將華為Ascend(昇騰)系列AI處理器和業(yè)界主流異構(gòu)計算部件,封裝成模塊、板卡、小站、一體機等產(chǎn)品形態(tài),包括面向端側(cè)的Atlas 200 AI加速模塊、面向數(shù)據(jù)中心側(cè)的Atlas 300 AI加速卡、面向邊緣側(cè)的Atlas 500智能小站、及定位于企業(yè)領(lǐng)域一站式AI平臺的Atlas 800 AI一體機。
Atlas從云硬件平臺到智能計算平臺的演進不難看出,華為對于AI有自己的思考:一是緊盯AI產(chǎn)品的算力,采用智能異構(gòu)、端邊云協(xié)同等關(guān)鍵技術(shù),為AI加速。二是豐富產(chǎn)品形態(tài),以適應(yīng)更多應(yīng)用場景,形成完整的AI解決方案。華為IT產(chǎn)品線副總裁兼IT智能計算業(yè)務(wù)部總裁邱隆接受科技行者采訪時介紹,“去年的Atlas,是一個服務(wù)器;今年的Atlas,是一個基礎(chǔ)的異構(gòu)計算平臺,是一個完整的系統(tǒng)”。Atlas的核心價值就在于,它是整個華為的AI全棧底層平臺,上層是華為人工智能硬件框架、華為人工智能云的軟件平臺,再往上是面向行業(yè)的人工智能全棧(這部分華為與合作伙伴共同搭建),由此一個完整的AI解決方案就建立了。
Atlas不僅可以提供人工智能所需的計算能力,還可以做到對于這些計算能力隨時進行動態(tài)的調(diào)整與分配。延伸到AI應(yīng)用場景也同理,比如企業(yè)某些應(yīng)用需要強大的算力,它可以調(diào)配豐富的計算資源;而同時其他應(yīng)用需要龐大的存儲資源,它也可以靈活調(diào)度,而這種調(diào)度可以做到“秒級”。而且,為了讓企業(yè)更加方便地獲取異構(gòu)計算服務(wù),讓AI“跑在云上”,Atlas也應(yīng)用于華為公有云中。
實際案例中,華為與平安城市合作,利用Atlas硬件平臺和人工智能的分布式加速算法,實現(xiàn)了從一千億量級的圖片庫中“秒級搜索”,從千億量級的關(guān)系分析中“秒級響應(yīng)”。
如上文所述,Atlas用它的“算力”雙肩支撐更多的AI應(yīng)用場景。
· Atlas 200 AI加速模塊(基于Ascend 310芯片):半張信用卡大小即可支持16路高清視頻實時分析,面向攝像頭、無人機等端側(cè)設(shè)備部署,功耗僅10W左右。它的主要價值有兩處,一是把以前沒有人工智能的產(chǎn)品,改造成人工智能的產(chǎn)品;二是一些小產(chǎn)品可以直接內(nèi)嵌此模塊實現(xiàn)人工智能。
· Atlas 300 AI加速卡:采用標準的半高半長PCIe卡設(shè)計,面向數(shù)據(jù)中心和邊緣側(cè)服務(wù)器場景。該加速卡支持多種數(shù)據(jù)精度,單卡即可提供64TOPS INT8計算性能,為深度學(xué)習(xí)和推理提供更強大算力。
· Atlas 500智能小站:集成AI處理能力的邊緣產(chǎn)品,機頂盒大小即可實現(xiàn)16路高清視頻處理能力,相比業(yè)界產(chǎn)品性能提升4倍。智能小站適用于交通、看護、無人零售、智能制造等廣闊的領(lǐng)域。
“這應(yīng)該是業(yè)界第一款真正能夠商用的智能小站。”邱隆說,Atlas 500的優(yōu)勢在于環(huán)境適應(yīng)性好,適合邊緣環(huán)境部署,云邊協(xié)同。
· Atlas 800 AI一體機(支持Ascend 310、Ascend 910):在標準框架和編程環(huán)境之上,提供經(jīng)過優(yōu)化的AI環(huán)境,并預(yù)安裝底層軟件庫,2小時開箱即用。同時,AI一體機集成華為集群管理、任務(wù)調(diào)度等管理軟件與系統(tǒng)級性能監(jiān)控系統(tǒng),可大幅降低企業(yè)AI應(yīng)用門檻。
毫無疑問,AI已經(jīng)且將繼續(xù)改變我們的生活和工作,而華為正在試圖通過Atlas為AI的應(yīng)用落地按下快進鍵,或許此時,我們也將更接近普惠的AI。
好文章,需要你的鼓勵
新加坡國立大學(xué)研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓(xùn)練AI玩簡單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟大學(xué)團隊開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實現(xiàn)37.9%的精度提升,并在真實設(shè)備上展現(xiàn)出色泛化能力,為機器人、AR和自動駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團隊通過對比實驗發(fā)現(xiàn),經(jīng)過強化學(xué)習(xí)訓(xùn)練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實際提升推理準確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質(zhì)量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動態(tài)稀疏性實現(xiàn)大語言模型訓(xùn)練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓(xùn)練效率,已在多個任務(wù)上驗證有效性。