AI芯片,是如今芯片市場最硬核的領域之一。
一般而言,AI芯片可分為兩種:云端AI芯片、終端AI芯片。通常,云端AI芯片有訓練和推理兩大應用場景,由于應用場景和需求相對統(tǒng)一,成功的云端AI芯片公司背后都有一個強大的生態(tài),行業(yè)壟斷程度高;而終端AI芯片,已經被廣泛應用于智慧城市、智能手機、自動駕駛和以智能家居為代表的AIoT等各類豐富場景中,相比云端AI芯片技術難度更低,市場相對靈活。
燧原科技,是少有的云端AI芯片創(chuàng)業(yè)公司。
作為一家成立僅3年的初創(chuàng)公司,燧原科技頭頂很多光環(huán):中國第一個同時擁有云端訓練+云端推理產品的初創(chuàng)企業(yè),被騰訊連續(xù)追投四輪的明星獨角獸……這些光環(huán)背后,是燧原科技更亮眼的成績單:創(chuàng)紀錄地用18個月,將技術門檻最高的AI訓練芯片“邃思”一次性流片成功。
7月7日,燧原科技最新發(fā)布第二代人工智能訓練產品——“邃思2.0”芯片、基于邃思2.0的“云燧T20”訓練加速卡和“云燧T21”訓練OAM模組,全面升級的“馭算TopsRider”軟件平臺以及全新的“云燧集群CloudBlazer Matrix”,成為國內首家發(fā)布第二代人工智能訓練產品組合的公司。
燧原科技創(chuàng)始人兼COO張亞林透露,到2023年,公司準備用5年時間打造三款訓練產品+三代推理計算產品。然而面對全球巨頭扎根比拼技術實力與生態(tài)系統(tǒng)的云端AI芯片市場,燧原如何走出自己的路?帶著疑問,科技行者專訪了燧原科技創(chuàng)始人兼COO張亞林,聊一聊這背后的底氣與野心。
科技行者:成立僅3年,總融資額超過30億人民幣,燧原科技吸引投資人的關鍵是什么?
張亞林:AI芯片市場需求持續(xù)攀升,行業(yè)發(fā)展的基本面非常好。一方面,隨著人工智能時代的快速發(fā)展,對算力提出了更高的要求,傳統(tǒng)CPU已經難以滿足人工智能高性能并行計算的需求,AI芯片的需求將日益擴大。
其次,AI賦能百業(yè)的當下,AI模型訓練所需的算力需求呈指數級增長。云計算、數據中心、5G建設等新基建產業(yè)提速,算力向云端集中,各行業(yè)對高算力AI芯片需求大幅提升。
最后,云端芯片是一片藍海市場,市場前景可期。據Gartner數據顯示,全球AI芯片市場規(guī)模在2021年達343億美元,預計在未來幾年內將有顯著增長,到2025年達到711億美元,年均復合增長25.3%。
而在這樣一個充滿機會的領域,燧原本身具備幾項優(yōu)勢:
科技行者:當初燧原剛創(chuàng)立,處于一個什么樣的市場環(huán)境,為什么會選擇云端AI芯片的賽道?又想要為行業(yè)解決什么問題?
張亞林:燧原在創(chuàng)立之初,就選擇做云端AI芯片,是因為看到了“天時地利人和”。
“天時”方面。CPU、GPU生態(tài)成熟,切入困難,但深度學習爆發(fā)式發(fā)展僅有7年的時間,這是一個更加開放的戰(zhàn)場,有更大的發(fā)展空間。另外AI算法創(chuàng)新使得架構創(chuàng)新,為提供趕超機會;燧原科技堅持原始創(chuàng)新的芯片架構和軟件生態(tài)建設,在知識產權和產品升級迭代上掌握自主的方向和節(jié)奏。
“地利”方面。這是做AI高端芯片的黃金時代,中國有廣泛應用、人口紅利、海量數據、市場機會,既有國家政策引領,也有資本給予支持,這使得創(chuàng)企有足夠的錢把高端人才、設備、工具聚合在一起,打造高端芯片。燧原科技擁有一支本土化的工程支持團隊,針對戰(zhàn)略場景的定制化合作,能夠更好地對接與深度適配國內的框架生態(tài)。
“人和”方面。首先,中國近20年在集成電路領域儲備了大量的集成電路人才,在輸出具有豐富技術實力和實戰(zhàn)經驗的人才團隊方面頗具優(yōu)勢,這也是燧原選擇背靠上海的重要原因。其次,上海和北京通過在AI領域的發(fā)展,可提供成熟算法、軟件、架構人才,使得燧原在AI和芯片的交叉賽道將人才聚集。除此之外,很多芯片人才希望將過去十幾年的經驗和智慧發(fā)揮出來,而燧原恰恰提供了這樣的平臺。
科技行者:AI芯片市場玩家眾多,燧原科技如何破局?
張亞林:燧原除了在產品戰(zhàn)略上,選擇投身自主創(chuàng)新AI芯片以外,其他優(yōu)勢還在于:第一,我們從創(chuàng)立之初就樹立了做大芯片、拼硬科技的旗幟,幫助我們吸引了很多志同道合的海內外青年才俊,他們有同樣的理想、同樣的抱負,同時有很強的能力做這件事,人才是最關鍵的。我們的初心吸引了很多高端的人才。你慢慢會發(fā)現(xiàn),未來會有更多的AI領域,或者說芯片領域的人才不斷加入。
第二,我們選擇構建自己的原始創(chuàng)新生態(tài)。芯片企業(yè)是人才密集、資本密集的行業(yè)。燧原從創(chuàng)立到今天走過三年,已經實現(xiàn)了AI訓練芯片的二次迭代,并且同很多行業(yè)伙伴建立合作關系,目標致力于構建原始創(chuàng)新的生態(tài)。我們也于近日宣布了燧原的“燎原計劃”,將生態(tài)建設和產品開發(fā)同步推進。
科技行者:隨著5G時代到來,越來越多的數據連接到網絡,數據類型日漸多元化,算力需求也日漸多元化,這對芯片產業(yè)會造成什么影響?我們又如何應對?
張亞林:5G的發(fā)展帶來了非常豐富的AI應用場景,對算力的需求與日俱增,也為專注于AI芯片開發(fā)的企業(yè)帶來巨大的契機,因為AI算力是以大芯片為支撐的,我們在AI算力大芯片方面同國外的發(fā)展起點相對比較接近。此外,我們也看到,隨著算力需求的增長,國家對人工智能、集成電路的發(fā)展也在提供越來越多的戰(zhàn)略支持,我們企業(yè)的研發(fā)環(huán)境越來越好。
市場的蓬勃發(fā)展會催生充分競爭,這也激勵著燧原科技不斷加強創(chuàng)新意識,堅持原始創(chuàng)新的芯片架構和軟件生態(tài)建設,在知識產權和產品升級迭代上掌握自主的方向和節(jié)奏。我們于2021世界人工智能大會期間,發(fā)布了第二代人工智能訓練產品,可以滿足超大模型要求的超大算力。集群的規(guī)模以及集群能夠提供的有效算力,是支持多樣化模型訓練的基礎?;诘?代云燧訓練加速卡強大的互聯(lián)能力,能夠以更高的集群性能提供更快的數據處理能力,也能夠有效降低基礎設施系統(tǒng)的整體復雜度和成本,從而為客戶提升價值。這也意味著燧原科技已經開始打造從國家層面出發(fā)的低碳的綠色數據中心,充分符合國家關于碳中和、碳達峰的政策導向,是未來發(fā)展趨勢。
科技行者:高科技產業(yè),人才是關鍵,芯片產業(yè)尤其如此,在推動產業(yè)人才培養(yǎng)方面,燧原科技做過哪些工作?
張亞林:燧原科技經過3年的飛速發(fā)展,目前團隊人數超過500人,90%以上從事研發(fā)。這也證明了公司員工對燧原的認可,未來公司也會繼續(xù)不遺余力地吸引更多的優(yōu)秀人才加入燧原團隊。
燧原科技非常重視并關懷每一位加入公司的同事,制定切實可行的個人發(fā)展計劃,希望每個人都可以在燧原的平臺上得到提升。此外,公司有豐富的職業(yè)通道,一方面為希望并有能力承擔更多責任、面臨更高挑戰(zhàn)的人員提供晉升機會,另一方面也可以為想嘗試新領域的同事提供內部轉崗的可能性,實現(xiàn)更好的自我。
科技行者:接下來,燧原科技的中期目標和長期目標分別是什么?
張亞林:中長期來看,燧原有精確的產品路線規(guī)劃。接下來,燧原會持續(xù)推進產品的迭代。AI云端訓練芯片市場是一片藍海,拼技術實力,我們必須以更快的迭代速度、更快的客戶反饋來進行產品迭代,才能在市場中進一步鞏固先發(fā)優(yōu)勢,建立自己的競爭優(yōu)勢。
此外,我們還會繼續(xù)堅持構建原始創(chuàng)新生態(tài),即燧原剛剛發(fā)布的燎原計劃。這是一個長期計劃,也是未來的目標。因為構建生態(tài),比起開發(fā)芯片要更復雜、時間更長,但我們一定會堅持做。
科技行者:我們注意到,燧原科技在2021世界人工智能大會上主辦了“AI·智能計算引領變革”論壇,能否簡單談談AI對于企業(yè)數字化轉型的意義。
張亞林:由燧原科技和之江實驗室共同主辦的“AI·智能計算引領變革”主題論壇通過主題演講和高峰對話的形式,從智能計算集群架構、賦能與生態(tài)入手,圍繞智能計算的前沿技術、應用落地和產學研賦能,展望未來人工智能在數字化轉型中的引領作用。
中國擁有最廣泛的應用場景數據,也有領先的算法,現(xiàn)在的算力基礎設施也在蓬勃地發(fā)展,如何讓三大要素真真正正的迎合未來發(fā)展趨勢?如何真正賦能千家萬戶的日常生活?各位專家從智能算力集群、綠色低碳算力發(fā)展、數據中心池化和互聯(lián)、云端部署運維調度等各個角度進行了分析,所有角度都談到了智能計算發(fā)展,我們也希望幾年之后每個老百姓或者商業(yè)客戶真正能分到特定的算力、可用到的算力,能夠真正賦能自己或者實現(xiàn)自己想要的生活愿景。
好文章,需要你的鼓勵
新加坡國立大學研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓練AI玩簡單撲克游戲就能讓其數學推理能力提升8.6%,通用推理提升8.4%,且無需任何數學題目作為訓練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉移到數學解題中,為AI訓練提供了新思路。
同濟大學團隊開發(fā)的GIGA-ToF技術通過融合多幀圖像的"圖結構"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術利用圖像間的不變幾何關系,結合深度學習和數學優(yōu)化方法,在合成數據集上實現(xiàn)37.9%的精度提升,并在真實設備上展現(xiàn)出色泛化能力,為機器人、AR和自動駕駛等領域提供更可靠的3D視覺解決方案。
伊利諾伊大學研究團隊通過對比實驗發(fā)現(xiàn),經過強化學習訓練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實際提升推理準確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構聯(lián)合提出SparseLoRA技術,通過動態(tài)稀疏性實現(xiàn)大語言模型訓練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓練效率,已在多個任務上驗證有效性。
關注科技創(chuàng)新、技術投資。
以文會友,左手硬核科技,右手浪漫主義。