沒什么比現(xiàn)階段的AI世界更熱鬧了,彼時(shí)ChatGPT的余溫尚未褪去,今年Sora又成為當(dāng)紅炸子雞。而縱觀國內(nèi)外市場,無論是大模型的涌現(xiàn)、還是多模態(tài)應(yīng)用的爆發(fā),AI的內(nèi)卷程度好似吃了養(yǎng)樂多一樣,活躍度刷滿。
如果再把時(shí)間線拉長,在過去十余年里,AI產(chǎn)業(yè)一路上行,其實(shí)背后都離不開一家關(guān)鍵的公司,那就是NVIDIA。一直以來,NVIDIA不僅提供GPU算力,也構(gòu)建了一個(gè)圍繞產(chǎn)業(yè)運(yùn)轉(zhuǎn)的應(yīng)用生態(tài)平臺(tái),讓其成為AI領(lǐng)域當(dāng)之無愧的話題中心。比如2012年引爆深度學(xué)習(xí)的AlexNet,用到的是NVIDIA GTX 580;而2022年OpenAI訓(xùn)練GPT-3時(shí),用到的NVIDIA GPU芯片算力已經(jīng)達(dá)到當(dāng)年的100萬倍。
于是在AI持續(xù)占領(lǐng)創(chuàng)新高地的同時(shí),NVIDIA一年一度最重要的大會(huì)——「NVIDIA GTC」,就毫無疑問成為全球AI產(chǎn)業(yè)的風(fēng)向標(biāo)。
提及NVIDIA GTC,去年NVIDIA創(chuàng)始人兼CEO黃仁勛身穿標(biāo)志性皮衣夾克直言“AI的iPhone時(shí)刻已來”的瞬間,或許還留在很多人的腦海里。而轉(zhuǎn)眼今年的GTC已來,于本周3月18日至21日在美國圣何塞舉行。
科技行者注意到,有位參會(huì)者在大會(huì)官網(wǎng)中這樣留言寫道:“GTC對新技術(shù)的開發(fā)提供了深刻的見解,為不遠(yuǎn)的將來會(huì)發(fā)生什么提供了更廣泛的理解,并為采用新技術(shù)做好了準(zhǔn)備”。
這段話提及了兩次“新技術(shù)”,一次是指新技術(shù)的開發(fā),另一次是指新技術(shù)的采用,剛好對應(yīng)了新技術(shù)生命周期的兩個(gè)關(guān)鍵環(huán)節(jié):「創(chuàng)新涌現(xiàn)」和「場景落地」。
在GTC首日,有一個(gè)特別議程來自3月18日首播的 GTC 創(chuàng)業(yè)企業(yè)會(huì)議特輯——「AI創(chuàng)業(yè)的“繁花”時(shí)代」,其中集結(jié)了AI賽道的投資人、創(chuàng)業(yè)精兵、NVIDIA 初創(chuàng)加速計(jì)劃等各產(chǎn)業(yè)界各方,從不同視角出發(fā),共同探討參與幾個(gè)主要議題和環(huán)節(jié):
· AI創(chuàng)業(yè)企業(yè)在中國市場的發(fā)展與助力(北京時(shí)間3月18日-22日)
· 創(chuàng)業(yè)企業(yè)在生成式AI方向的實(shí)踐與分享(北京時(shí)間3月18日-22日)
· 2024年中國市場與創(chuàng)業(yè)企業(yè)的新機(jī)遇(北京時(shí)間3月18日-22日)
借此契機(jī),科技行者獨(dú)家專訪了AI賽道上的3位投資人和17家創(chuàng)業(yè)公司,其中,17家創(chuàng)業(yè)公司由NVIDIA 初創(chuàng)加速計(jì)劃賦能,它們分別為:
七維科技、留形科技、Zilliz、必優(yōu)科技、碳硅智慧、三維家、潞晨科技、筷子科技、元戎啟行、影眸科技、蘇州圖達(dá)通、森云智能、IHS智觸、文遠(yuǎn)知行、素鱗科技、途深智合、Oasa,分布在XR、短視頻、醫(yī)藥研發(fā)、自動(dòng)駕駛、家居、AIGC等AI相關(guān)的各領(lǐng)域,而這當(dāng)中的12家創(chuàng)業(yè)公司正在美國GTC 2024現(xiàn)場,進(jìn)行布展和內(nèi)容分享。
其中,七維科技作為一家數(shù)字內(nèi)容引擎工具提供商,目前也將生成式AI技術(shù)與數(shù)字內(nèi)容創(chuàng)作進(jìn)行深度融合。公司創(chuàng)始人兼CEO殷元江分享說道,一部90分鐘的電影大致需要1700-2000個(gè)鏡頭,傳統(tǒng)的手繪方式通常需要一個(gè)5人團(tuán)隊(duì),3個(gè)月的時(shí)間才能完成,七維科技目前通過自研的分鏡故事板生成技術(shù),可以在2周內(nèi)完成多角度迭代20萬張分鏡圖,大幅提升了工作效率。分鏡故事板生成技術(shù)可廣泛應(yīng)用于廣告拍攝、創(chuàng)意視頻制作、游戲、影視動(dòng)畫、繪本漫畫等行業(yè)。“同時(shí),七維科技作為國內(nèi)XR虛擬制作技術(shù)的領(lǐng)軍企業(yè),生成式AI技術(shù)也被應(yīng)用于其中。一張照片通過七維科技自研的AI擴(kuò)圖、2.5D虛擬環(huán)境生成等技術(shù),可以快速構(gòu)建為XR拍攝所需要的虛擬環(huán)境,我們多個(gè)頭部客戶正在將這項(xiàng)技術(shù)應(yīng)用到他們的XR虛擬拍攝的生產(chǎn)流程中。”
提及NVIDIA 初創(chuàng)加速計(jì)劃,創(chuàng)業(yè)者們感觸良多。Zilliz開發(fā)者關(guān)系及市場運(yùn)營負(fù)責(zé)人李晨在采訪中指出:“NVIDIA 初創(chuàng)加速計(jì)劃無論從活動(dòng)的策劃、組織還是執(zhí)行,都體現(xiàn)了專業(yè)和用心,把企業(yè)間的優(yōu)勢給予了充分機(jī)會(huì)去做展示,幫助大家宣傳品牌、拓展生態(tài)、對接業(yè)務(wù)。“
”我個(gè)人最喜歡的就是經(jīng)常性的路演活動(dòng),這種形式給了大家非常多的線下交流機(jī)會(huì),也認(rèn)識(shí)了很多同道中人,同時(shí)可以吸取各方面的寶貴經(jīng)驗(yàn),幫助自身做更大的提升。” 李晨介紹道,Zilliz一直致力于探索向量檢索領(lǐng)域的工程實(shí)踐,幫助企業(yè)在AI場景中去處理非結(jié)構(gòu)化數(shù)據(jù);而在近一年內(nèi),Zilliz也幫助更多的AIGC用戶去更好的使用大模型,構(gòu)建AI Native應(yīng)用。
殷元江也有同感,他強(qiáng)調(diào):“NVIDIA初創(chuàng)加速計(jì)劃對我們的幫助很大,不僅為我們提供了多次展示的平臺(tái),包括但不限于中國移動(dòng)全球合作伙伴大會(huì)、NVIDIA初創(chuàng)企業(yè)加速計(jì)劃的半程技術(shù)展示、Omniverse加速營分享等活動(dòng),還多次為我們推薦國內(nèi)頭部的投資機(jī)構(gòu)進(jìn)行對接。”
而NVIDIA的技術(shù)創(chuàng)新,尤其是AI算力和生態(tài)平臺(tái)的構(gòu)建,自然也包括為創(chuàng)業(yè)者提供加速賦能,將為AI場景落地,提供進(jìn)一步的關(guān)鍵支持,推動(dòng)AI更廣泛的商業(yè)化。
在此期間,我們也跟明勢資本合伙人夏令、青嵐資本創(chuàng)始合伙人康毅、寬帶資本合伙人劉唯聊了聊,捕捉到更多AI發(fā)展的趨勢性關(guān)鍵信息,幾乎所有人都認(rèn)同,大語言模型是當(dāng)下最值得關(guān)注的賽道。
一言以蔽之,在本屆NVIDIA GTC上,基礎(chǔ)設(shè)施創(chuàng)新、多模態(tài)AI、垂直行業(yè)應(yīng)用將會(huì)交相輝映,譜寫AI創(chuàng)新的繁花時(shí)代華章。
附AI領(lǐng)域投資人寄語
寬帶資本合伙人劉唯:“AI和大語言模型是中國繼互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)之后的一波大的新的浪潮,對于創(chuàng)業(yè)者和投資人來說都是一個(gè)無限的機(jī)會(huì),我們很有幸能夠參與其中。”
明勢資本合伙人夏令:“自動(dòng)駕駛和大語言模型的突破背后,其實(shí)是端到端數(shù)據(jù)驅(qū)動(dòng)新范式的驗(yàn)證,我們期待并愿意支持端到端數(shù)據(jù)驅(qū)動(dòng)新范式在多模態(tài)理解與生成、通用機(jī)器人、材料發(fā)現(xiàn)、藥物發(fā)現(xiàn)等領(lǐng)域的新突破。”
青嵐資本創(chuàng)始合伙人康毅:“未來已來,AI無限,讓我們在這個(gè)AI變革的時(shí)代共同努力。”
若了解更多詳情,請點(diǎn)擊鏈接,即可觀看完整版——《AI 創(chuàng)業(yè)的“繁花”時(shí)代|GTC 創(chuàng)業(yè)企業(yè)特別會(huì)議》:https://www.nvidia.cn/gtc-global/sessions/start-ups/?ncid=ref-vc-337569
好文章,需要你的鼓勵(lì)
騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng),首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù),通過交錯(cuò)式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時(shí)學(xué)習(xí)外觀和運(yùn)動(dòng)信息,顯著解決了當(dāng)前視頻生成模型中動(dòng)作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個(gè)線性層就能大幅提升運(yùn)動(dòng)質(zhì)量,在多項(xiàng)測試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評測基準(zhǔn),通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平,為AI價(jià)值觀對齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊(duì)開發(fā)的GraphCast是一個(gè)革命性的AI天氣預(yù)測模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào),準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來了效率和精度的雙重突破。
關(guān)注科技創(chuàng)新、技術(shù)投資。
以文會(huì)友,左手硬核科技,右手浪漫主義。