沒什么比現(xiàn)階段的AI世界更熱鬧了,彼時ChatGPT的余溫尚未褪去,今年Sora又成為當紅炸子雞。而縱觀國內外市場,無論是大模型的涌現(xiàn)、還是多模態(tài)應用的爆發(fā),AI的內卷程度好似吃了養(yǎng)樂多一樣,活躍度刷滿。
如果再把時間線拉長,在過去十余年里,AI產(chǎn)業(yè)一路上行,其實背后都離不開一家關鍵的公司,那就是NVIDIA。一直以來,NVIDIA不僅提供GPU算力,也構建了一個圍繞產(chǎn)業(yè)運轉的應用生態(tài)平臺,讓其成為AI領域當之無愧的話題中心。比如2012年引爆深度學習的AlexNet,用到的是NVIDIA GTX 580;而2022年OpenAI訓練GPT-3時,用到的NVIDIA GPU芯片算力已經(jīng)達到當年的100萬倍。
于是在AI持續(xù)占領創(chuàng)新高地的同時,NVIDIA一年一度最重要的大會——「NVIDIA GTC」,就毫無疑問成為全球AI產(chǎn)業(yè)的風向標。
提及NVIDIA GTC,去年NVIDIA創(chuàng)始人兼CEO黃仁勛身穿標志性皮衣夾克直言“AI的iPhone時刻已來”的瞬間,或許還留在很多人的腦海里。而轉眼今年的GTC已來,于本周3月18日至21日在美國圣何塞舉行。
科技行者注意到,有位參會者在大會官網(wǎng)中這樣留言寫道:“GTC對新技術的開發(fā)提供了深刻的見解,為不遠的將來會發(fā)生什么提供了更廣泛的理解,并為采用新技術做好了準備”。
這段話提及了兩次“新技術”,一次是指新技術的開發(fā),另一次是指新技術的采用,剛好對應了新技術生命周期的兩個關鍵環(huán)節(jié):「創(chuàng)新涌現(xiàn)」和「場景落地」。
在GTC首日,有一個特別議程來自3月18日首播的 GTC 創(chuàng)業(yè)企業(yè)會議特輯——「AI創(chuàng)業(yè)的“繁花”時代」,其中集結了AI賽道的投資人、創(chuàng)業(yè)精兵、NVIDIA 初創(chuàng)加速計劃等各產(chǎn)業(yè)界各方,從不同視角出發(fā),共同探討參與幾個主要議題和環(huán)節(jié):
· AI創(chuàng)業(yè)企業(yè)在中國市場的發(fā)展與助力(北京時間3月18日-22日)
· 創(chuàng)業(yè)企業(yè)在生成式AI方向的實踐與分享(北京時間3月18日-22日)
· 2024年中國市場與創(chuàng)業(yè)企業(yè)的新機遇(北京時間3月18日-22日)
借此契機,科技行者獨家專訪了AI賽道上的3位投資人和17家創(chuàng)業(yè)公司,其中,17家創(chuàng)業(yè)公司由NVIDIA 初創(chuàng)加速計劃賦能,它們分別為:
七維科技、留形科技、Zilliz、必優(yōu)科技、碳硅智慧、三維家、潞晨科技、筷子科技、元戎啟行、影眸科技、蘇州圖達通、森云智能、IHS智觸、文遠知行、素鱗科技、途深智合、Oasa,分布在XR、短視頻、醫(yī)藥研發(fā)、自動駕駛、家居、AIGC等AI相關的各領域,而這當中的12家創(chuàng)業(yè)公司正在美國GTC 2024現(xiàn)場,進行布展和內容分享。
其中,七維科技作為一家數(shù)字內容引擎工具提供商,目前也將生成式AI技術與數(shù)字內容創(chuàng)作進行深度融合。公司創(chuàng)始人兼CEO殷元江分享說道,一部90分鐘的電影大致需要1700-2000個鏡頭,傳統(tǒng)的手繪方式通常需要一個5人團隊,3個月的時間才能完成,七維科技目前通過自研的分鏡故事板生成技術,可以在2周內完成多角度迭代20萬張分鏡圖,大幅提升了工作效率。分鏡故事板生成技術可廣泛應用于廣告拍攝、創(chuàng)意視頻制作、游戲、影視動畫、繪本漫畫等行業(yè)。“同時,七維科技作為國內XR虛擬制作技術的領軍企業(yè),生成式AI技術也被應用于其中。一張照片通過七維科技自研的AI擴圖、2.5D虛擬環(huán)境生成等技術,可以快速構建為XR拍攝所需要的虛擬環(huán)境,我們多個頭部客戶正在將這項技術應用到他們的XR虛擬拍攝的生產(chǎn)流程中。”
提及NVIDIA 初創(chuàng)加速計劃,創(chuàng)業(yè)者們感觸良多。Zilliz開發(fā)者關系及市場運營負責人李晨在采訪中指出:“NVIDIA 初創(chuàng)加速計劃無論從活動的策劃、組織還是執(zhí)行,都體現(xiàn)了專業(yè)和用心,把企業(yè)間的優(yōu)勢給予了充分機會去做展示,幫助大家宣傳品牌、拓展生態(tài)、對接業(yè)務。“
”我個人最喜歡的就是經(jīng)常性的路演活動,這種形式給了大家非常多的線下交流機會,也認識了很多同道中人,同時可以吸取各方面的寶貴經(jīng)驗,幫助自身做更大的提升。” 李晨介紹道,Zilliz一直致力于探索向量檢索領域的工程實踐,幫助企業(yè)在AI場景中去處理非結構化數(shù)據(jù);而在近一年內,Zilliz也幫助更多的AIGC用戶去更好的使用大模型,構建AI Native應用。
殷元江也有同感,他強調:“NVIDIA初創(chuàng)加速計劃對我們的幫助很大,不僅為我們提供了多次展示的平臺,包括但不限于中國移動全球合作伙伴大會、NVIDIA初創(chuàng)企業(yè)加速計劃的半程技術展示、Omniverse加速營分享等活動,還多次為我們推薦國內頭部的投資機構進行對接。”
而NVIDIA的技術創(chuàng)新,尤其是AI算力和生態(tài)平臺的構建,自然也包括為創(chuàng)業(yè)者提供加速賦能,將為AI場景落地,提供進一步的關鍵支持,推動AI更廣泛的商業(yè)化。
在此期間,我們也跟明勢資本合伙人夏令、青嵐資本創(chuàng)始合伙人康毅、寬帶資本合伙人劉唯聊了聊,捕捉到更多AI發(fā)展的趨勢性關鍵信息,幾乎所有人都認同,大語言模型是當下最值得關注的賽道。
一言以蔽之,在本屆NVIDIA GTC上,基礎設施創(chuàng)新、多模態(tài)AI、垂直行業(yè)應用將會交相輝映,譜寫AI創(chuàng)新的繁花時代華章。
附AI領域投資人寄語
寬帶資本合伙人劉唯:“AI和大語言模型是中國繼互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)之后的一波大的新的浪潮,對于創(chuàng)業(yè)者和投資人來說都是一個無限的機會,我們很有幸能夠參與其中。”
明勢資本合伙人夏令:“自動駕駛和大語言模型的突破背后,其實是端到端數(shù)據(jù)驅動新范式的驗證,我們期待并愿意支持端到端數(shù)據(jù)驅動新范式在多模態(tài)理解與生成、通用機器人、材料發(fā)現(xiàn)、藥物發(fā)現(xiàn)等領域的新突破。”
青嵐資本創(chuàng)始合伙人康毅:“未來已來,AI無限,讓我們在這個AI變革的時代共同努力。”
若了解更多詳情,請點擊鏈接,即可觀看完整版——《AI 創(chuàng)業(yè)的“繁花”時代|GTC 創(chuàng)業(yè)企業(yè)特別會議》:https://www.nvidia.cn/gtc-global/sessions/start-ups/?ncid=ref-vc-337569
好文章,需要你的鼓勵
新加坡國立大學研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓練AI玩簡單撲克游戲就能讓其數(shù)學推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學題目作為訓練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉移到數(shù)學解題中,為AI訓練提供了新思路。
同濟大學團隊開發(fā)的GIGA-ToF技術通過融合多幀圖像的"圖結構"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術利用圖像間的不變幾何關系,結合深度學習和數(shù)學優(yōu)化方法,在合成數(shù)據(jù)集上實現(xiàn)37.9%的精度提升,并在真實設備上展現(xiàn)出色泛化能力,為機器人、AR和自動駕駛等領域提供更可靠的3D視覺解決方案。
伊利諾伊大學研究團隊通過對比實驗發(fā)現(xiàn),經(jīng)過強化學習訓練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實際提升推理準確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構聯(lián)合提出SparseLoRA技術,通過動態(tài)稀疏性實現(xiàn)大語言模型訓練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓練效率,已在多個任務上驗證有效性。
關注科技創(chuàng)新、技術投資。
以文會友,左手硬核科技,右手浪漫主義。