7月25日,WAIC 2025前一天,階躍星辰發(fā)布會現(xiàn)場人頭攢動,階躍星辰在這場發(fā)布會上正式對外發(fā)布了Step 3大模型。
值得一提的是,大模型正在重塑產(chǎn)業(yè)格局,上海更是在積極布局人工智能產(chǎn)業(yè),在WAIC 2025上,甚至邀請來了人工智能巨星杰弗里·辛頓親臨現(xiàn)場做主題演講。
此外,據(jù)悉,上海人工智能產(chǎn)業(yè)規(guī)模達到4500億元,規(guī)上企業(yè)超過400家,與此同時,上海還打造了大模型陣地模速空間。
在此次發(fā)布會上,階躍星辰還官宣,上海國投將參與階躍星辰下一輪融資,這也間接公布了階躍星辰的融資節(jié)奏。
01 三大發(fā)布:三代大模型、與上海國投合作、成立生態(tài)聯(lián)盟
實際上階躍星辰在大會上,對外進行了三大發(fā)布。
第一項發(fā)布正是第三代基礎大模型Step 3。
據(jù)發(fā)布會上公布信息顯示,階躍星辰的這一代基礎大模型將在7月31日面向全球開源,并已經(jīng)成為全球最強開源多模態(tài)大模型。
模型推理效率以前有很多工作,deepseek主要是針對H芯片進行了優(yōu)化設計,針對更多國產(chǎn)算力優(yōu)化和適配,Step 3從一開始就將這一問題考慮在內(nèi)。
階躍星辰創(chuàng)始人、CEO姜大昕在大會上指出,針對某國產(chǎn)卡32K上下文,這代模型推理效率最高可達到deepseek R1的300%,實測H卡分布式推理,吞吐同樣提升了70%。
第二項發(fā)布是,階躍星辰與上海國有資本投資有限公司的深度戰(zhàn)略合作。
據(jù)悉,上海國投也將參與階躍星辰接下來的新一輪融資。
之所以會有這樣的簽約,姜大昕給出的主要原因是階躍星辰在商業(yè)化上做出的成績。
據(jù)姜大昕介紹,階躍星辰商業(yè)化今年的目標是10億元,目前階躍星辰的大模型已經(jīng)在智能手機、汽車、金融、內(nèi)容、城市治理方面相繼落地。
第三項發(fā)布是,成立“模芯生態(tài)創(chuàng)新聯(lián)盟”。
姜大昕指出,如何降低推理成本已經(jīng)成為決定大模型應用滲透率的關鍵問題,而要降低成本,本質(zhì)上就是要提升算力的應用效率。
為此,階躍星辰將聯(lián)合10家芯片廠商、算力平臺成立模型生態(tài)創(chuàng)新聯(lián)盟。
在大會現(xiàn)場,我們看到,階躍星辰邀請來了華為、沐曦、遂原科技、壁仞科技、無問芯穹、天數(shù)智芯相關負責人到場,參與了聯(lián)盟成立儀式。
這一聯(lián)盟也將成為國內(nèi)大模型又一個推動大模型應用快速落地的聯(lián)合體。
02 什么是最適合應用的大模型?
什么是最適合應用的大模型,這是整個行業(yè)一直在思考的問題,也是姜大昕過去幾年一直在思考的問題。
在此次發(fā)布會上,姜大昕將最適合應用的大模型總結(jié)為“多、開、好、省”四大“黃金法則”:
“多”是指多模態(tài),雖然關于大模型數(shù)學和代碼能力的評測榜單層出不窮,但是姜大昕認為,在大量的大模型應用場景,多模態(tài)才是剛需;
“開”是指開源,開源模型不僅有利于私有化部署,還可以很方便地進行后訓練和微調(diào),這樣也才能幫助模型更好地適應下游應用的各種需求;
“好”是指模型能力要夠好,不僅要有豐富的知識、善解人意,還要有嚴謹?shù)倪壿嬆芰投嗖酵评砟芰?,特別是今年年初deepseek的發(fā)布,讓強推理能力成為當下大模型的標配;
“省”是指成本要盡可能低,在模型能力足夠好的前提下,成本要盡可能低也是用戶最真實的需求。
正因如此,姜大昕,階躍星辰此次發(fā)布的Step 3正是為了填補這一市場空白。
在現(xiàn)場,姜大昕就Step 3的感知能力、應用能力進行了實測,讓大模型自主定位模糊菜單上的無骨鴨掌的價格,Step 3在現(xiàn)場演示視頻中進行了很好的定位。此外,還用上千個token測試了Step 3的性能。
總而言之,階躍星辰認為,Step 3就是現(xiàn)在最強的多模態(tài)開源大模型。
針對不同的應用場景,階躍星辰此次還發(fā)布了一個Step模型全家桶,包括圖像理解、圖像生成、視頻理解、視頻生成、語音、音樂在內(nèi)的多模態(tài)場景,都有Step相應的模型最支撐。
不難發(fā)現(xiàn),如今的階躍星辰將自己的焦點聚焦到了開源多模態(tài)大模型,這也是國內(nèi)“AI六小虎”之一的階躍星辰,為自己找的一條大模型商業(yè)化應用落地的重要路徑。
好文章,需要你的鼓勵
騰訊ARC實驗室推出AudioStory系統(tǒng),首次實現(xiàn)AI根據(jù)復雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術,通過交錯式推理生成、解耦橋接機制和漸進式訓練,能夠?qū)碗s指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準測試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學聯(lián)合研發(fā)的VideoJAM技術,通過讓AI同時學習外觀和運動信息,顯著解決了當前視頻生成模型中動作不連貫、違反物理定律的核心問題。該技術僅需添加兩個線性層就能大幅提升運動質(zhì)量,在多項測試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實用化應用奠定了重要基礎。
上海AI實驗室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓練數(shù)據(jù)集和MM-AlignBench評測基準,通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術能力的同時顯著提升人性化交互水平,為AI價值觀對齊提供了可行技術路徑。
谷歌DeepMind團隊開發(fā)的GraphCast是一個革命性的AI天氣預測模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預報,準確性超越傳統(tǒng)方法90%的指標。該模型采用圖神經(jīng)網(wǎng)絡技術,通過學習40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預測方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學領域帶來了效率和精度的雙重突破。
關注智造、硬件、機器人。