配圖|扈佃杰
創(chuàng)立一檔面向創(chuàng)新者的對話欄目,就必然要用一個“稱謂”來向創(chuàng)新者們致敬,而「行者」就是在我們腦海中蹦出的第一個詞——因為創(chuàng)新者毫無疑問是一批永遠在路上的人。同樣重要的,行動也是這個世界進步的本源,無論是自然世界的理解,還是人類自身的進步。莫不如是。
在古代,人類對宇宙的理解就源于對宇宙星辰「行動」的觀察。考古學(xué)家曾經(jīng)發(fā)現(xiàn)一塊距今大約5000年的古巴比倫時期的泥板,上面記錄著歷史上最早將天文運動和地球現(xiàn)象結(jié)合的印跡:
在這個月的第15天,整整三天,天空中尋不到這顆星星的蹤影。到了11月的第18天,它重新出現(xiàn)在東方。新的泉源涌出來,阿達德(古巴比倫的風暴之神)送來雨水……
在北京冬奧會的開幕式上,二十四節(jié)氣倒數(shù)驚艷了全場。而6年前聯(lián)合國教科文組織將二十四節(jié)氣列入「人類非物質(zhì)文化遺產(chǎn)代表作名錄」時,對它的描述也正是——中國古代通過觀察太陽周年運動而形成的知識實踐體系。
在現(xiàn)代,人類自身的遠足,更創(chuàng)造了一個個科技奇跡。50年前,人類自身向宇宙邁出了最遠的步伐,阿姆斯特朗踏上月表的第一步,“個人一小步,人類一大步”傳遍世界。去年八月,我們的「祝融號」已經(jīng)在火星上漫步了超過一千米。
與這些奇跡同時發(fā)生的,是一系列的新發(fā)明。地圖衛(wèi)星導(dǎo)航,真空吸塵器,空氣凈化器,數(shù)碼相機,甚至現(xiàn)代泳衣和隱形牙套......都是因太空遠足而伴隨創(chuàng)造的科技新物種,極大程度改變了人類社會和生產(chǎn)生活。
對舊事物的打破沒有止境,創(chuàng)新也就沒有止境,創(chuàng)新者的思考與行動也無止境。所以,我們希望與科技行者們對話,就像當年的巴比倫泥板一樣,用文字記錄下新發(fā)現(xiàn)和新洞察。
但同時,我們也希望找到那些更深刻的創(chuàng)新和更硬核的科技。在第四次工業(yè)革命和數(shù)字化轉(zhuǎn)型同時到來之際,我們眼中的創(chuàng)新者不是信息繭房的編織者,而是未來世界的拓荒者。如同資深創(chuàng)業(yè)者、也是風險投資家彼得·蒂爾所說:“人們想要一輛會飛的汽車,得到的卻是140個字符。”
「科技行者」,正在讓科技走得更遠,也讓科技離我們更近,我們通過對話,與他們同行。
好文章,需要你的鼓勵
騰訊ARC實驗室推出AudioStory系統(tǒng),首次實現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù),通過交錯式推理生成、解耦橋接機制和漸進式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準測試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時學(xué)習(xí)外觀和運動信息,顯著解決了當前視頻生成模型中動作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個線性層就能大幅提升運動質(zhì)量,在多項測試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實驗室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評測基準,通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時顯著提升人性化交互水平,為AI價值觀對齊提供了可行技術(shù)路徑。
谷歌DeepMind團隊開發(fā)的GraphCast是一個革命性的AI天氣預(yù)測模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報,準確性超越傳統(tǒng)方法90%的指標。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來了效率和精度的雙重突破。