配圖|扈佃杰
創(chuàng)立一檔面向創(chuàng)新者的對話欄目,就必然要用一個“稱謂”來向創(chuàng)新者們致敬,而「行者」就是在我們腦海中蹦出的第一個詞——因為創(chuàng)新者毫無疑問是一批永遠在路上的人。同樣重要的,行動也是這個世界進步的本源,無論是自然世界的理解,還是人類自身的進步。莫不如是。
在古代,人類對宇宙的理解就源于對宇宙星辰「行動」的觀察??脊艑W家曾經(jīng)發(fā)現(xiàn)一塊距今大約5000年的古巴比倫時期的泥板,上面記錄著歷史上最早將天文運動和地球現(xiàn)象結合的印跡:
在這個月的第15天,整整三天,天空中尋不到這顆星星的蹤影。到了11月的第18天,它重新出現(xiàn)在東方。新的泉源涌出來,阿達德(古巴比倫的風暴之神)送來雨水……
在北京冬奧會的開幕式上,二十四節(jié)氣倒數(shù)驚艷了全場。而6年前聯(lián)合國教科文組織將二十四節(jié)氣列入「人類非物質(zhì)文化遺產(chǎn)代表作名錄」時,對它的描述也正是——中國古代通過觀察太陽周年運動而形成的知識實踐體系。
在現(xiàn)代,人類自身的遠足,更創(chuàng)造了一個個科技奇跡。50年前,人類自身向宇宙邁出了最遠的步伐,阿姆斯特朗踏上月表的第一步,“個人一小步,人類一大步”傳遍世界。去年八月,我們的「祝融號」已經(jīng)在火星上漫步了超過一千米。
與這些奇跡同時發(fā)生的,是一系列的新發(fā)明。地圖衛(wèi)星導航,真空吸塵器,空氣凈化器,數(shù)碼相機,甚至現(xiàn)代泳衣和隱形牙套......都是因太空遠足而伴隨創(chuàng)造的科技新物種,極大程度改變了人類社會和生產(chǎn)生活。
對舊事物的打破沒有止境,創(chuàng)新也就沒有止境,創(chuàng)新者的思考與行動也無止境。所以,我們希望與科技行者們對話,就像當年的巴比倫泥板一樣,用文字記錄下新發(fā)現(xiàn)和新洞察。
但同時,我們也希望找到那些更深刻的創(chuàng)新和更硬核的科技。在第四次工業(yè)革命和數(shù)字化轉型同時到來之際,我們眼中的創(chuàng)新者不是信息繭房的編織者,而是未來世界的拓荒者。如同資深創(chuàng)業(yè)者、也是風險投資家彼得·蒂爾所說:“人們想要一輛會飛的汽車,得到的卻是140個字符。”
「科技行者」,正在讓科技走得更遠,也讓科技離我們更近,我們通過對話,與他們同行。
好文章,需要你的鼓勵
新加坡國立大學研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓練AI玩簡單撲克游戲就能讓其數(shù)學推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學題目作為訓練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉移到數(shù)學解題中,為AI訓練提供了新思路。
同濟大學團隊開發(fā)的GIGA-ToF技術通過融合多幀圖像的"圖結構"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術利用圖像間的不變幾何關系,結合深度學習和數(shù)學優(yōu)化方法,在合成數(shù)據(jù)集上實現(xiàn)37.9%的精度提升,并在真實設備上展現(xiàn)出色泛化能力,為機器人、AR和自動駕駛等領域提供更可靠的3D視覺解決方案。
伊利諾伊大學研究團隊通過對比實驗發(fā)現(xiàn),經(jīng)過強化學習訓練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實際提升推理準確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質(zhì)量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構聯(lián)合提出SparseLoRA技術,通過動態(tài)稀疏性實現(xiàn)大語言模型訓練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓練效率,已在多個任務上驗證有效性。