作者:高飛
配圖:Diffusion Models
新職業(yè)的誕生,總是因為有新技術(shù)的出現(xiàn)。即使人類最早的職業(yè)——農(nóng)民,也是在新石器時代,伴隨著有了打磨成型的石頭而產(chǎn)生的。
再往后看,第一次工業(yè)革命時代的紡織工人,發(fā)報員,第二次工業(yè)革命時代的電工,列車員,第三次工業(yè)革命時代的打字員,程序員,也都是如此。
有意思的是,時代和職業(yè),其實是互相成就的。我們既可以說新產(chǎn)業(yè)變革創(chuàng)造了新的職業(yè)。也可以從另外一個角度說,出現(xiàn)了新的職業(yè),或者完全重塑了舊職業(yè),才能叫進入了一個真正的產(chǎn)業(yè)新時代。
10年前,從德國提出工業(yè)4.0(2013年)開始,一種“我們已經(jīng)進入以人工智能技術(shù)等驅(qū)動的第四次工業(yè)革命”的提法流行開來。
但是,這個第四次工業(yè)革命,和同樣是信息技術(shù)驅(qū)動的第三次工業(yè)革命,其實一直以來界限都非常的模糊。似乎是個被“工業(yè)4.0”概念催生出來的產(chǎn)物。
很重要的一點是,在第四次工業(yè)革命被提了十年之后,并沒有創(chuàng)造任何主流的新職業(yè),也談不上重塑了什么舊職業(yè)(除了帶貨主播,但這也是互聯(lián)網(wǎng)的產(chǎn)物,和AI并沒什么關(guān)系)。
所以,第四次工業(yè)革命其實非常像是一個概念噱頭。
直到2022年11月,在注意力機制(self-attention)推動的ChatGPT發(fā)布后,在擴散模型(Diffusion Models)等推動的AI繪圖工具PK了人類畫師之后,上述提到的疑問都將不復(fù)存在了。
因為這些ChatBot,和一系列AIGC新工具,正在創(chuàng)造人類歷史的新職業(yè),快速重塑、甚至顛覆人類既有存在的傳統(tǒng)職業(yè)。
這個新職業(yè)的特點是,讓人們能夠利用自然語言,作為提示詞,與AI進行交互,得到信息,或創(chuàng)造作品。
這是人類歷史上,從未做做到過的事情,其意義堪比200年前,拜倫的女兒Ada成了人類歷史第一個程序員(不過那時,程序員顯然還未能成為一個職業(yè))。
所以,是時候為這個新職業(yè)起一個名字了。
在英文的語境下,因新技術(shù)的誕生,誕生了很多er結(jié)尾的新職業(yè)(新族群),比如Hacker,Blogger,Podcaster,Geeker。
這些職業(yè)翻成中文,都是用的音譯,巧合的是,還都以客結(jié)尾,分別是黑客、博客、播客、極客。
不過,這一次伴隨AIGC而來的新職業(yè),尚未得到廣泛的認同和關(guān)注。英文稱謂也沒有統(tǒng)一。有人用Prompter描述AI作畫者,但似乎不適用于AI Chat。
我覺得“問客”可能是個好名字。
因為,ChatGPT等AIGC背后的智能本質(zhì)上是個黑盒子,所以用戶-使用者是同等的創(chuàng)新者。
所以“提問”,也就是“問AI”才是這些新職業(yè)的核心。
鑒于愛因斯坦曾經(jīng)說,提出一個問題往往比解決一個問題更重要。
我們應(yīng)該把第四次工業(yè)革命的新職業(yè)叫做“問客”。
第四次工業(yè)革命,也將因為“問客”的誕生,有了自身真實存在的證明。
好文章,需要你的鼓勵
新加坡國立大學(xué)研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓(xùn)練AI玩簡單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟大學(xué)團隊開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實現(xiàn)37.9%的精度提升,并在真實設(shè)備上展現(xiàn)出色泛化能力,為機器人、AR和自動駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團隊通過對比實驗發(fā)現(xiàn),經(jīng)過強化學(xué)習(xí)訓(xùn)練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質(zhì)量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動態(tài)稀疏性實現(xiàn)大語言模型訓(xùn)練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓(xùn)練效率,已在多個任務(wù)上驗證有效性。