作者 | 周雅
來源 | 科技行者
每年開春,谷歌的員工都會(huì)緊鑼密鼓地籌備五月份的I/O,這樣的節(jié)奏至今已持續(xù)到第16年。
今年的Google I/O 2024將于美東時(shí)間5月14日-15日在加州山景城的Shoreline Amphitheatre舉行,這個(gè)地點(diǎn)距離谷歌總部不遠(yuǎn),是I/O的常駐地。
Mike Pegg曾在2011年至2017年期間負(fù)責(zé)谷歌I/O的營(yíng)銷,他表示:“I/O代表了谷歌為開發(fā)者提供的所有服務(wù)。”過去幾年里,谷歌經(jīng)歷了一些里程碑式的時(shí)刻,比如2008年Android發(fā)布,或2011年宣布支持HTML 5。
而回顧去年的I/O,最重磅的內(nèi)容莫過于AI屆的大事件——Gemini的誕生,從目前的進(jìn)展來看,谷歌正在試圖把Gemini應(yīng)用到其所有服務(wù)中:搜索、地圖、照片、視頻、Gmail、Google Docs 等等工具。當(dāng)然,谷歌也一直在將AI功能融入到谷歌助手中,所以,我們有理由期待今年的I/O,Gemini究竟會(huì)進(jìn)化到什么階段。
當(dāng)然,更不用說的是。今年的I/O也是一場(chǎng)被競(jìng)爭(zhēng)對(duì)手忌憚的大會(huì)。以至于OpenAI要提前一天搞一場(chǎng)截胡式的發(fā)布,發(fā)布了多模態(tài)AI助手,并將更新后的ChaGPT-4o模型免費(fèi)對(duì)外提供。
屆時(shí),科技行者也會(huì)奔赴Google I/O 2024帶來現(xiàn)場(chǎng)報(bào)道。
不過,期待之余,回到I/O本身,它有什么含義?從公開資料來看,這里有兩種常見的說法:
一種解釋是,I/O代表“輸入/輸出”(Input/Output)。指的是計(jì)算機(jī)系統(tǒng)與外部世界連接的計(jì)算概念。
第二種解釋是,I/O代表“開放式創(chuàng)新”(Innovation in the Open)。谷歌會(huì)關(guān)注AI前沿研究、下一代產(chǎn)品、全新的交互方式等。
這兩個(gè)起源都是官方認(rèn)可的說法,但I(xiàn)/O的歷史卻還有更多故事值得挖掘,呼應(yīng)起源的內(nèi)涵。
I/O的歷史,可追溯到2006年5月,當(dāng)時(shí)谷歌舉辦了第一場(chǎng)開發(fā)者大會(huì),即Geo developer Day。它圍繞谷歌第一個(gè)公開可用的開發(fā)者工具,即2005年推出的谷歌地圖API。這次活動(dòng)在谷歌山景城園區(qū)的Googleplex舉行,只有100名與會(huì)者,規(guī)模很小。
一年后,谷歌的開發(fā)者工具套件大幅擴(kuò)展——谷歌需要一個(gè)更大的活動(dòng)來展示產(chǎn)品,同時(shí)還要與不斷成長(zhǎng)的開發(fā)者社區(qū)互動(dòng)。于是,I/O有了雛形。
圖為2008年的原始I/O商標(biāo),連接器的風(fēng)格設(shè)計(jì)暗含了“輸入/輸出”概念
不過,當(dāng)時(shí)的I/O還不是“I/O”。“2007年的第一場(chǎng)‘I/O’根本就不叫I/O,”活動(dòng)和體驗(yàn)運(yùn)營(yíng)總監(jiān)、最初的I/O活動(dòng)組織者之一洛林·柏拉圖(Lorin Platto)說:
“我們?cè)谑ズ稳麜?huì)議中心辦了一場(chǎng)名為谷歌開發(fā)者日的活動(dòng),為開發(fā)者提供了1000張門票。”當(dāng)時(shí),谷歌的工程師和產(chǎn)品專家介紹了關(guān)于開發(fā)者工具的會(huì)議。“圣何塞的活動(dòng)只開放了一個(gè)小時(shí)就滿載了。那年的我們才意識(shí)到,接下來的一年,我們真的需要把這個(gè)活動(dòng)提升一個(gè)檔次,”洛林說。
直到2008年,該活動(dòng)搬到了一個(gè)更大的場(chǎng)地——舊金山莫斯科尼中心西部,并有了使用至今的正式名稱:Google I/O。
這些年過去,I/O早已經(jīng)成為谷歌的一部分,甚至是I/O這個(gè)名字,其實(shí)也可以追溯到谷歌Google的命名。
谷歌Google的名字,來源于英語單詞 "googol”,它其實(shí)是一個(gè)具體的數(shù)字,等于 10 的 100 次方,即1后面跟著100個(gè)零。這個(gè)數(shù)字,由美國(guó)數(shù)學(xué)家愛德華·卡斯納的9歲侄子米爾頓·西羅塔在1938年提出。米爾頓試圖找到一個(gè)無窮大但有限的數(shù)字名稱,于是想到了googol。
當(dāng)年,谷歌創(chuàng)始人拉里·佩奇和謝爾蓋·布林在1997年注冊(cè)了谷歌的域名,也想過很多名字,最終敲定了 "googol" 作為公司名。但可惜在注冊(cè)域名時(shí),"googol" 這個(gè)詞已被注冊(cè),于是將其改為"Google",并在公司成立后沿用至今。
“googol是一個(gè)1,后面跟著100個(gè)0,這也是I/O名稱和標(biāo)志的來源。我們只是取了第一個(gè)和0,把其他的0都去掉了。”洛林說。“當(dāng)我們頭腦風(fēng)暴時(shí),就在想這個(gè)1和0意味著什么。這就是「輸入/輸出」和「開放式創(chuàng)新」口號(hào)的由來。”
googol(縮寫):前兩位數(shù)字給出了I/O的名稱
總之,I/O的含義和Google名字的由來,這么看下來可能有點(diǎn)繞,但這也是谷歌一貫的風(fēng)格。畢竟,谷歌一直有著在瀏覽器里植入各種節(jié)日彩蛋的傳統(tǒng),比如大家都熟知的“復(fù)活節(jié)彩蛋”,這或許就是這家公司科技中的人文氣息。
“從一開始,我們就希望I/O能引起開發(fā)者社區(qū)的共鳴,”洛林說。
Mike也補(bǔ)充道:“I/O現(xiàn)在已經(jīng)不僅是一場(chǎng)開發(fā)者大會(huì),更是谷歌所做的一切、以及我們想要與世界分享的一切的絕佳展示。當(dāng)谷歌CEO桑達(dá)爾·皮查伊上臺(tái)說,‘大家早上好,歡迎來到Google I/O’的時(shí)候,就像是在說,‘我們的創(chuàng)新來了。’”
好文章,需要你的鼓勵(lì)
新加坡國(guó)立大學(xué)研究團(tuán)隊(duì)開發(fā)了SPIRAL框架,通過讓AI與自己對(duì)弈零和游戲來提升推理能力。實(shí)驗(yàn)顯示,僅訓(xùn)練AI玩簡(jiǎn)單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟(jì)大學(xué)團(tuán)隊(duì)開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機(jī)噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實(shí)現(xiàn)37.9%的精度提升,并在真實(shí)設(shè)備上展現(xiàn)出色泛化能力,為機(jī)器人、AR和自動(dòng)駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團(tuán)隊(duì)通過對(duì)比實(shí)驗(yàn)發(fā)現(xiàn),經(jīng)過強(qiáng)化學(xué)習(xí)訓(xùn)練的視覺語言模型雖然表現(xiàn)出"頓悟時(shí)刻"現(xiàn)象,但這些自我糾錯(cuò)行為并不能實(shí)際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗(yàn)證差距",即生成答案的能力強(qiáng)于驗(yàn)證答案質(zhì)量的能力,且模型在自我驗(yàn)證時(shí)無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機(jī)構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動(dòng)態(tài)稀疏性實(shí)現(xiàn)大語言模型訓(xùn)練加速1.6倍,計(jì)算成本降低2.2倍。該方法使用SVD稀疏性估計(jì)器智能選擇重要計(jì)算部分,在保持模型性能的同時(shí)顯著提升訓(xùn)練效率,已在多個(gè)任務(wù)上驗(yàn)證有效性。
關(guān)注科技創(chuàng)新、技術(shù)投資。
以文會(huì)友,左手硬核科技,右手浪漫主義。