作者|周雅
“人工智能將在人類文明進化中,發(fā)揮非常深遠的作用。”7月6日,特斯拉CEO埃隆·馬斯克在2023世界人工智能大會(WAIC2023)開幕式上如是說。
在約9分鐘的發(fā)言中,馬斯克的話題主要圍繞自動駕駛、特斯拉、中國AI產業(yè)三方面來談,其中核心觀點包括:
1、機器人的數(shù)量未來將多于人類。
2、特斯拉Optimus人形機器人目前處于開發(fā)階段。
3、特斯拉在今年晚些時候將實現(xiàn)完全自動駕駛。
4、特斯拉愿意開放自動駕駛技術許可給汽車制造商。
5、中國一旦下決定做事就一定能做好,AI產業(yè)也一樣。
以下為馬斯克發(fā)言內容實錄(經編輯):
上海的朋友們,大家好!
人工智能將在人類文明進化中,發(fā)揮非常深遠的作用。當前,數(shù)字計算的能力爆炸式增長,關鍵要考慮的一個指標是「比例」,就是數(shù)字計算和生物計算的比例。而實際上,數(shù)字計算的比例每年增高。這意味著隨著時間推移,相對于機器,人類智力在地球上的總思維能力中所占的比例將越來越小。
這將是一場深刻的變革,我認為,人類正處于最深遠的變革時期之一。
未來,地球上會有大量的機器人。一個值得思考的問題還是「比例」,隨著時間推移,機器人與人類的比例會是多少?在將來某個時刻,二者的比例可能超過1:1,這意味著機器人的數(shù)量將超過人類數(shù)量,而且它們的計算能力要強很多。這一發(fā)展趨勢已經十分明顯。
積極的一面是,人類將生活在一個富足的時代,人們想要的任何商品和服務都可以立刻獲得。在擁有大量機器人的未來世界里,全球的生產效率將會提高到令人難以置信的水平,這是非常大的變化。當然,我們需要非常謹慎地對待,確保機器人對人類是有益的。
我相信,特斯拉將在這一進程中扮演重要的角色。特斯拉人形機器人Optimus還在開發(fā)階段,其目標是幫助人們完成無聊的、重復的、危險的工作,完成人類不愿做的瑣碎工作。因此,它不需要很高的智能水平就可以勝任這些工作。
人工智能的一個重要應用是汽車的自動駕駛。在自動駕駛方面,特斯拉非常有興趣將自動駕駛技術許可授權給其他汽車制造商,自動駕駛是一個非常有用的技術,可以把人們從枯燥的駕駛中解放出來,給人們更多的時間。
同時,自動駕駛將大大提升車輛的利用率。一般情況下,一輛普通乘用車每周使用時長大概是10-12個小時,多數(shù)時間都在停車場趴著,而一輛擁有完全自動駕駛能力的汽車,每周的使用時間可以達到50-60小時。所以,「完全自動駕駛汽車」比「非自動駕駛汽車」的使用率翻了將近5倍。在特斯拉,我們也想提供這樣的技術,特斯拉希望將這一類技術分享給更多企業(yè)使用。
目前,特斯拉的技術已經非常接近完全自動駕駛的狀態(tài)。在美國道路上進行測試的特斯拉車輛,已經很少需要人工干預了。因此,當我們駕駛一輛具備最新版本完全自動駕駛系統(tǒng)測試版的特斯拉,從A地到B地,幾乎不需要人為操控。
我猜測,特斯拉可能在今年晚些時候就具備L4或L5級的完全自動駕駛能力。我以前也做過預測,都錯了,但是我覺得此刻做的這個預測,比以往任何時候都更接近于現(xiàn)實。
相比自動駕駛、特斯拉人形機器人等“有局限的”人工智能,通用人工智能(AGI, Artificial General Intelligence)完全不一樣。
通用人工智能是一種計算機智能,它能比人類在任何一個領域所做的都更聰明。這并非特斯拉目前專攻的領域,有其他公司正在研究。但我認為,這也是我們應該擔憂的領域。這種深度人工智能,有點像是幾萬臺、幾十萬臺、甚至幾百萬臺最先進的計算機,一起協(xié)作產生組合的超級智能。
我們需要有監(jiān)管措施,來確保這些計算機都可以協(xié)同并有序工作,以成就一個單一的綜合“超級智能” (ASI, Artificial Super Intelligence) 。
未來,“超級智能”將比人類更有能力,也同時存在著風險。我們應該盡一切可能,確保擔憂的風險不會發(fā)生,迎接積極的未來。
在中國,有非常多的聰明人、智慧的人,我一直非常欽佩中國人民的智慧和干勁。中國一旦下定決心要做一件事,一定都能把這個產業(yè)做得很好,這在各個經濟、各個領域都是如此,當然也包括人工智能產業(yè)。我相信,中國未來將擁有非常強大的人工智能能力,這是我的預測。
最后,感謝大會邀請我來做分享,希望我的觀點對大家有幫助, 非常期待下一屆能跟大家在線下見面!
好文章,需要你的鼓勵
新加坡國立大學研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓練AI玩簡單撲克游戲就能讓其數(shù)學推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學題目作為訓練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉移到數(shù)學解題中,為AI訓練提供了新思路。
同濟大學團隊開發(fā)的GIGA-ToF技術通過融合多幀圖像的"圖結構"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術利用圖像間的不變幾何關系,結合深度學習和數(shù)學優(yōu)化方法,在合成數(shù)據(jù)集上實現(xiàn)37.9%的精度提升,并在真實設備上展現(xiàn)出色泛化能力,為機器人、AR和自動駕駛等領域提供更可靠的3D視覺解決方案。
伊利諾伊大學研究團隊通過對比實驗發(fā)現(xiàn),經過強化學習訓練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實際提升推理準確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構聯(lián)合提出SparseLoRA技術,通過動態(tài)稀疏性實現(xiàn)大語言模型訓練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓練效率,已在多個任務上驗證有效性。
關注科技創(chuàng)新、技術投資。
以文會友,左手硬核科技,右手浪漫主義。