CNET科技資訊網(wǎng) 7月5日 北京消息(文/周雅):“百度將All in AI,我們?cè)贏I時(shí)代的核心戰(zhàn)略就是開放賦能,我們的將來必須建立在與每個(gè)開發(fā)者共贏的基礎(chǔ)上。”今天,在百度AI開發(fā)者大會(huì)上,陸奇表示,“開發(fā)者的成功,就是百度的成功,這是百度AI平臺(tái)的核心價(jià)值觀。”
1、AI技術(shù)與其他技術(shù)的不同之處在于,數(shù)據(jù)起到了重要、特殊的作用。
我們必須通過系統(tǒng)+數(shù)據(jù),經(jīng)過學(xué)習(xí)和訓(xùn)練,來獲取能力;數(shù)據(jù)是觀察世界的橋梁,是觀察知識(shí)的載體,用好的算法,加上軟件和硬件,我們可以自動(dòng)從數(shù)據(jù)中獲取知識(shí)。
2、AI是新一代的計(jì)算平臺(tái)。
歷史上,計(jì)算平臺(tái)經(jīng)過好幾代的演變,從PC,到互聯(lián)網(wǎng),到移動(dòng),到云。每一代的技術(shù)平臺(tái)都由前端和后端構(gòu)成:前端主要是通過人機(jī)交互的能力來驅(qū)動(dòng),后端主要是由計(jì)算資源的規(guī)模來驅(qū)動(dòng)。AI時(shí)代的計(jì)算平臺(tái)將向前邁進(jìn)一大步。
AI平臺(tái)的后端是智能云,它不但提供大規(guī)模計(jì)算資源,還將提供大量的各個(gè)行業(yè)的知識(shí),比如醫(yī)療大腦、教育大腦、出行大腦……隨著海量數(shù)據(jù)的累積,智能云將提供越來越多的知識(shí)。
AI平臺(tái)的前端不再只是通用計(jì)算設(shè)備,它將由傳感器,硅晶片,智能軟件組成。每一臺(tái)冰箱、每一臺(tái)空調(diào)、每一臺(tái)電視、每一戶家庭、每一輛汽車……世界萬物,都可以成為端,都能聽、說、看,都能跟智能云連在一起,越來越聽得懂每一句話、看得懂每一張圖。
“AI平臺(tái)將是社會(huì)的巨大的推動(dòng)力,與互聯(lián)網(wǎng)時(shí)代相比,它能把我們的社會(huì)進(jìn)入一個(gè)喚醒萬物新世界。”陸奇表示。
3、AI是中國(guó)的歷史性機(jī)遇。
目前世界43%的AI論文由華人撰寫;我們有足夠大的技術(shù)積累,中國(guó)的互聯(lián)網(wǎng)公司在AI核心技術(shù)上做了早期的著陸和長(zhǎng)期的研發(fā);我們有大量的資金;我們有世界上最大、最活躍的用戶群,中國(guó)的網(wǎng)民規(guī)模達(dá)7.3億;我們有良好的政策環(huán)境,AI在今年兩會(huì)人工智能已經(jīng)列入了政府工作報(bào)告。中國(guó)有結(jié)構(gòu)化的優(yōu)勢(shì),因?yàn)橹袊?guó)能提供更多更好的數(shù)據(jù)資源,為AI發(fā)展提供強(qiáng)大的驅(qū)動(dòng)力。
“中國(guó)可以再一次領(lǐng)先世界!”陸奇說。
4、百度是一家AI公司,核心能力是AI技術(shù)、數(shù)據(jù)和人才。
百度用AI來提升我們搜索、信息流、手機(jī)百度等現(xiàn)有的核心業(yè)務(wù),用AI來建設(shè)金融服務(wù)、智能云、DuerOS、自動(dòng)駕駛汽車等一系列基于AI的新業(yè)務(wù)。
5、百度AI生態(tài)戰(zhàn)略的方向,是建立和引領(lǐng)新一代的AI計(jì)算平臺(tái)。
在前端,百度將提供DuerOS,它是中國(guó)領(lǐng)先的基于自然語言的新一代的交互平臺(tái),能讓每一個(gè)設(shè)備、器件都能聽得懂、交互、提供有效的服務(wù);
在百度戰(zhàn)略上還有一個(gè)特殊的端是汽車,百度將提供Apollo——全球第一個(gè)自動(dòng)駕駛開放平臺(tái);
在后端,百度將提供百度大腦和百度智能云,為開發(fā)者提供一流的AI開發(fā)工具和有效的AI行業(yè)解決方案。
綜合而言,DuerOS、Apollo、百度大腦和百度智能云等綜合在一起,將成為一個(gè)強(qiáng)大的AI生態(tài),為中國(guó)的AI發(fā)展提供越來越多的推動(dòng)力和貢獻(xiàn)。
好文章,需要你的鼓勵(lì)
新加坡國(guó)立大學(xué)研究團(tuán)隊(duì)開發(fā)了SPIRAL框架,通過讓AI與自己對(duì)弈零和游戲來提升推理能力。實(shí)驗(yàn)顯示,僅訓(xùn)練AI玩簡(jiǎn)單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟(jì)大學(xué)團(tuán)隊(duì)開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機(jī)噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實(shí)現(xiàn)37.9%的精度提升,并在真實(shí)設(shè)備上展現(xiàn)出色泛化能力,為機(jī)器人、AR和自動(dòng)駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團(tuán)隊(duì)通過對(duì)比實(shí)驗(yàn)發(fā)現(xiàn),經(jīng)過強(qiáng)化學(xué)習(xí)訓(xùn)練的視覺語言模型雖然表現(xiàn)出"頓悟時(shí)刻"現(xiàn)象,但這些自我糾錯(cuò)行為并不能實(shí)際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗(yàn)證差距",即生成答案的能力強(qiáng)于驗(yàn)證答案質(zhì)量的能力,且模型在自我驗(yàn)證時(shí)無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機(jī)構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動(dòng)態(tài)稀疏性實(shí)現(xiàn)大語言模型訓(xùn)練加速1.6倍,計(jì)算成本降低2.2倍。該方法使用SVD稀疏性估計(jì)器智能選擇重要計(jì)算部分,在保持模型性能的同時(shí)顯著提升訓(xùn)練效率,已在多個(gè)任務(wù)上驗(yàn)證有效性。