世界杯正熱,在這個信息爆炸時代,業(yè)界紛紛基于大數(shù)據(jù)預(yù)測比賽結(jié)果。一份來自奧地利維也納經(jīng)濟(jì)大學(xué)研究人員的公報聲稱,通過對網(wǎng)上博彩公司的長期賠率、各球隊的歷史表現(xiàn)和近期球員傷病情況分析,巴西隊問鼎世界杯勝算較大,奪冠幾率為巴西22.5%,阿根廷15.8%,德國13.4%。而美國微軟的必應(yīng)搜索在上周末開始進(jìn)行的八分之一決賽中,成功預(yù)測了巴西、哥倫比亞、荷蘭、哥斯達(dá)黎加、法國、德國、阿根廷、比利時八支球隊的晉級。
然而,東西方對待科學(xué)技術(shù)的研究方法不同,不僅直接影響到當(dāng)前研究的方向和成果,同時也決定了國家和社會生活的變革走向。
7月4日,中關(guān)村創(chuàng)業(yè)論壇第108期在國家科學(xué)圖書館舉辦,針對“大數(shù)據(jù)時代,中美IT產(chǎn)業(yè)是否將‘分道揚鑣’”主題,信息管理專家、微軟高級程序員、通聯(lián)數(shù)據(jù)首席研究員涂子沛和神州數(shù)碼首席科學(xué)家、神州數(shù)碼工程院院長、教授級高級工程師謝耘分享了觀點。
涂子沛多年來在美國硅谷從事數(shù)據(jù)研究工作,洞悉美國IT產(chǎn)業(yè)的發(fā)展,他認(rèn)為,數(shù)據(jù)有三個來源,一個是測量,第二是記錄,第三是計算。
圖為信息管理專家、微軟高級程序員、通聯(lián)數(shù)據(jù)首席研究員涂子沛
在涂子沛看來,大數(shù)據(jù)有四個定律,第一個定律是“數(shù)據(jù)是人為的現(xiàn)象”,一切的數(shù)據(jù)都是人為收集的;第二個定律就是大數(shù)據(jù)定律,就是傳統(tǒng)的小數(shù)據(jù)+現(xiàn)代的大記錄。現(xiàn)在的大記錄就是指音頻、視頻,它的來源是源于記錄事件,傳統(tǒng)數(shù)據(jù)是來源于測量事件;第三個定律是,人類的政治、經(jīng)濟(jì)和技術(shù)生活是靠對數(shù)據(jù)的規(guī)定、解釋、處理和探索展開的。比如大數(shù)據(jù)電影《紙牌屋》;最后一條定律就是,數(shù)據(jù)驅(qū)動的世界,軟件在定義世界,而程序員在用代碼和數(shù)據(jù)重新定義世界流程。
在這樣的定律下,我們在邁向計算型的智能社會。涂子沛通過對美國谷歌無人駕駛汽車對大數(shù)據(jù)的采集和運用總結(jié)認(rèn)為:使用數(shù)據(jù)的巔峰形式是機器學(xué)習(xí),即通過向機器喂取數(shù)據(jù),讓機器產(chǎn)生智能,自動地為人類完成任務(wù)。涂子沛透露,下一本書《大停滯》,就在分析智能社會。
涂子沛最后總結(jié)道,這個時代用數(shù)據(jù)說話遠(yuǎn)遠(yuǎn)不夠,我們要改變思維方式。我們現(xiàn)在要從數(shù)據(jù)當(dāng)中尋找知識、啟迪、規(guī)律,用數(shù)據(jù)去預(yù)測未來,用數(shù)據(jù)去管理社會,但是這還不夠。我們還要用數(shù)據(jù)創(chuàng)新,像Google的無人駕駛汽車一樣,因為我們正在邁向一個智能型的社會,所有的創(chuàng)新都離不開數(shù)據(jù)。
謝耘是國內(nèi)整合IT服務(wù)提供商——神州數(shù)碼的首席科學(xué)家,對技術(shù)研究執(zhí)著而癡迷,其主持開發(fā)的“智慧城市”公共信息服務(wù)平臺目前已在國內(nèi)多個城市落地實踐。
圖為神州數(shù)碼首席科學(xué)家、神州數(shù)碼工程院院長、教授級高級工程師謝耘
通過分析10多年來國內(nèi)銀行對于數(shù)據(jù)的運用,謝耘提出:探討數(shù)據(jù)與主體的關(guān)系將成為未來IT應(yīng)用發(fā)展的一個最為重要的課題。他認(rèn)為,大數(shù)據(jù)引出的是大家對智能的遐想,通過對計算機系統(tǒng)而人腦內(nèi)部神經(jīng)網(wǎng)絡(luò)分析總結(jié)出,人們目前對智能本質(zhì)的理解還非常膚淺。
而人在實現(xiàn)智能的這條路上有三個基本方法:第一是形式上的模仿。因為我們發(fā)現(xiàn)人的神經(jīng)原是有巨量的神經(jīng)原,他們之間有大量的連接;第二個是機制模仿和機制替代。所謂機制模仿就是,完全按照人的大腦的方式去做事,比如下棋,計算機可以挑戰(zhàn)世界冠軍。而機制代替就是,當(dāng)不清楚人完成一件事的過程時,可以用另外一套機制來實現(xiàn)同樣的效果;第三個就是人類在追求智能化過程上,用機制來實現(xiàn)智能化過程的演變過程。
值得關(guān)注的是,兩位發(fā)言人不久前都在各自推出的新書中闡述了對IT產(chǎn)業(yè)及大數(shù)據(jù)的理解和思考。涂子沛《數(shù)據(jù)之巔》延續(xù)了在《大數(shù)據(jù)》中的論述;而謝耘的《轉(zhuǎn)折——眺望IT巔峰》以中國哲學(xué)的思維重新審視IT產(chǎn)業(yè)發(fā)展。前者從“數(shù)據(jù)”的視角分析美國的歷史,在數(shù)據(jù)應(yīng)用領(lǐng)域?qū)χ袊岢隽怂伎己徒ㄗh;后者則更專注于對“信息”本身的分析和利用,從哲學(xué)的角度審視IT產(chǎn)業(yè)的趨勢和未來,現(xiàn)場觀眾有幸現(xiàn)場聆聽了兩位作者的新鮮論述。
據(jù)悉,本次論壇由中關(guān)村科技園區(qū)管理委員會、中國科學(xué)院國家科學(xué)圖書館主辦,北京長風(fēng)信息技術(shù)產(chǎn)業(yè)聯(lián)盟、神州數(shù)碼“發(fā)現(xiàn)城市”創(chuàng)新論壇承辦,中關(guān)村社會組織聯(lián)合會協(xié)辦。是“中關(guān)村創(chuàng)業(yè)講壇”系列講座之一,柳傳志、李彥宏等多位科技界名人都曾在此活動中登臺演講。
為了營造良好的創(chuàng)新環(huán)境,中關(guān)村管委會從2010年1月5號開始舉辦中關(guān)村創(chuàng)業(yè)講壇,到現(xiàn)在為止已經(jīng)辦了107期,歷經(jīng)四年半。
好文章,需要你的鼓勵
騰訊ARC實驗室推出AudioStory系統(tǒng),首次實現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù),通過交錯式推理生成、解耦橋接機制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時學(xué)習(xí)外觀和運動信息,顯著解決了當(dāng)前視頻生成模型中動作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個線性層就能大幅提升運動質(zhì)量,在多項測試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實驗室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評測基準(zhǔn),通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時顯著提升人性化交互水平,為AI價值觀對齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊開發(fā)的GraphCast是一個革命性的AI天氣預(yù)測模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報,準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來了效率和精度的雙重突破。