科技行者 9月7日 北京消息(文/董培欣): 第九屆中國(天津濱海)國際生態(tài)城市論壇暨2018中國國際數(shù)字經(jīng)濟創(chuàng)新峰會于9月7日-8日在天津舉行。本會議由天津市濱海新區(qū)人民政府、中國經(jīng)濟體制改革研究會產(chǎn)業(yè)改革與企業(yè)發(fā)展委員會主辦。大會以“數(shù)字時代讓城市生活更美好”為主題,圍繞數(shù)字經(jīng)濟、智慧城市、生態(tài)城市等主題開展一系列展覽展示、投融資對接、實地考察、濱海座談等專項活動。
大會還邀請了政府官員、權(quán)威研究機構(gòu)領(lǐng)導(dǎo)和眾多知名企業(yè)高管出席和發(fā)表精彩演講,共同探討數(shù)字經(jīng)濟理念、智慧生態(tài)城市建設(shè)、智能科技產(chǎn)業(yè)發(fā)展和智能數(shù)字生活,推進美好的城市生活建設(shè)。曠視科技副總裁謝憶楠出席大會,并做了題為《中國人工智能的第一階段》的演講。
以下為謝憶楠演講內(nèi)容整理(該內(nèi)容根據(jù)現(xiàn)場速記整理,未經(jīng)發(fā)言嘉賓確認(rèn),僅供參考,謝絕轉(zhuǎn)載)
人工智能現(xiàn)在來看分兩個階段,第一階段做技術(shù),然后是做產(chǎn)業(yè)。做產(chǎn)業(yè)是中國人工智能標(biāo)志性的場景。機器和人類目前在效率上機器比人類強的部分原因是,機器看人方法不一樣,機器是做數(shù)學(xué)的。所以,為什么人工智能可以產(chǎn)業(yè)化,因為人工智能在技術(shù)上、效能上比人強不少。
我們看到AI,我們認(rèn)為AI產(chǎn)業(yè)化分兩個階段:第一階段可以叫人工智能技術(shù)企業(yè),第二階段是人工智能產(chǎn)業(yè)企業(yè)。
這具備幾個特點:第一它自己可以賺錢,第二它的規(guī)??梢圆粩嗤显黾?。
所以現(xiàn)在很多公司稱自己是人工智能技術(shù)企業(yè)的話,我們可以認(rèn)為它是。但是如果稱為人工智能產(chǎn)業(yè)的話,需要具備一些標(biāo)準(zhǔn)或者說應(yīng)該具備一些準(zhǔn)繩。
人工智能幫助人們實現(xiàn)高速、高效的運作。大家能夠看到的是人工智能可以在前面打贏世界冠軍,可以在識別圖片的時候做得非常好,但是實際上人工智能的背后有很多人力幫他做這件事情。舉例來說,如果我認(rèn)識一個人,看他一眼就可以了,但是人工智能如果想認(rèn)識這個人,他需要這個人的各個角度的照片,各個年齡段的照片,戴眼鏡、不戴眼鏡的照片,把這些東西聚集在一起進行定量、定向型的學(xué)習(xí),這叫監(jiān)督學(xué)習(xí),需要把眼睛、鼻子、嘴標(biāo)出來,標(biāo)完以后告訴你這是人,這是人的眼睛、人的鼻子、人的嘴,然后進行分析以后做對比,然后做出標(biāo)準(zhǔn)。
看到人工智能發(fā)展這么快,我們看到的只是結(jié)果,但是如果看過程,阿法狗和李世石下棋完全不平衡,后面耗費的能量遠(yuǎn)超過人的大腦耗費的東西。說技術(shù)驅(qū)動倒不如說它背后有很多人力的驅(qū)動。
有多少人工就有多少智能。人工包含兩件事:第一,數(shù)據(jù)產(chǎn)業(yè)的員工在后面一個一個對數(shù)據(jù)進行辛苦的勞作。第二,數(shù)據(jù)科學(xué)家們在一個一個清理這些數(shù)據(jù)。在過程當(dāng)中,剛才的命題是什么?AI要懂行業(yè)?第二個問題是什么?第二個問題是AI對于每個世界都需要重新大量的數(shù)據(jù)輸入以后才能學(xué)出來,真正在這里面我們想解決一個簡單的問題,需要大量的人力和時間才能解決一件事情。
真正的命題當(dāng)中,我們現(xiàn)在什么最貴?人力最貴,所以人工智能產(chǎn)業(yè)的公司要具備的一件事情你的技術(shù)要能夠去人力化的。怎么去人力化?原來我們需要100個工程師,給你1000塊卡,現(xiàn)在我能否給你一個工程師,我給你1萬塊卡把這個事解決了?整個過程中數(shù)據(jù)的收集、清理不再需要你放心,你只需要把基礎(chǔ)算法建立好,通過算力解決行不行?如果行的話就可以。人工智能公司能夠為企業(yè)提供服務(wù)效率,這才能叫人工智能效率。
如果你是人工智能產(chǎn)業(yè)公司,要做的第二件事情要從0到1,或者說解決商業(yè)本質(zhì)性的事件。
我們找的第一個點是實名制,曠世14年做產(chǎn)業(yè)化,碰到一個潮流叫互聯(lián)網(wǎng)金融,互聯(lián)網(wǎng)金融和傳統(tǒng)金融最基本的區(qū)別是一個它沒有線下的網(wǎng)點,這樣它做第一次驗證的時候,金融系統(tǒng)有“三親見”原則,叫親眼見到你,如果互聯(lián)網(wǎng)金融的人沒有辦法親自到柜臺的話,我如何給這些人開立賬戶就是一個難題。
如果在這里面找到face ID,證明你拿到的身份證是一個活人的話,我會告訴他這個人可以開一個電子帳號。人臉識別在這個行業(yè)、在這個點上雖然不是本質(zhì)推動互聯(lián)網(wǎng)金融發(fā)展的,但是確實解決了本質(zhì)性的問題。很多地方需要實名化,包括短租房、互聯(lián)網(wǎng)出行,很多地方需要場景。
從0到1需要找到一個工具實現(xiàn)本質(zhì)性。工具這件事情存在不了多久,現(xiàn)在做一個人臉識別驗證,活體服務(wù)?,F(xiàn)在這個技術(shù)你能做,三四年以后有很多公司可以做。這些東西綁著其他的云服務(wù)做的。
我們把Face ID拆分,第一找到臉,第二是解決ID。現(xiàn)在看到的每一張臉對于銀行來講是一樣的,我不知道你是否是合格的,我們應(yīng)該給你多少錢。但是這個人臉在Face ID平臺上上個月已經(jīng)申請了四次小額貸款,申請四次貸款我們就可以知道這個人是在很多地方貸款,可信度是否有下降,這些數(shù)字對他們的風(fēng)控模型會帶來影響。
張學(xué)友演唱會每一場抓個壞人抓到五個了,抓到壞人達到結(jié)果為什么生態(tài)是沒打通的?為什么警察沒有拿這件事在體系內(nèi)鋪開呢?
我們還原一下場景,演唱會A門到Z門布了26個筆記本加攝象頭,每個筆記本前面坐一個人,就看這個人走來走去,看著報警,這個報警因為閾值設(shè)定很低。因為計算機計算功率有限,不是實時報,一揮而就會延時過來幾個。演唱會進門結(jié)束以后,門口26個人統(tǒng)一拍照片對照。A口發(fā)現(xiàn)三個報警的,發(fā)給隊長,隊長把照片發(fā)給當(dāng)?shù)胤志盅信兄行?,研判中心通過研判室研判以后發(fā)回給當(dāng)?shù)氐木?。?dāng)?shù)鼐瘑T說C門進來第二個報警的人是我們要抓的人,確定了以后,警官拿步話機說全場找一個穿白背心、灰色外套的人,一個中年男性。為什么是演唱會?因為演唱會進去以后不出來,一待待兩個小時,這兩個小時有充足的時候做這種服務(wù),只有在演唱會能做。這就是生態(tài)沒打通,因為每一層里面沒有解決這個行業(yè)對于它的痛點。什么叫痛點?我們經(jīng)??吹骄炱瓢福觳皇遣幌肫瓢?,他們每一個案件都能破,人力有問題,警力不充足。這件事情門口有26個人,現(xiàn)場所有人抓一個人,這種警力投入是因為重大場所正好有,如果在日常場景的話,在橋底下路過,我就走過去了,我也沒看見,我需要每個攝象頭都會一個人24小時不停盯著一個攝象頭嗎?肯定不可能,所以他沒有解決行業(yè)里面最剛需的解決警力或者解決效率的問題。
第二是零售,現(xiàn)在很多企業(yè)講我在做新零售,我們一般會問一個問題,我給你提供的新零售解決方案,你可以為這個店面大概帶來什么。我們現(xiàn)在會提什么問題?都是從本質(zhì)上講,我可以給你進行人群分析,讓你知道你店面的流量,哪個服務(wù)比較好,梳理完一套給你,聽起來很好。店家問你第二個問題,成本是多少,正常情況下企業(yè)考慮不到這個問題這就是AI和實體經(jīng)濟結(jié)合會遇到的最正常的問題。也就是說你的AI成果帶來成倍的成長,如果一個店面裝修需要30萬,因為AI裝修變成60萬了,裝不裝?總經(jīng)理肯定不會同意。第二個問題解決不了,同時店家第三個問題,你做完這個AI,你說你拿到數(shù)據(jù)源以后,你對我的評效、人效有什么樣的幫助,這時候基本就蒙了,他只知道我把這套東西做好就可以第三件事情就是實體經(jīng)濟需要你幫他解決更多的痛點。你給我提升毛利,三年之內(nèi)cover掉我的成本我就裝,AI和實體經(jīng)濟不是像原來實現(xiàn)數(shù)據(jù)化、智能化,它一定是一下發(fā)生的。如果沒有智能化,你不能降本增效的話,我是不可能幫你做第一件事硬件改造的,AI和實體經(jīng)濟的要三網(wǎng)并發(fā),AI產(chǎn)業(yè)企業(yè)如果到現(xiàn)場的話,要回答三件事情,第一我可以干什么,第二你是否可以負(fù)擔(dān)我的成本,第三我的技術(shù)給到你能對你的效能有多大提升。
AI+場景AI+實體經(jīng)濟,有些看起來沒有那么靠譜,現(xiàn)在要不然AI不靠譜,要不然場景不靠譜。
最后中國和美國之間的區(qū)別。中國為什么叫做產(chǎn)業(yè)企業(yè)?中國人工智能解決一個問題就是城市問題,現(xiàn)在很多城市面臨一個問題,叫超大規(guī)模城市,超大規(guī)模城市的問題是我要控制我的人員流進來,北京、上海、杭州、天津都有這個問題,如果不是這樣的話,他不會建立落戶政策這件事情,自動流動就好了,城市因為承載不了這些東西,所以需要通過數(shù)據(jù)的優(yōu)化來運算,解決交通問題和環(huán)保問題。所以中國在美國里面最大的問題在于中國的城市化在后面如果說想推進的話,超大規(guī)模城市是中國的現(xiàn)狀。而超大規(guī)模城市如何解決那些我們感覺很難受的事情,比如擁堵、比如污染這些事情,其實就是AI所做的。這也就是為什么中國產(chǎn)業(yè)級的人工智能企業(yè)會多,這是從我們的背景來看。美國其實是以一個科研的方法來做的,所以現(xiàn)在學(xué)AI的四大名?;驹诿绹?,中國可能有那么幾家,我拿到一個數(shù)據(jù),清華的本科畢業(yè)生就業(yè)率10%到15%左右,剩下的要么申請留校,要么是學(xué)AI,并沒有說AI中國比美國強或者是美國比中國強,兩個國家已經(jīng)向不同的方向發(fā)展。
希望我的發(fā)言能夠給大家?guī)硭伎?,謝謝大家!
好文章,需要你的鼓勵
騰訊ARC實驗室推出AudioStory系統(tǒng),首次實現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù),通過交錯式推理生成、解耦橋接機制和漸進式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時學(xué)習(xí)外觀和運動信息,顯著解決了當(dāng)前視頻生成模型中動作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個線性層就能大幅提升運動質(zhì)量,在多項測試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實驗室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評測基準(zhǔn),通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時顯著提升人性化交互水平,為AI價值觀對齊提供了可行技術(shù)路徑。
谷歌DeepMind團隊開發(fā)的GraphCast是一個革命性的AI天氣預(yù)測模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報,準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來了效率和精度的雙重突破。