CNET科技行者 11月22日 北京消息(文/周雅):最近每一次“人工智能”會議的刷屏,都伴隨一次人工智能研究的刷新,比如前兩天的2017高通創(chuàng)投與創(chuàng)新峰會。
這次峰會,高通創(chuàng)投(Qualcomm Ventures)有意強調(diào)了人工智能的務(wù)實性,現(xiàn)場話題的邏輯大致可以視為“我投了什么(最新AI投資洞察及案例)”、“我為什么投(被投AI企業(yè)如何做產(chǎn)品、做什么產(chǎn)品)”、以及“我接下來要怎么投(下一階段AI的發(fā)展方向)”。
會后,高通副總裁兼高通創(chuàng)投董事總經(jīng)理沈勁接受了科技行者的采訪,介紹高通創(chuàng)投以及AI投資看法。
高通副總裁兼高通創(chuàng)投董事總經(jīng)理沈勁
投資秘訣,前沿科技
高通創(chuàng)投是高通的投資部門,自2000年以來投身于移動與無線領(lǐng)域創(chuàng)新投資,超過20位投資經(jīng)理,覆蓋全球7個地區(qū),專注于投資從早期到成熟期的高科技企業(yè)。
從定位來看,高通的業(yè)務(wù)部門關(guān)注近期前景,聚焦連接+計算;高通的研發(fā)部門關(guān)注的是未來5-10年的創(chuàng)新,累計研發(fā)投入超過470億美元;而高通創(chuàng)投部門洞察未來3-5年的前沿科技。沈勁解讀,“對于高通而言,高通創(chuàng)投不僅是一個投資部門,還是一個傳感器,通過這個傳感器吸收那些還未涉足的行業(yè)新動向。”
過去,高通創(chuàng)投主要關(guān)注移動互聯(lián)網(wǎng);從2015年開始,高通創(chuàng)投的投資方向有所調(diào)整,開始關(guān)注物與物的連接,并認為“物與物連接”至少影響未來30年,并將投資重點調(diào)整為前沿科技,包含四個方面:人工智能、XR(AR/VR/MR)、機器人,無人機,以及萬物互聯(lián)。
那對于初創(chuàng)公司而言,高通創(chuàng)投能提供什么獨特價值?第一,高通創(chuàng)投對于新興技術(shù)和商業(yè)模式有專業(yè)洞察力,處于移動計算與無線領(lǐng)域的上游;第二,高通創(chuàng)投具備產(chǎn)業(yè)資源,擁有運營商、OEM/ODM廠商、技術(shù)專家等合作伙伴生態(tài)鏈,幫助投資公司之間建立聯(lián)系并擴大規(guī)模;第三,高通創(chuàng)投擁有全球視野;第四,高通創(chuàng)投具備豐富投資經(jīng)驗,在全球管理著140家被投公司,過去6年間有6個市值或估值超過10億美金的企業(yè)完成上市或并購。沈勁說,高通創(chuàng)投等理念其中一點是“加速并影響無線市場的增長”,盡管已投資公司使用競爭對手的產(chǎn)品,也不妨礙高通創(chuàng)投的這個理念。
自2003年起,高通創(chuàng)投進入中國并不斷加碼投資,目前已經(jīng)投資了38家中國公司。2014年,高通創(chuàng)投還設(shè)立了一個1.5億美元的中國投資基金,專門面向中國公司。此次峰會,高通創(chuàng)投又宣布對9家中國公司進行風(fēng)投,包括:
人工智能公司商湯科技、智能共享單車公司摩拜單車、無線連接市場供應(yīng)商創(chuàng)通電子、面向終端側(cè)的人工智能解決方案供應(yīng)商耐能、無人值守便利店運營商零號元素、創(chuàng)新教育解決方案供應(yīng)商美科科技、結(jié)合AI和VR/AR技術(shù)的內(nèi)容提供商奇幻科技、“全沉浸式”英語學(xué)習(xí)環(huán)境供應(yīng)商愛樂奇、以及農(nóng)業(yè)大數(shù)據(jù)和智能化服務(wù)公司奧科美。
放眼望去,以上大多數(shù)企業(yè)覆蓋AI業(yè)務(wù),側(cè)面印證高通創(chuàng)投的投資邏輯。
不過高通的投資方向當然不止于AI,正如前文所提的前沿科技,高通創(chuàng)投還關(guān)注以下領(lǐng)域:
· 5G的到來可以視為物聯(lián)網(wǎng)的一股強風(fēng)。對于在固定區(qū)域內(nèi)停放密集的摩拜單車來說,如果沒有5G,很難靠目前的網(wǎng)絡(luò)接入每輛車,而5G不僅具備海量連接能力,還將支持終端的超長待機時間。
· 終端側(cè)的人工智能是物聯(lián)網(wǎng)升級的另一股強風(fēng)。而現(xiàn)場幾位投資人期待的是,AI和5G的合流下,物聯(lián)網(wǎng)得到可觀的發(fā)展。
· 物聯(lián)網(wǎng)和其他業(yè)務(wù)的協(xié)同效應(yīng)。比如智能燈泡,其所需的數(shù)據(jù)無線傳輸能力,比手機低得多,因此手機技術(shù)足以支撐該產(chǎn)品,這就是手機和物聯(lián)網(wǎng)的協(xié)調(diào)效應(yīng)。
· 物聯(lián)網(wǎng)和人工智能的協(xié)同效應(yīng)。
人工智能的一個入口:終端測
面對不少融資過億的AI獨角獸(譬如高通投資的商湯科技)、以及BAT等巨頭的入局,新興AI創(chuàng)業(yè)企業(yè)的機會在哪里?
沈勁認為:“終端側(cè)人工智能就是AI的一個入口”——恰恰為目前略顯焦慮的AI投資人、缺乏機會的新興AI創(chuàng)業(yè)企業(yè)找到一個方向。
所謂的終端側(cè)人工智能,也指端智能、端側(cè)智能、邊緣計算等。如今線上的流量入口越來越少且越來越貴,以后的入口是大大小小的終端,包括手機、攝像頭、傳感器、機器人等,將涵蓋我們生活的方方面面。
“我們發(fā)現(xiàn),很多AI巨頭在終端側(cè)人工智能方面并沒有做到完全覆蓋。”沈勁透露。譬如,高通本次追加投資的農(nóng)業(yè)大數(shù)據(jù)公司奧科美,奧科美的農(nóng)業(yè)數(shù)據(jù),商湯沒有、BAT也沒有,巨頭們盡管數(shù)據(jù)量龐大,但數(shù)據(jù)種類不一定全面,譬如鴨叫、豬叫的聲音,或者農(nóng)業(yè)植株葉子的圖片,是缺乏的——而這就是初創(chuàng)企業(yè)的空間和機會。
沈勁補充說道,在這些領(lǐng)域中創(chuàng)業(yè),無可避免要關(guān)注設(shè)備端的AI,因為終端側(cè)AI的優(yōu)勢覆蓋四個方面:
第一,數(shù)據(jù)安全。
第二,整個執(zhí)行回路的可靠性。簡單說,采集到的數(shù)據(jù)如果要通過網(wǎng)絡(luò)傳輸?shù)皆贫诉M行計算,然后再返回到終端,那么過程中網(wǎng)絡(luò)的任何不穩(wěn)定就都會導(dǎo)致應(yīng)用的失敗,這樣整個執(zhí)行的可靠性就變?nèi)趿恕?/p>
第三,低時延。終端側(cè)的很多應(yīng)用都是低時延的,類似刷臉、美圖、拍照等功能一定都是在終端進行,因為哪怕幾秒鐘的云端延時,都是消費者的負擔(dān)。
第四是自適應(yīng)。目前的刷臉技術(shù)需要多方配合,譬如規(guī)定必須站在某個位置,臉部必須朝某個方向,然而有了自適應(yīng)技術(shù),就靈活很多。譬如ETC,傳統(tǒng)的ETC要求汽車必須短暫停車識別,但現(xiàn)在的技術(shù)已經(jīng)可以支持車輛以正常的速度通過收費站完成識別和認證。不過,要具備這種自適應(yīng)的能力,就需要終端側(cè)人工智能的配合。
在終端側(cè),全球出貨量最大的終端就是手機,而今年手機已經(jīng)開始使用人工智能功能,譬如美顏、人臉解鎖。不難預(yù)見,今后手機的AI能力會越來越強,AI的普及性會越來越高,AI應(yīng)用的覆蓋面也會越來越廣。
AI的下一階段:小數(shù)據(jù)環(huán)境下本地訓(xùn)練的能力
沈勁說,從之前的云端AI,發(fā)展到現(xiàn)在的終端側(cè)AI,給了業(yè)界新的挑戰(zhàn)。
在云端的人工智能發(fā)展,包括運算能力、模型復(fù)雜程度等,可以不斷往上疊加——比如商湯科技在2016年推出了1000層的深度神經(jīng)網(wǎng)絡(luò),而這么大的網(wǎng)絡(luò)顯然在手機或者筆記本上是跑不起來的,它更適用于大數(shù)據(jù)、精細層計算。
而目前終端側(cè)人工智能的使用,都是將已經(jīng)訓(xùn)練好的模型小型化,然后放在手機、聯(lián)網(wǎng)攝像頭、空調(diào)等各類終端上讓它來執(zhí)行。終端側(cè)智能下一步研究的重點是:小數(shù)據(jù)、無標注、限制環(huán)境下的人工智能訓(xùn)練,考驗的是小數(shù)據(jù)環(huán)境下的本地學(xué)習(xí)和本地訓(xùn)練的能力。
AI投資,如何把控技術(shù)評估?
當然,小數(shù)據(jù)環(huán)境的本地訓(xùn)練能力具備技術(shù)門檻,因此風(fēng)投在挑選一個好項目的同時,必須評估這一企業(yè)的技術(shù)能力。
技術(shù)評估,恰好與高通創(chuàng)投的投資風(fēng)格相得益彰。沈勁說,高通身為一家技術(shù)型公司,關(guān)注技術(shù)企業(yè)是毋庸置疑的,但高通創(chuàng)投的投資風(fēng)格相對嚴謹,不大可能做到一小時內(nèi)就拍板決定投資某一家企業(yè),因為前期有大量調(diào)研工作和思考、分析工作要做。曾經(jīng),沈勁甚至在投資之前跑到農(nóng)場、草莓園、集散地、蔬菜園等地,以獲得第一手的信息。
需要指出的是,高通創(chuàng)投的投資不以合作為必要條件,但通過合作,確實為快速認識一家企業(yè)提供了便利的機會:“很多時候大家初次見面,很難通過只言片語就分辨哪一家創(chuàng)業(yè)公司技術(shù)好,哪一家技術(shù)一般,而通過業(yè)務(wù)合作,我們對他們產(chǎn)品性能和能力就有了更深刻的了解,就會拿到第一手數(shù)據(jù)和材料,因此與我們公司合作的創(chuàng)業(yè)公司,我們對他的技術(shù)能力會更有把握。”
盡管如此,但需要強調(diào)的是,高通創(chuàng)投沒有狹隘地規(guī)定投資的公司必須用高通的產(chǎn)品、必須和高通在技術(shù)上是一致的、才算是有戰(zhàn)略意義。
新零售興起,不失為一個投資方向
在高通此次公布投資的9家公司中,有一家定位無人便利店的公司——零號元素,此前曾獲1000萬元融資。
今年下半年,無人便利店投資熱一時興起,諸如Amazon Go的無人貨架出現(xiàn),不過市場相對也逐漸出現(xiàn)懷疑無人店需求的聲音。
沈勁指出,無人便利店的出現(xiàn)不是偶然,是人工成本上漲、計算機視覺等技術(shù)發(fā)展到一定程度的必然產(chǎn)物:新零售概念興起,再加上智能技術(shù)發(fā)展迅猛,以前若要實現(xiàn)無人值守只能用RFID標識性技術(shù),而現(xiàn)在可以刷臉進門,攝像頭的整體監(jiān)控可以分析人的購買行為、也能防止其他不規(guī)范的動作,最后成功購買商品順利付錢離開。
沈勁同時提到,零號元素反饋回來的很多信息都讓人興奮。比如有些園區(qū)更加歡迎無人便利店入駐,因為一些園區(qū)自身定位科技感、高大上,而無人便利店透明的外觀、且無人看守,恰好符合這些園區(qū)的風(fēng)格。
更直白的原因,無人便利店還能避免一些“有人”的問題,譬如,有人的話,廁所放哪。“過去我們說‘無人’會節(jié)省人工成本,現(xiàn)在‘無人’的優(yōu)勢還在于,它似乎代表著一種更先進的理念。”沈勁總結(jié)說。
不過,無人便利店歸根到底還是需要用戶體驗好、買東西方便、同時經(jīng)濟賬要算得過來、賺的錢要能夠可持續(xù)運營下去。
沈勁由此感嘆道:“風(fēng)投的過程也是加入行業(yè)第一線去觀察、去學(xué)習(xí)的過程,投資不代表一定會成功,但一定要試水,掌握第一線的實時信息。”
寫在最后
采訪中,針對沈勁提出的其他一些價值觀點,科技行者歸納整理如下:
問:從國內(nèi)的公司來看,AI的企業(yè)越來越貴了。我們不否認資本會推動技術(shù)或者市場的有效配置,但是現(xiàn)在的發(fā)展態(tài)勢已經(jīng)有點像是軍備競賽,您如何看待這樣的現(xiàn)象?
沈勁:我和你的感覺一樣,AI公司的估值確實普遍偏高。在這樣普遍的現(xiàn)象中,有一些高估值企業(yè)我們還是覺得值得投資,是因為它發(fā)展?jié)摿艽螅幸恍┢髽I(yè)我們認為沒有這么大的發(fā)展?jié)摿?,可能我們就很難做出投資的決策。比如,商湯科技肯定屬于比較貴的公司,當時IDG做決定投資他們的時候,也覺得有點貴,但從今天看,IDG的這筆投資已經(jīng)增值很多。
我們分析認為,商湯正在成為具有平臺級能量的AI公司,正如商湯科技聯(lián)合創(chuàng)始人和副總裁徐冰在這次峰會所說,他們要做“電廠”,而不是家用的小柴油發(fā)電機。也許有些公司覺得這樣挺好,有了電就可以制造冰箱、洗衣機,然而商湯認為,電只是一個基礎(chǔ)元素而已,真正的價值不在于電,而在創(chuàng)造出來的其他零部件以及集成的產(chǎn)品或解決方案。
所以像商湯這樣的公司,如果真的做成“發(fā)電廠”這個級別,我自己也認為它有很大的發(fā)展前景,而且今后它的發(fā)展規(guī)模會比那些僅僅做一個單獨應(yīng)用的公司要大得多。
但另一方面,我們不需要那么多發(fā)電廠。所以我們想跟大家說的就是,大家趕緊去做應(yīng)用、趕緊在自己的專業(yè)領(lǐng)域做設(shè)備端的AI。如果今天要重新蓋一個“發(fā)電廠”,直接和BAT、小米、商湯這樣的公司去競爭,要生存下來還是會很艱難。
這就是我們對于估值的看法,雖然普遍有偏高的趨勢,但也還是要具體結(jié)合到每個案子來分析。
問:對于這些級別的算法類公司而言,他們的競爭點是什么?譬如,現(xiàn)在看人臉識別的公司,他們后續(xù)的落地場景也很同質(zhì)化:在智能手機端做圖像優(yōu)化以及安防監(jiān)控。您覺得后續(xù)還會有一些什么樣的變化呢?還是說現(xiàn)在看來,目前這些是最可行的途徑?
沈勁:為什么人臉識別第一步的應(yīng)用是安防,首先它的應(yīng)用場景跟圖片和攝像有關(guān),這就是計算機視覺。而且幸運的是,中國的這個應(yīng)用市場特別大,以至于能夠容納幾家公司都在做同樣的東西,可能他們面向的具體市場區(qū)域不同。中國市場特別大,這就給中國的AI企業(yè)帶來獨特又非常寶貴的市場資源。
中國的互聯(lián)網(wǎng)金融發(fā)展得特別快,身份認證的市場比較突出。并不是說美國的互聯(lián)網(wǎng)金融水平不高,但美國多年來的信用卡和信用體系,積累的數(shù)據(jù)已經(jīng)特別多。在美國,要鑒別身份,目前并沒有刷臉的技術(shù),但因為系統(tǒng)已經(jīng)積累了很多數(shù)據(jù),他們可以通過核對這些數(shù)據(jù)信息就能判斷你的身份,比如說你在某幾個地址是否居住過;但是中國沒有這樣的數(shù)據(jù)積累,同時互聯(lián)網(wǎng)金融在這兩三年內(nèi)突然爆發(fā),這就提供了一個廣闊的身份認證市場,比如你想盜用別人的身份證借款,要如何判斷這是不是你本人的身份證,這個市場就很大了。
中國廣闊的市場機遇為計算機視覺技術(shù)提供了大量的應(yīng)用場景,因為市場夠大,所以我們可以看到大家都在做同樣的東西。但一旦企業(yè)數(shù)量太多,市場機會就減少了,這個時候怎么辦?我們就需要在各個行業(yè)進行挖掘。這個挖掘工作才剛剛開始,我們已經(jīng)看到一些做消防應(yīng)用場景的AI企業(yè)。事實上,已經(jīng)有創(chuàng)業(yè)者在用人工智能做消防應(yīng)用了,通過監(jiān)控各個電器的使用情況,他們能夠提前偵測出一些消防隱患。所以目前,這個領(lǐng)域也是我們很關(guān)注的一個方向,和我們今后投資需要注重的一個領(lǐng)域。
問:今天宣布投資的9家公司,商湯跟摩拜兩家公司都是行業(yè)中發(fā)展規(guī)模比較大的公司,其實在他們成長還很小的時候就應(yīng)該可以參與投資,為什么到現(xiàn)在才參與?是什么樣的契機決定投資他們?中國有很多創(chuàng)業(yè)公司,除了投資,高通會不會通過并購的方式來累計公司整體的技術(shù)儲備?
沈勁:高通其實也是非常重視并購的。我們總部有一位執(zhí)行副總裁,負責(zé)的就是投資、并購和公司戰(zhàn)略三個部分的工作,我們創(chuàng)投部門是這三部分里面的一項。目前在中國市場我們還沒有專門的本地團隊在做并購,但如果有并購的機會,我的團隊也會參與臨時組建的團隊來考核并購的對象或者并購的機會。并購在公司拓展業(yè)務(wù)以及在向其他領(lǐng)域的延伸中是一個很重要的手段。
一般VC經(jīng)常會說他們有幾個關(guān)注領(lǐng)域,比如TMT、醫(yī)療、能源等。但高通創(chuàng)投在投資領(lǐng)域其實非常聚焦,我們都不說TMT,而是在TMT這個大范圍內(nèi)再聚焦到前沿科技,具體就是四方面:人工智能、XR(也就是VR/AR/MR)、機器人和物聯(lián)網(wǎng)。就投資的階段而言,有的VC只投A輪或B輪,有的只投后期的,或者作為PE,沒有大的資金需求他們就很難投進去。跟這些VC不同的是,高通創(chuàng)投在資金方面比較寬松,我們可以投幾十萬美金,也可以投幾千萬美金。這使得我們有機會在各個階段都能夠參與。
至于為什么商湯的A輪我們沒有參與,摩拜的早期我們也沒有參與,會有一些細節(jié)的原因。有些VC專注投資特別早期階段的項目并且量特別大,譬如經(jīng)緯,他們有時候也會反思,為什么沒能夠參與到某個項目當中,但其實從另外的角度看,他們已經(jīng)參與了很多很好的案子了。所以,這背后肯定有各種各樣的原因。像經(jīng)緯這樣的VC,他們專注的就是早期,到了C輪、B輪,需要幾千萬的案子可能已經(jīng)不符合他們的投資理念了。但高通創(chuàng)投比較靈活,可以做比較大額的投資,也可以做比較小額的投資。
問:我接觸過一些公司,他們感覺現(xiàn)在做人工智能的成本還是太高了,運算的不算很快,功耗特別高,可能這個問題在移動終端上體現(xiàn)會更明顯。高通有沒有自己的想法或者標準,比如運算能力達到多少或功耗達到多少,就可以用到手機上?另外,現(xiàn)在很多在做的深度學(xué)習(xí)或者是腦神經(jīng)的架構(gòu),是否會直接用在手機上,還是說需要開發(fā)一些新的架構(gòu)用在手機上?
沈勁:高通一直強調(diào)的是異構(gòu)計算這個架構(gòu)。手機有各種各樣的應(yīng)用,當你要玩游戲或者看很多視頻,主要就是用GPU;如果需要經(jīng)常待機且保持始終在線,那就是DSP;如果是通用型的話,就是CPU?,F(xiàn)在手機用到人工智能了以后,我們發(fā)現(xiàn)異構(gòu)的架構(gòu)特別合適。GPU做并行處理是比較不錯的,但也有人會覺得TPU、NPU是不是比GPU更好,在技術(shù)不斷的演進當中肯定會有更好的方法不斷出來。我們在DSP上做并行處理效果也很好。異構(gòu)的架構(gòu)給了我們處理人工智能很好的平臺,因為它并不單一。如果只是一個CPU,硬要在CPU上運行人工智能的話,那就有可能出現(xiàn)你剛才說的運算慢的情況。我們還是非常幸運的,我們一直在推的SoC、異構(gòu)架構(gòu),現(xiàn)在看是非常適合于跑人工智能的應(yīng)用的。
另外,你問用在手機上的人工智能是不是有一個標準,但其實這些標準都是在具體應(yīng)用中產(chǎn)生的。以高通和商湯、OPPO的項目為例,OPPO這次也提到,從他們開始接觸相關(guān)的公司,到真正手機發(fā)布,用了13個月。OPPO前后接觸了十幾家公司,最后選定商湯和高通的芯片平臺,三家公司一起努力,在這個過程中會產(chǎn)生一些標準出來,比如功耗必須達到多少,時延達到多少,這是前提,所以,如果達不到標準,就更談不上具體應(yīng)用了。
好文章,需要你的鼓勵
騰訊ARC實驗室推出AudioStory系統(tǒng),首次實現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù),通過交錯式推理生成、解耦橋接機制和漸進式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準測試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時學(xué)習(xí)外觀和運動信息,顯著解決了當前視頻生成模型中動作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個線性層就能大幅提升運動質(zhì)量,在多項測試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實驗室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評測基準,通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時顯著提升人性化交互水平,為AI價值觀對齊提供了可行技術(shù)路徑。
谷歌DeepMind團隊開發(fā)的GraphCast是一個革命性的AI天氣預(yù)測模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報,準確性超越傳統(tǒng)方法90%的指標。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來了效率和精度的雙重突破。
關(guān)注科技創(chuàng)新、技術(shù)投資。
以文會友,左手硬核科技,右手浪漫主義。