作者|周雅
2023年春天,國(guó)內(nèi)外AI人工智能度過(guò)了一個(gè)“瘋狂三月”, GPT4、MetaAI、斯坦福等國(guó)際大機(jī)構(gòu)分別發(fā)布了AI大模型;國(guó)內(nèi)也不甘落后,據(jù)不完全統(tǒng)計(jì),目前國(guó)內(nèi)已有百余個(gè)AI大模型先后發(fā)布,更被輿論渲染為“群模大戰(zhàn)”。大模型儼然成為了全球人工智能競(jìng)賽的主戰(zhàn)場(chǎng)。
但是在大模型層面,高投入、高風(fēng)險(xiǎn)、高回報(bào)是其投資特點(diǎn),這需要具備大算力、大數(shù)據(jù)和強(qiáng)算法等核心技術(shù)能力,技術(shù)門(mén)檻高、規(guī)模效應(yīng)強(qiáng),屬于科技巨頭的競(jìng)賽。那這是不是意味著初創(chuàng)公司“沒(méi)戲了”?AI大模型創(chuàng)業(yè)投資,到底是不是藍(lán)海?如果不做通用大模型,垂直模型的蛋糕有多大?
對(duì)此,行行AI、科技行者、創(chuàng)投變辯辨、至頂科技,聯(lián)合組織了一場(chǎng)沙龍直播,至頂科技CEO兼總編輯高飛作為沙龍主持人,對(duì)話四位AI大模型領(lǐng)域的創(chuàng)業(yè)者:北京橙溪科技創(chuàng)始人陳煉、VitallyAI CTO蔣鎰?wù)?、波特時(shí)空創(chuàng)始人劉大鴻、寧夏云瑞致勝科技有限公司CEO于千城,一起深度探討AI大模型風(fēng)口下的新機(jī)遇、新挑戰(zhàn)。
【Part 1】大模型的機(jī)會(huì)到底有多大?
(1)談下一個(gè)大模型:給時(shí)間,總能大力出奇跡
高飛:在大模型領(lǐng)域,巨頭已經(jīng)紛紛下場(chǎng),國(guó)內(nèi)的大模型創(chuàng)業(yè)還有沒(méi)有機(jī)會(huì)誕生下一個(gè)OpenAI?
于千城:這要區(qū)分來(lái)看。單從規(guī)模體量來(lái)看,有一定可能。但從創(chuàng)新性和社會(huì)責(zé)任感的角度,可能性幾乎沒(méi)有。
中國(guó)的公司還是太急功近利了,沒(méi)有哪一家公司真正靜下心來(lái)說(shuō)“我真的是要推動(dòng)生產(chǎn)力、推動(dòng)社會(huì)的進(jìn)步”,幾乎找不到這樣的公司。如果不能靜下心思考,還是很難實(shí)現(xiàn)突破的。
但中國(guó)有這么大的市場(chǎng),若是出現(xiàn)一兩個(gè)有影響力的公司應(yīng)該毫無(wú)問(wèn)題,畢竟這是時(shí)代發(fā)展的趨勢(shì)。中國(guó)人實(shí)現(xiàn)從“1到N”的能力非常強(qiáng),但是“從0到1”會(huì)存在社會(huì)機(jī)制、環(huán)境土壤的局限性。
蔣鎰?wù)洌?/strong>我的想法不太一樣。中國(guó)的大模型創(chuàng)業(yè)公司能否搞出一個(gè)OpenAI,答案基本上是No。OpenAI背后有個(gè)“金主”微軟,OpenAI全是煉金術(shù),一路都在做實(shí)驗(yàn),大語(yǔ)言模型(LLM)基于GPT的所有實(shí)驗(yàn)它基本上都做完了,做著做著才搞明白,ChatGPT最終才出來(lái)了。整個(gè)過(guò)程冒很大風(fēng)險(xiǎn)。
所以中國(guó)創(chuàng)業(yè)公司想搞出同樣的OpenAI,可能性幾乎沒(méi)有,但是會(huì)出現(xiàn)類似于“OpenAI”的東西,因?yàn)楝F(xiàn)在用不了美國(guó)的,中國(guó)只能自己搞。
國(guó)內(nèi)的大廠,不管是百度還是阿里,肯定也知道自己要做一個(gè)通用大模型,至少是GPT-4的水準(zhǔn)。所以,中國(guó)肯定會(huì)出現(xiàn)一個(gè)大模型,至于到底花落誰(shuí)家?百度實(shí)力是有的。
總之,大語(yǔ)言模型在我看來(lái),已經(jīng)不是一個(gè)科學(xué)技術(shù)問(wèn)題,而本質(zhì)上就是一個(gè)工程問(wèn)題,給點(diǎn)時(shí)間,總能大力出奇跡。
(2)談大模型創(chuàng)業(yè):我們有一個(gè)什么樣的互聯(lián)網(wǎng),就會(huì)有一個(gè)什么樣的大模型
高飛:大家雖然認(rèn)為,國(guó)內(nèi)會(huì)出現(xiàn)類似的大模型創(chuàng)業(yè)公司,但這中間肯定有困難之處。記得早些年談大數(shù)據(jù)之難,咱們有4個(gè)“V”標(biāo)準(zhǔn)(規(guī)模性Volume、高速性Velocity、多樣性Variety、價(jià)值性Value),那么同樣的問(wèn)題,大模型的創(chuàng)業(yè)難度到底“難”在哪?是數(shù)據(jù)、算力、算法、資金、政策,到底是哪里卡住了大模型創(chuàng)業(yè)?
蔣鎰?wù)洌?/strong>大模型的創(chuàng)業(yè)基本上跟創(chuàng)業(yè)公司沒(méi)關(guān)系,尤其是通用大模型,只有大玩家才能“燒”的起。而對(duì)于中國(guó)第一個(gè)大模型,這里頭的障礙首先是數(shù)據(jù)。
OpenAI的數(shù)據(jù)基本是按照token來(lái)計(jì)算,而互聯(lián)網(wǎng)能爬取來(lái)訓(xùn)練的數(shù)據(jù)量,也就10T-20T的token,況且國(guó)內(nèi)的很多英文數(shù)據(jù)質(zhì)量比較糟糕,很多科學(xué)期刊/學(xué)術(shù)論文的英文數(shù)據(jù),相對(duì)還是要比中文富裕一些,只有片面的數(shù)據(jù)是悟不出背后的數(shù)據(jù)規(guī)律的。這里面還要注意,不能有錯(cuò)誤數(shù)據(jù),因?yàn)榈唾|(zhì)量的錯(cuò)誤數(shù)據(jù)會(huì)壓著模型長(zhǎng)智力;再加上中文還有一些敏感詞和敏感信息被過(guò)濾掉了,這些都會(huì)影響國(guó)內(nèi)大模型的數(shù)據(jù)。
其次還有算力的挑戰(zhàn)。大模型的預(yù)訓(xùn)練對(duì)卡的要求高到讓人恐懼,是成千上萬(wàn)塊英偉達(dá)A100來(lái)支撐的,但是沒(méi)有卡你咋訓(xùn)練大模型。所以能訓(xùn)練大模型的公司,卡肯定得有,數(shù)據(jù)得有,這兩個(gè)挑戰(zhàn)加起來(lái)已經(jīng)夠大了。
算法上我倒是覺(jué)得挑戰(zhàn)不大,因?yàn)樗惴ɑ疽呀?jīng)成型,頂多你把模型的形狀改一改,能夠更適配GPU,或者把模型里的某個(gè)關(guān)鍵環(huán)節(jié)改一改算子,也不是什么問(wèn)題,因?yàn)樗呀?jīng)成熟了。
劉大鴻:一方面,我覺(jué)得大模型的“大”更多是指“廣”,像ChatGPT覆蓋的范圍非常廣。語(yǔ)言本身是一個(gè)復(fù)雜的網(wǎng)絡(luò),如果覆蓋不夠廣,很難去概率接龍,導(dǎo)致很多數(shù)據(jù)無(wú)法生成。
目前,國(guó)內(nèi)很多大模型不算嚴(yán)格意義上的大模型,更像是一個(gè)簡(jiǎn)體中文的垂直模型,覆蓋面有限。為真正達(dá)到大模型的效果,需要涵蓋更多領(lǐng)域和語(yǔ)言,這需要大量高質(zhì)量的數(shù)據(jù)作為支撐,這對(duì)國(guó)內(nèi)來(lái)說(shuō)是一個(gè)短板。
國(guó)內(nèi)網(wǎng)上公開(kāi)的數(shù)據(jù)越來(lái)越少,而高質(zhì)量的內(nèi)容都出現(xiàn)在一些相對(duì)私域的地方,這都會(huì)影響大模型的訓(xùn)練結(jié)果;同時(shí),國(guó)內(nèi)很多的網(wǎng)絡(luò)數(shù)據(jù),經(jīng)過(guò)了大量的過(guò)濾和敏感內(nèi)容的處理,最終也會(huì)導(dǎo)致大模型的訓(xùn)練結(jié)果有缺憾。
另一方面,大模型的“大”還體現(xiàn)在“工程浩大”,這個(gè)問(wèn)題在包括中文在內(nèi)的所有語(yǔ)言環(huán)境下存在。最初我看到一些報(bào)道,英文剛訓(xùn)練出來(lái)的內(nèi)容也是不忍直視的,OpenAI經(jīng)過(guò)了大量的強(qiáng)化訓(xùn)練,經(jīng)過(guò)了RLHF(reinforcement learning from human feedback,譯為“以強(qiáng)化學(xué)習(xí)方式依據(jù)人類反饋優(yōu)化語(yǔ)言模型”),把這些內(nèi)容做了人類偏好的處理。
數(shù)據(jù)處理是一個(gè)非常浩大的工程,需要大量人力和時(shí)間積累。就像剛才蔣總所說(shuō),“算法”已經(jīng)趨于成熟,“數(shù)據(jù)”可能大公司也有不少,但是要實(shí)現(xiàn)整個(gè)工程就很難,并不是一堆原材料加一個(gè)方法就能做出來(lái)。
所以,國(guó)內(nèi)大模型也要經(jīng)歷從最初的內(nèi)容出現(xiàn)、到不斷強(qiáng)化、到人類不斷反饋的一個(gè)生長(zhǎng)過(guò)程,它可能會(huì)比OpenAI快一點(diǎn),但快不了太多。我記得當(dāng)時(shí)百度創(chuàng)始人李彥宏出來(lái)演講時(shí)說(shuō),“可能我們差幾個(gè)月或者差兩年”,但后面還接了句話說(shuō),“也可能我們永遠(yuǎn)追不上”,這話我覺(jué)得是有深層含義的。
就像我們現(xiàn)在回看中國(guó)互聯(lián)網(wǎng),大模型像是互聯(lián)網(wǎng)本身的映射,我們有一個(gè)什么樣的互聯(lián)網(wǎng),就會(huì)有一個(gè)什么樣的大模型。所以,從體量上我們可能會(huì)做出來(lái)一個(gè)很大的公司,但是在數(shù)據(jù)的廣度和工程上,還是有一個(gè)漫長(zhǎng)的過(guò)程。
(3)談大模型弱點(diǎn):避免AI盛產(chǎn)垃圾信息
高飛:我們剛才談的略有些悲觀色彩,但是既然說(shuō)到投資創(chuàng)業(yè),總得向前看,有投資人提到 “大模型的弱點(diǎn)就是中國(guó)AI領(lǐng)域未來(lái)的創(chuàng)業(yè)機(jī)會(huì)”,你們認(rèn)為既有玩家是否有致命弱點(diǎn)?
于千城:這扇窗已經(jīng)被打開(kāi)了,未來(lái)一定是往這個(gè)方向去走。既然中國(guó)有這么大的市場(chǎng)和需求,國(guó)家為什么還在觀望?我認(rèn)為AI的“奇點(diǎn)”時(shí)刻確實(shí)是到了,所以盡管方向是對(duì)的,但是種種不確定因素還沒(méi)有被排除掉,所以國(guó)家也沒(méi)有完全在這塊發(fā)力。但是,各行各業(yè)都在發(fā)力,因?yàn)榇蠹抑肋@是大趨勢(shì)。
中國(guó)的市場(chǎng)體量在那擺著,眾人拾柴火焰高,我相信中美之間未來(lái)在AI賽道的差距不會(huì)太大。從數(shù)據(jù)的角度,這么多年來(lái),國(guó)人已經(jīng)習(xí)慣把學(xué)術(shù)成果用英文來(lái)發(fā)表,給英文積攢了大量的語(yǔ)料,但是國(guó)家應(yīng)該會(huì)越來(lái)越重視這件事,會(huì)慢慢的去積攢有質(zhì)量的中文語(yǔ)料,去訓(xùn)練符合國(guó)家需要的大模型,所以從前景來(lái)看,很難說(shuō)中國(guó)會(huì)在這一塊落后多久。
陳煉:有個(gè)致命弱點(diǎn)。大模型所產(chǎn)生的內(nèi)容,會(huì)不會(huì)成為曾經(jīng)互聯(lián)網(wǎng)時(shí)代的垃圾郵件?人工智能確實(shí)是提升了內(nèi)容生產(chǎn)的效率,但是沒(méi)有提升內(nèi)容消費(fèi)的效率,這會(huì)讓很多人處于一種垃圾信息的獲取狀態(tài)。
大模型生成的內(nèi)容里,很多都是沒(méi)有靈魂的,純粹是為了節(jié)省成本而創(chuàng)造,這對(duì)社會(huì)可能并不是進(jìn)步,甚至可能變成一個(gè)曾經(jīng)的垃圾郵件狀態(tài),這是致命問(wèn)題。
【Part 2】大模型到底是不是創(chuàng)造了iPhone時(shí)刻?
(1)大模型與應(yīng)用=iOS與App Store?
高飛:關(guān)于大模型,投資也好,創(chuàng)業(yè)也好,如果像黃仁勛說(shuō)的是AI的iPhone時(shí)刻,大模型和應(yīng)用的關(guān)系會(huì)不會(huì)類似iOS和App Store的關(guān)系?
陳煉:它們其實(shí)有很大的類似之處。iOS操作系統(tǒng),本身是一個(gè)圖文、視頻、語(yǔ)音的交互存儲(chǔ)系統(tǒng),是最底層的一個(gè)電子系統(tǒng)。而大模型更像是一個(gè)云服務(wù)平臺(tái),是從圖文、視頻、語(yǔ)音量變引起質(zhì)變的一個(gè)基于權(quán)重隨機(jī)的智能算法產(chǎn)物。它們本質(zhì)都是基于圖文、視頻、語(yǔ)音做的一個(gè)操作系統(tǒng),這是它們的相同點(diǎn)。
不同點(diǎn)在于,一個(gè)是硬件操作系統(tǒng),另外是一個(gè)算法操作系統(tǒng),在算法操作系統(tǒng)上一定會(huì)衍生出各種各樣的、基于人們生活工作的、不同領(lǐng)域的App,所以這種可能性是存在的。
于千城:我也覺(jué)得會(huì)有。量變產(chǎn)生質(zhì)變,不光是在大模型上,在整個(gè)生態(tài)上也是一樣。各行各業(yè)的人都在創(chuàng)新,都在從他們的視角產(chǎn)生新想法,沒(méi)準(zhǔn)兒某一天某行業(yè)某個(gè)人想出一個(gè)奇特的應(yīng)用場(chǎng)景,所以我覺(jué)得形成應(yīng)用商店是遲早的事情。
高飛:那我們有信心了,開(kāi)發(fā)出一個(gè)媒體大模型應(yīng)用出來(lái)。
(2)談大模型與小模型:要通才,也要專家
高飛:有些ToB用戶會(huì)有疑問(wèn)說(shuō),大模型的應(yīng)用應(yīng)該怎么開(kāi)發(fā),如何把大模型的通用理解能力解耦出來(lái),產(chǎn)生一種混合大模型或私有大模型?就像云領(lǐng)域的混合云和私有云。
蔣鎰?wù)洌?/strong>這肯定存在。首先真正的能叫得上大模型的,目前只有一個(gè)OpenAI的GPT,GPT-4叫大模型,GPT-3.5都有點(diǎn)弱。
但通用模型有個(gè)問(wèn)題,因?yàn)樗鼘W(xué)的知識(shí)大都是泛泛的、通用的東西,這就導(dǎo)致很難完全對(duì)應(yīng)到垂直領(lǐng)域。你讓一個(gè)人熟讀百書(shū)什么都懂,和一個(gè)行業(yè)專家放在一起,它的語(yǔ)料非常不一樣。所以你不可能要求一個(gè)通用大模型是全才,在各行各業(yè)都是專家,這對(duì)于它來(lái)說(shuō)太難了。
所以垂直大模型絕對(duì)會(huì)存在,垂直大模型有可能還能細(xì)分,比如醫(yī)療行業(yè)都能細(xì)分出一大堆,偏向不同傾向的模型。
劉大鴻:拿我們公司的創(chuàng)業(yè)實(shí)踐來(lái)看,很多企業(yè)找我們想做一個(gè)自己的企業(yè)模型,比如說(shuō)集團(tuán)公司,它內(nèi)部的資料非常多,覺(jué)得搜索起來(lái)很麻煩,就想要開(kāi)發(fā)一個(gè)模型,像ChatGPT一樣,只要向它提問(wèn),它就能回答對(duì)應(yīng)的內(nèi)部資料內(nèi)容。
這件事不好做(要是好做,我估計(jì)都能做20個(gè)客戶了),但為什么難做?因?yàn)楫?dāng)我們訓(xùn)練模型時(shí),發(fā)現(xiàn)如果沒(méi)有大模型的語(yǔ)言能力,訓(xùn)練出來(lái)的東西它不會(huì)說(shuō)話。
后來(lái)我有一個(gè)結(jié)論,這個(gè)結(jié)論可能對(duì),也可能不對(duì)。在目前階段,一個(gè)垂直模型很難脫離大模型之外獨(dú)立成型,小模型或垂直模型是依附大模型的一個(gè)產(chǎn)物,它仍然要有基于大模型的語(yǔ)言能力。今天的大模型是Large Language Model,本質(zhì)上還是語(yǔ)言模型,垂直模型很難有這種語(yǔ)言能力(它可能有內(nèi)核訓(xùn)練出來(lái),目前我們的解決方案就是這么訓(xùn)練的)。所以,垂直模型一定是未來(lái)的大趨勢(shì),這是第一點(diǎn)。
第二,未來(lái)每一個(gè)在互聯(lián)網(wǎng)向外輸出內(nèi)容的企業(yè)和個(gè)人,他們或許都會(huì)有模型。五六年前我看過(guò)一本書(shū),講人工智能算法的,說(shuō)到了模型的概念,說(shuō)未來(lái)是一個(gè)模型社會(huì),每個(gè)人、每個(gè)企業(yè)都有模型。比如員工去公司面試,其實(shí)是員工的模型和這家公司的模型先進(jìn)行了交互,覺(jué)得OK了,員工的肉身再去面試。我覺(jué)得這個(gè)設(shè)想是成立的。
像是在互聯(lián)網(wǎng)上活躍的每個(gè)人,或者是一些消費(fèi)者,都可能會(huì)形成各自的模型。今天的數(shù)字人背后,未來(lái)都會(huì)是一個(gè)小模型。我就在訓(xùn)練我的模型,訓(xùn)練好以后,我去抖音上,一邊是我另一邊是他,我們不停的對(duì)話,讓他接受我的思想,讓他越來(lái)越像我,他們也可以去學(xué)一些新東西,我覺(jué)得這是完全有可能的。
未來(lái)的大模型,包括百度的文心一言、阿里的通義千問(wèn)、OpenAI的ChatGPT,它們已經(jīng)云化了,我覺(jué)得大模型就是云。企業(yè)或個(gè)人有很多的數(shù)據(jù),有的數(shù)據(jù)是私有的,無(wú)法向大模型去投喂。所以我覺(jué)得未來(lái)要出一些協(xié)議,什么樣的數(shù)據(jù)是大模型“允許采集的”和“不允許采集的”,什么樣的數(shù)據(jù)要通過(guò)加密算法、然后去脫敏、再去投喂給它(模型)等等,我覺(jué)得有非常多的空間可以做。但是我堅(jiān)信的是,未來(lái)會(huì)有垂直模型,甚至個(gè)人會(huì)有模型。
(3)談大模型之上的超級(jí)應(yīng)用
高飛:我們還想探討的是,如果說(shuō)99%的應(yīng)用都是基于ChatGPT開(kāi)發(fā)的,那么這些應(yīng)用是否還有成長(zhǎng)的潛力?其實(shí)TikTok某種程度上來(lái)說(shuō),是基于移動(dòng)平臺(tái)之上長(zhǎng)出來(lái)的一個(gè)應(yīng)用,所以大模型未來(lái)是否會(huì)長(zhǎng)出一個(gè)超級(jí)巨頭出來(lái)?
陳煉:一定能。大模型本質(zhì)上會(huì)讓草根創(chuàng)業(yè)變得更難,它會(huì)形成更有優(yōu)勢(shì)的壟斷。大模型依賴強(qiáng)大的數(shù)據(jù)、算力,這其實(shí)是好多公司無(wú)法達(dá)到的,所以它的壟斷更容易。
蔣鎰?wù)洌?/strong>有點(diǎn)難說(shuō)。因?yàn)镃hatGPT在我看來(lái)它是個(gè)工具,OpenAI自己可能也在苦惱,“大家跟我的工具聊天,我也賺不了多少錢(qián)”,所以在它內(nèi)部已經(jīng)看到了一些外圍的應(yīng)用,不管是感知上、信息獲取、還是應(yīng)用場(chǎng)景,ChatGPT實(shí)際上是很難全打通的,而這個(gè)權(quán)利是握在創(chuàng)業(yè)者手上的,所以硅谷的創(chuàng)業(yè)基本上都是在ChatGPT之上干點(diǎn)什么小事兒。
我也希望看到大模型之上,能讓開(kāi)發(fā)者在上面做應(yīng)用,這件事遲早會(huì)發(fā)生。但要說(shuō)這上面能不能長(zhǎng)出一個(gè)巨大的應(yīng)用,一個(gè)應(yīng)用把什么事都干了,目前還看不太清楚,因?yàn)楝F(xiàn)在是百花齊放的狀態(tài)。
劉大鴻:我覺(jué)得一定會(huì)的,原因很簡(jiǎn)單,今天的大模型一定會(huì)成為智能云,目前基于阿里云誕生的、用阿里云服務(wù)的公司有很多,美國(guó)很多公司都用亞馬遜云科技,這很正常。
今天我們來(lái)看整個(gè)生態(tài),OpenAI的月活已經(jīng)達(dá)到10億,我認(rèn)為這不僅僅是它本身做得好,而是AI技術(shù)的突破,讓獲取AI能力的成本一下子降得非常低。所以巨頭的敵人可能不是這些挑戰(zhàn)者,而是到了某個(gè)時(shí)間一定會(huì)突然出現(xiàn),然后巨頭就會(huì)被替代掉或被遺忘掉。
我去拜訪微軟時(shí),學(xué)到一個(gè)詞叫“單位智能(Unit Intelligence)”,這個(gè)詞是OpenAI創(chuàng)始人Sam Altman和LinkedIn聯(lián)合創(chuàng)始人Reid Hoffman在一次訪談中提到的,當(dāng)你獲取單位智能的費(fèi)用和資源是之前的千分之一時(shí),你作為個(gè)人、企業(yè)愿意為智能付費(fèi)的意愿增加一千倍的時(shí)候,你把這兩個(gè)事情乘在一起,就是10的6次方 (一百萬(wàn)倍),你要思考的是這個(gè)事情就在發(fā)生,即使在你的行業(yè)還沒(méi)有發(fā)生,那么很快它就會(huì)發(fā)生。
當(dāng)你是一個(gè)個(gè)人、一個(gè)產(chǎn)品團(tuán)隊(duì)、一個(gè)組織、一個(gè)公司或者整個(gè)國(guó)家,當(dāng)你的手中有10的6次方的單位智能時(shí),你可以想象這個(gè)世界會(huì)變成什么樣?所以我認(rèn)為在未來(lái)的1-2年,會(huì)看到有一個(gè)新東西出來(lái),快速成長(zhǎng)成為一個(gè)巨頭,這是毋庸置疑的事情。
于千城:我認(rèn)為一定是能的,原因有兩個(gè)。第一,大模型不會(huì)跳出Gartner技術(shù)成熟度曲線,也就是會(huì)有一個(gè)泡沫期,大家都蜂擁而上,最后跌落低谷,那么最后堅(jiān)持下來(lái)的一定成為真正的主宰者。
第二,這東西它現(xiàn)在畢竟還不是生產(chǎn)力,造工具的企業(yè)一定很難親自把這個(gè)工具用到生產(chǎn)領(lǐng)域,因?yàn)樗欢a(chǎn),不能跟各行各業(yè)相結(jié)合,所以終究會(huì)有一個(gè)大巨頭出來(lái),把工具變成生產(chǎn)力,來(lái)推動(dòng)社會(huì)發(fā)展。
高飛:我覺(jué)得很難。蘋(píng)果是一個(gè)硬件公司,所以它對(duì)于開(kāi)發(fā)太復(fù)雜的應(yīng)用,其實(shí)沒(méi)有那么大野心。而OpenAI是一個(gè)互聯(lián)網(wǎng)公司,尤其是國(guó)內(nèi)這些互聯(lián)網(wǎng)公司做大模型,其實(shí)有很強(qiáng)的做應(yīng)用的沖動(dòng),比如阿里有釘釘,騰訊有騰訊會(huì)議,所以巨頭會(huì)不會(huì)把空間留出來(lái),我要打個(gè)問(wèn)號(hào)。我倒不是說(shuō)不可能有巨頭應(yīng)用出現(xiàn),而是,是否存在這樣一個(gè)市場(chǎng)空間的問(wèn)題。
(4)大模型值得讓“大部分行業(yè)”都再做一遍
高飛:前一陣子,陸奇在奇績(jī)創(chuàng)壇有個(gè)論斷被刷屏了,他說(shuō)大模型值得讓所有行業(yè)都重新再做一遍,你們?cè)趺纯创@個(gè)問(wèn)題?
劉大鴻:這對(duì)“大部分行業(yè)”應(yīng)該是成立的,只是會(huì)有個(gè)先后順序。數(shù)字經(jīng)濟(jì)領(lǐng)域一定是先開(kāi)始,慢慢再延伸到制造業(yè)、電商、外貿(mào)等,我覺(jué)得不是每個(gè)公司都會(huì)去做大模型,但每個(gè)公司一定都會(huì)有自己的模型。
但再做一遍的方式是什么?ChatGPT出現(xiàn)之后,人機(jī)交互的方式發(fā)生了根本性變化(就像從諾基亞到iPhone一樣),以后所有產(chǎn)品的交互方式都會(huì)是以Chat為主。
未來(lái),所有行業(yè)交互的效率,也會(huì)從過(guò)去的復(fù)雜方式變?yōu)樽詣?dòng)化、智能化,這會(huì)是所有行業(yè)變化的“點(diǎn)”,由于交互方式發(fā)生了變化,所以效率革命一定會(huì)推動(dòng)所有行業(yè)再做一遍。
陳煉:現(xiàn)在的AI看上去很智能,但其實(shí)智力是很弱的,它是基于量變引起質(zhì)變的、基于數(shù)據(jù)權(quán)重的一個(gè)隨機(jī)智能算法產(chǎn)物,它其實(shí)并沒(méi)有真實(shí)的思考能力。但如果有一天,AI真能達(dá)到人的主動(dòng)性思考能力時(shí),確實(shí)需要去按照人工智能的方式再做一遍。
【Part 3】大模型是不是有血型?
(1)論大模型的自我修養(yǎng)
高飛:接下來(lái)我們來(lái)探討一個(gè)內(nèi)在問(wèn)題,我們會(huì)發(fā)現(xiàn),跟大模型交流起來(lái),它還挺有道德修養(yǎng)的,甚至有政治正確的敏感性,這是如何修煉出來(lái)的?
陳煉:主要看數(shù)據(jù)的基因和后天的培養(yǎng)。首先,當(dāng)訓(xùn)練數(shù)據(jù)本身具有政治正確性的時(shí)候,那么這個(gè)模型就會(huì)表現(xiàn)出政治正確性。其次,用一些技術(shù)手段來(lái)增強(qiáng)模型的道德和政治正確性,比如在算法上加一些規(guī)則和約束,來(lái)避免大模型產(chǎn)生偏見(jiàn)和歧視性的文本。
(2)AI分不分本地人?
高飛:各國(guó)都在做大模型,道德規(guī)范都不一樣,以后是否會(huì)進(jìn)化出不同血型的大模型?就像我們各個(gè)民族一樣,每個(gè)國(guó)家都有自己種族的大模型?
陳煉:我覺(jué)得不太會(huì)。大模型很像是一個(gè)操作系統(tǒng),大家在使用Windows操作系統(tǒng)時(shí),如果發(fā)現(xiàn)系統(tǒng)崩潰了,就提交一個(gè)報(bào)告上去,微軟那邊就修復(fù)系統(tǒng)的一個(gè)Bug。所以,用的人越來(lái)越多,提交的Bug也會(huì)越來(lái)越多,Windows打的補(bǔ)丁也越來(lái)越多,系統(tǒng)就會(huì)越來(lái)越完善。
同理,大模型在使用過(guò)程中,訓(xùn)練方也會(huì)用數(shù)據(jù)訓(xùn)練數(shù)據(jù),但是它存在一個(gè)問(wèn)題,就是不同國(guó)家、不同區(qū)域的人使用的大模型其實(shí)是被全球壟斷的,全球的通用大模型其實(shí)只有那么幾個(gè),當(dāng)全球人在用這些大模型的時(shí)候,只會(huì)在完善這些大模型,但是并不會(huì)衍生出不同血型的大模型。就像操作系統(tǒng)一樣,全球也只有幾個(gè)操作系統(tǒng)。
除非是垂直領(lǐng)域,每個(gè)領(lǐng)域都有自己的模型,肯定會(huì)隨著當(dāng)?shù)厥褂萌说牧?xí)慣不同,訓(xùn)練數(shù)據(jù)的不同,而造就出不同的垂直模型。
蔣鎰?wù)洌?/strong>如果是通用大模型,基本上是被頂部?jī)扇齻€(gè)玩家給壟斷了。做應(yīng)用的,肯定會(huì)挑通用能力更強(qiáng)的,弱一點(diǎn)就不會(huì)被選,生態(tài)也會(huì)督促頂部的幾個(gè)模型存活下來(lái),所以大模型不會(huì)有各國(guó)的血型。
劉大鴻:我覺(jué)得一定會(huì)。就像字典,全球有名的字典是有限的,但是用有限的字典寫(xiě)無(wú)限的文章的人太多了。所以最后一定會(huì)誕生出各種各樣的、不同特征的大模型。
現(xiàn)階段,我覺(jué)得文心一言、ChatGPT的回答不好玩,我們?nèi)祟愒诹奶鞎r(shí)是有非常豐富的情緒、情感、表情的,但是大模型現(xiàn)在還做不到,我覺(jué)得以后一定會(huì)出來(lái),哪天我去訓(xùn)練一個(gè)會(huì)說(shuō)人話的大模型出來(lái)。
于千城:我覺(jué)得一定會(huì)。第一,大模型不僅僅是一個(gè)生產(chǎn)力技術(shù),它對(duì)社會(huì)的影響是革命性的,所以文化、政治、軍事等方方面面都會(huì)受到影響。第二,人其實(shí)是喜歡當(dāng)造物主的,好不容易造出一個(gè)硅基生命,自然也會(huì)想要把它做的更豐富,人類一定會(huì)朝這個(gè)方向努力。
高飛:插個(gè)題外話,大模型時(shí)代,巨頭都在快馬加鞭的布局,唯獨(dú)騰訊沒(méi)有動(dòng)靜,騰訊是不是掉隊(duì)了?
劉大鴻:小馬哥在網(wǎng)上有個(gè)講話,說(shuō)“我們不急于去造燈泡”,這就對(duì)應(yīng)到之前業(yè)界有個(gè)比喻說(shuō)“大模型像電力革命一樣”,所以如果大模型是電廠,那么我們生產(chǎn)產(chǎn)品的公司就是造電器的。
騰訊現(xiàn)在為什么還不著急?我有次跟騰訊的一個(gè)核心工程師吃飯,聽(tīng)他講公司內(nèi)部在做混元大模型,以及在應(yīng)用層面上的一些想法,聽(tīng)到后面我連飯都沒(méi)心思吃了,就想著趕緊回去干活,因?yàn)槲矣X(jué)得,如果騰訊的產(chǎn)品推出,市場(chǎng)上很多產(chǎn)品就沒(méi)有存在的價(jià)值了。所以我認(rèn)為騰訊并沒(méi)有閑著,而是會(huì)一步邁到應(yīng)用產(chǎn)品。
(3)大模型時(shí)代下,創(chuàng)業(yè)者還能做什么
高飛:如果說(shuō)未來(lái)中國(guó)有自己的大模型,國(guó)外有國(guó)外的大模型,那么國(guó)內(nèi)與海外對(duì)大模型領(lǐng)域投資邏輯的本質(zhì)差別在哪里?
于千城:我覺(jué)得國(guó)外公司從技術(shù)儲(chǔ)備、到投資的遠(yuǎn)瞻性,要遠(yuǎn)遠(yuǎn)超乎我們的想象。國(guó)內(nèi)很多都在說(shuō),美國(guó)主要把大模型放在C端,但是我相信他們?cè)贐端應(yīng)該已經(jīng)做了很多沉淀,只不過(guò)沒(méi)有把它公布出來(lái)。
國(guó)內(nèi)應(yīng)該是有實(shí)力跟美國(guó)叫板,因?yàn)榛ヂ?lián)網(wǎng)紅利見(jiàn)頂之后,大家還是有創(chuàng)新需求,AI正好給了大家這樣一個(gè)機(jī)會(huì),跟元宇宙技術(shù)結(jié)合起來(lái),前途會(huì)比較清晰,所以每個(gè)公司都會(huì)在這上面發(fā)力,資本市場(chǎng)當(dāng)然也不會(huì)落后。
所以我的觀點(diǎn)是,現(xiàn)在也沒(méi)法談?wù)l好誰(shuí)壞,兩個(gè)國(guó)家肯定都在發(fā)力。只不過(guò)我們對(duì)美國(guó)的認(rèn)識(shí)可能不清晰,真實(shí)的差距到底多大,其實(shí)我們不清楚。
劉大鴻:國(guó)內(nèi)在大模型領(lǐng)域的投資,相比于美國(guó)來(lái)看,我覺(jué)得還是差很遠(yuǎn),完全不在一個(gè)量級(jí)上,它的創(chuàng)新速度以及產(chǎn)品迭代速度遠(yuǎn)超國(guó)內(nèi)。我甚至感覺(jué)我們是給國(guó)外大模型做宣傳的,國(guó)內(nèi)媒體比較發(fā)達(dá),事實(shí)上做的人還是非常少。
陳煉:國(guó)外可能更偏重長(zhǎng)期的價(jià)值投資,不管是特斯拉,還是OpenAI,他們都是投資了10年8年才開(kāi)始有回報(bào)。但國(guó)內(nèi)可能更偏向于短期效益,兩三年之內(nèi)是不是能實(shí)現(xiàn)盈利,能不能有流水,有多少活躍用戶,可能更偏向于這些。
所以現(xiàn)在的垂直大模型非常高效,因?yàn)樗挥?xùn)練出來(lái)立馬就能見(jiàn)效,比如醫(yī)療模型搞一個(gè)大前端都能掙錢(qián)。
蔣鎰?wù)洌?/strong>確實(shí)美國(guó)的創(chuàng)新能力很強(qiáng),中國(guó)離人家的距離還很遠(yuǎn),比如大模型這一波的投資。美國(guó)的好多投資你不用看什么回報(bào),誰(shuí)知道哪一天才能回來(lái)呢,它更大的野心很有可能很長(zhǎng)遠(yuǎn),我們沒(méi)辦法想那么遠(yuǎn)。
高飛:夢(mèng)想總要有的,我們的生活也要繼續(xù),總要做點(diǎn)什么事情。如果從總要做點(diǎn)事情的角度,基于大模型這一代,你們接下來(lái)想干點(diǎn)啥?
于千城:對(duì)于我們初創(chuàng)公司而言,訓(xùn)練模型、微調(diào)模型這些路數(shù)基本上是不可能的,所以我們現(xiàn)在的主要工作,就是用本地知識(shí)庫(kù),把客戶的數(shù)據(jù)變成本地的知識(shí),輔助大模型來(lái)做垂直應(yīng)用。
我們?cè)趭A縫當(dāng)中,只能先讓客戶接觸到這種大模型工具,哪怕它不夠準(zhǔn)確,但是類似于做市場(chǎng)教育,讓大家都知道這個(gè)時(shí)代已經(jīng)到來(lái)了。
蔣鎰?wù)洌?/strong>我完全跟于總站在同一條戰(zhàn)線上,因?yàn)樵蹅冏龃竽P蛪焊蜎](méi)戲,如果代價(jià)不高的話,做微調(diào)還是敢調(diào)的。實(shí)際上,行業(yè)客戶已經(jīng)被AI浪潮的風(fēng)吹到躍躍欲試,而且看到AI確實(shí)有很多用處,所以機(jī)會(huì)縫兒是有的,至于機(jī)會(huì)到底有多大,我們先沖進(jìn)去再說(shuō),在垂直領(lǐng)域先深耕一下。
陳煉:我們雖然是小公司,但是我們有兩臺(tái)A100服務(wù)器,也訓(xùn)練出來(lái)了醫(yī)生、律師等行業(yè)的垂直模型,部署了幾家出版社,都已經(jīng)商用。
但是我現(xiàn)在真正想做的產(chǎn)品是“誰(shuí)是誰(shuí)”,因?yàn)樵诖竽P蜁r(shí)代,AI可以克隆人的聲音、克隆人的視頻、產(chǎn)生很多垃圾信息,所以我們想把“真實(shí)的”和“AI的”做一個(gè)識(shí)別,到底誰(shuí)是誰(shuí),這肯定是下一個(gè)會(huì)爆發(fā)的需求點(diǎn)。
劉大鴻:從去年開(kāi)始,我們已經(jīng)在嘗試做個(gè)人助手,國(guó)外有一個(gè)對(duì)標(biāo)產(chǎn)品叫“Pi”,我們做的是中國(guó)的Pi,只是我們比他們做的早一點(diǎn)。我們的產(chǎn)品叫“快秘書(shū)”,給每個(gè)人設(shè)計(jì)一個(gè)AI助手,同時(shí)也會(huì)給每個(gè)在網(wǎng)上輸出內(nèi)容和服務(wù)的個(gè)人做垂直模型,這個(gè)市場(chǎng)歡迎度比較高。
【嘉賓簡(jiǎn)介】
主持人:
高飛,知名媒體人,至頂科技CEO兼總編輯,中國(guó)輕工業(yè)信息中心智慧生活產(chǎn)業(yè)促進(jìn)中心副主任,中國(guó)上市公司協(xié)會(huì)信息與數(shù)字化委委員。他長(zhǎng)期致力于數(shù)字經(jīng)濟(jì)、數(shù)字化轉(zhuǎn)型等方面的課題研究,參與撰寫(xiě)了《中國(guó)云計(jì)算產(chǎn)業(yè)發(fā)展白皮書(shū)》等多份權(quán)威報(bào)告。作為知名科技策展人,其參與策劃的“世界智能大會(huì)”,是AI領(lǐng)域的首個(gè)國(guó)家級(jí)國(guó)際性會(huì)議。
對(duì)話嘉賓(排名不分先后順序):
蔣鎰?wù)洌?多年互聯(lián)網(wǎng)/AI經(jīng)驗(yàn),在Adobe, HP software負(fù)責(zé)過(guò)研發(fā)軟件產(chǎn)品,目前在初創(chuàng)VitallyAI任職CTO。最近主要關(guān)注大模型:文生文, 文生圖以及多模態(tài)的實(shí)際垂直市場(chǎng)的應(yīng)用。目前聚焦?fàn)I銷/市場(chǎng)領(lǐng)域的AIGC應(yīng)用開(kāi)發(fā)和服務(wù)。
于千城,寧夏云瑞致勝科技有限公司CEO,目前聚焦于AI大模型創(chuàng)業(yè),致力于服務(wù)垂直行業(yè)中小企業(yè)客戶。
陳煉,北京橙溪科技創(chuàng)始人,從事人工智能(大模型訓(xùn)練)、互聯(lián)網(wǎng)(出版社等等)、虛擬3D(虛擬辦公室)、區(qū)塊鏈(公網(wǎng)Dapp,Layer2)等研發(fā))。
劉大鴻,波特時(shí)空創(chuàng)始人。10億級(jí)AI數(shù)據(jù)預(yù)處理經(jīng)驗(yàn),互聯(lián)網(wǎng)科技領(lǐng)域連續(xù)創(chuàng)業(yè)者,分布式存儲(chǔ)算法發(fā)明專利發(fā)明人。
好文章,需要你的鼓勵(lì)
新加坡國(guó)立大學(xué)研究團(tuán)隊(duì)開(kāi)發(fā)了SPIRAL框架,通過(guò)讓AI與自己對(duì)弈零和游戲來(lái)提升推理能力。實(shí)驗(yàn)顯示,僅訓(xùn)練AI玩簡(jiǎn)單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無(wú)需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟(jì)大學(xué)團(tuán)隊(duì)開(kāi)發(fā)的GIGA-ToF技術(shù)通過(guò)融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機(jī)噪聲問(wèn)題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實(shí)現(xiàn)37.9%的精度提升,并在真實(shí)設(shè)備上展現(xiàn)出色泛化能力,為機(jī)器人、AR和自動(dòng)駕駛等領(lǐng)域提供更可靠的3D視覺(jué)解決方案。
伊利諾伊大學(xué)研究團(tuán)隊(duì)通過(guò)對(duì)比實(shí)驗(yàn)發(fā)現(xiàn),經(jīng)過(guò)強(qiáng)化學(xué)習(xí)訓(xùn)練的視覺(jué)語(yǔ)言模型雖然表現(xiàn)出"頓悟時(shí)刻"現(xiàn)象,但這些自我糾錯(cuò)行為并不能實(shí)際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗(yàn)證差距",即生成答案的能力強(qiáng)于驗(yàn)證答案質(zhì)量的能力,且模型在自我驗(yàn)證時(shí)無(wú)法有效利用視覺(jué)信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機(jī)構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過(guò)動(dòng)態(tài)稀疏性實(shí)現(xiàn)大語(yǔ)言模型訓(xùn)練加速1.6倍,計(jì)算成本降低2.2倍。該方法使用SVD稀疏性估計(jì)器智能選擇重要計(jì)算部分,在保持模型性能的同時(shí)顯著提升訓(xùn)練效率,已在多個(gè)任務(wù)上驗(yàn)證有效性。
關(guān)注科技創(chuàng)新、技術(shù)投資。
以文會(huì)友,左手硬核科技,右手浪漫主義。