AI初創(chuàng)企業(yè)主要分為兩種風(fēng)格,我們將在今天的文章中,對二者做出分析與展望。
當(dāng)下,AI初創(chuàng)企業(yè)正在快速涌現(xiàn)。根據(jù)斯坦福大學(xué)AI指數(shù)報(bào)告數(shù)據(jù),自2014年以來,已經(jīng)有超過15798家AI初創(chuàng)拿到超過40萬美元的投資。正如CB Insights公布的結(jié)果,AI初創(chuàng)企業(yè)在2019年吸引到創(chuàng)紀(jì)錄的266億美元投資。鑒于統(tǒng)計(jì)數(shù)據(jù)的指數(shù)級增長,投資者與企業(yè)家都迫切希望借AI的東風(fēng)扶搖直上。
▲ 圖片來源/斯坦福大學(xué)AI指數(shù)報(bào)告,88頁
然而,AI初創(chuàng)企業(yè)擁有自己的分類方式。本文將主要研究垂直與橫向AI初創(chuàng)企業(yè)之間的區(qū)別與共性。以下提出的見解,基于一家硅谷風(fēng)險(xiǎn)投資商、一家柏林AI風(fēng)投工作室以及一位AI創(chuàng)業(yè)者的共同討論。
要理解垂直與橫向AI產(chǎn)品,我們首先需要明確AI產(chǎn)品的開發(fā)主題。
每一款基于AI技術(shù)的產(chǎn)品,都擁有大致相同的工作流程。在各個(gè)機(jī)器學(xué)習(xí)項(xiàng)目中,團(tuán)隊(duì)都需要收集及準(zhǔn)備數(shù)據(jù)、開發(fā)模型、部署模型、監(jiān)控模型性能等。以下列出的CRISP-DM模型描述了機(jī)器學(xué)習(xí)的一般工作流程。
▲ 圖片來源/Uni Dresden
要辨別垂直與橫向AI初創(chuàng)企業(yè)的區(qū)別,首先要對數(shù)據(jù)科學(xué)工作流擁有清晰的了解。垂直AI初創(chuàng)企業(yè)需要擁有「完整的工作流」以交付最終產(chǎn)品,橫向AI初創(chuàng)企業(yè)則專注于打造「通用的數(shù)據(jù)科學(xué)工作流」中的特定環(huán)節(jié)。
“垂直AI初創(chuàng)企業(yè)”提供基于AI的產(chǎn)品,其擁有完整的工作流,以解決針對性較強(qiáng)的客戶需求。這些初創(chuàng)企業(yè)以端到端方式開發(fā)完整產(chǎn)品,業(yè)務(wù)鏈貫穿從「商業(yè)案例」到「產(chǎn)品性能監(jiān)控」等各個(gè)步驟。
以Vara公司為例,這是一家典型的垂直AI初創(chuàng)企業(yè),使用AI技術(shù),通過X光片識別乳腺癌癥狀。Vara是第一家獲得美國聯(lián)邦政府批準(zhǔn),可利用其AI解決方案協(xié)助放射科醫(yī)師處理日常診斷的企業(yè)。該公司擁有自己完整的數(shù)據(jù)科學(xué)工作流,并以此為基礎(chǔ)提供基于AI的創(chuàng)新產(chǎn)品。
AI是一種強(qiáng)大的工具,能夠幫助企業(yè)在特定應(yīng)用場景當(dāng)中,實(shí)現(xiàn)超越人類的效能水平。AI也為交付新產(chǎn)品、改進(jìn)現(xiàn)有產(chǎn)品或自動執(zhí)行任務(wù),開辟了新的可能性。垂直AI初創(chuàng)企業(yè)能夠針對特定用例優(yōu)化預(yù)測結(jié)果,而一旦獲得成功,他們在對應(yīng)用例中的表現(xiàn)將遠(yuǎn)超人類或者其他AI競爭對手。
“垂直AI初創(chuàng)企業(yè)中聚集著來自各個(gè)領(lǐng)域的專家,他們這里出任關(guān)鍵職位(例如產(chǎn)品角色)。例如,一家制造自動癌癥檢測產(chǎn)品的企業(yè),可能會聘用放射科醫(yī)師及/或腫瘤科醫(yī)師。” ——創(chuàng)業(yè)企業(yè)家Sahar Mor
但是,垂直AI初創(chuàng)企業(yè)往往難以通過調(diào)整,讓產(chǎn)品在其他類似用例中發(fā)揮同樣的效果。對于擅長識別乳腺癌特征的Vara公司來說,他們的解決方案,就很難在診斷腦癌方面發(fā)揮作用。AI模型往往在少數(shù)特定任務(wù)中表現(xiàn)良好。Vara當(dāng)然可以復(fù)用現(xiàn)有模型開發(fā)流程,但AI模型的訓(xùn)練工作必須從頭再來,即利用新的數(shù)據(jù)集學(xué)習(xí)腦癌檢測。
“在未來十年內(nèi),垂直AI初創(chuàng)企業(yè)將極大改變某些行業(yè)的具體運(yùn)作方式。”——Merantix公司CTO兼聯(lián)合創(chuàng)始人Rasmus Rothe
其他垂直AI初創(chuàng)企業(yè),還包括自動駕駛汽車公司W(wǎng)aymo,以及金融犯罪預(yù)防企業(yè)hawk.ai??偠灾瑢Υ怪盇I初創(chuàng)企業(yè)來說,最重要的就是保證把少數(shù)特定問題解決掉、解決好,并以此為基礎(chǔ)建立起穩(wěn)定的商業(yè)模式。由于新模型的訓(xùn)練往往需要大量時(shí)間與數(shù)據(jù),因此,其初始用例必須具備充分的說服力,支持公司一路發(fā)展至盈利階段。
“橫向AI企業(yè)“的目標(biāo),在于幫助數(shù)據(jù)科學(xué)家們更高效地完成數(shù)據(jù)科學(xué)工作流。為此,橫向AI初創(chuàng)企業(yè)面向的客戶,往往是數(shù)據(jù)科學(xué)家或者開發(fā)團(tuán)隊(duì)。
橫向AI企業(yè)往往會從數(shù)據(jù)科學(xué)工作流中,選擇特定的一個(gè)或者多個(gè)環(huán)節(jié)加以改進(jìn)。例如,橫向AI企業(yè)可以專注于幫助數(shù)據(jù)科學(xué)家們監(jiān)控其模型??傊瑱M向AI產(chǎn)品與特定用例無關(guān),其開發(fā)成果可服務(wù)于任何基于AI的產(chǎn)品。
Saturn Cloud就是一家橫向AI初創(chuàng)企業(yè),旨在提高數(shù)據(jù)科學(xué)家們的工作效率。他們提供一項(xiàng)全托管服務(wù),幫助數(shù)據(jù)科學(xué)家們使用自己最熟悉的工具(Python、Jupyter及Dask等)進(jìn)行大規(guī)模工作。這是一款通用型工具,適用于一切基于AI技術(shù)的產(chǎn)品。
“跨越幾乎各個(gè)行業(yè),自動化數(shù)據(jù)科學(xué)工作流,能夠?yàn)樽罱K用戶帶來更高效的團(tuán)隊(duì)協(xié)作與工作體驗(yàn)。與此同時(shí),Python的使用量開始一路猛增,并迅速獲得數(shù)據(jù)科學(xué)從業(yè)者們的青睞。因此,對大多數(shù)數(shù)據(jù)團(tuán)隊(duì)而言,使用一套Python原生工具來分析并自動化處理日常工作,將極具現(xiàn)實(shí)意義。” ——Anaconda公司前創(chuàng)始人、Saturn Cloud公司聯(lián)合創(chuàng)始人Hugo Shi
根據(jù)IDC發(fā)布的預(yù)測結(jié)果,隨著數(shù)據(jù)總量呈指數(shù)級增長,橫向AI解決方案也將在未來發(fā)揮越來越重要的作用。數(shù)據(jù)是AI類產(chǎn)品的核心驅(qū)動力,因此可用數(shù)據(jù)量的增加,也將意味著,有價(jià)值數(shù)據(jù)產(chǎn)品的發(fā)展?jié)摿⒉讲教嵘?。另外,?shù)據(jù)科學(xué)家人才市場也保持著穩(wěn)定增長。根據(jù)IBM開展的一項(xiàng)研究,到2020年,美國對于數(shù)據(jù)科學(xué)家的需求將增長28%,達(dá)到270萬。很明顯,橫向AI解決方案的目標(biāo)客戶群體仍在發(fā)展壯大。
▲ 圖片來源/IDC
但是,橫向AI產(chǎn)品也面臨著自己的發(fā)展難題。它們必須能夠無縫集成至目標(biāo)數(shù)據(jù)科學(xué)工作流及軟件堆棧中。
此外,Rasmus Rothe表示,“在開發(fā)橫向AI產(chǎn)品時(shí),奪取市場領(lǐng)導(dǎo)地位將變得至關(guān)重要。”橫向AI初創(chuàng)企業(yè)往往很難收集到專有數(shù)據(jù),并據(jù)此建立起排他性的商業(yè)優(yōu)勢。再有,在選擇將數(shù)據(jù)科學(xué)工作流中的哪個(gè)或哪些環(huán)節(jié)作為業(yè)務(wù)重點(diǎn)時(shí),大家還需要牢記,針對不同AI模型的不同具體要求。只有始終高度關(guān)注對目標(biāo)受眾最具價(jià)值的功能,橫向AI初創(chuàng)企業(yè)才能從同儕中脫穎而出,闖出一片屬于自己的天地。
“雖然橫向AI企業(yè)往往面臨更激烈的競爭態(tài)勢,但其產(chǎn)品的使用門檻一般更低,相關(guān)技術(shù)可以輕松融入采購方的技術(shù)棧當(dāng)中。”——投資人Jason Risch
橫向AI初創(chuàng)企業(yè)中的典型案例,包括數(shù)據(jù)標(biāo)記廠商understand.ai,以及數(shù)據(jù)科學(xué)工作流管理初創(chuàng)企業(yè)neptune.ai。在橫向AI市場上,超越一眾競爭對手并獲得市場領(lǐng)導(dǎo)地位往往非常困難,但只要我們能夠?yàn)楸姸鄶?shù)據(jù)科學(xué)家提供實(shí)際價(jià)值,商業(yè)成功也將水到渠成。
AI初創(chuàng)企業(yè)各有特色,只有了解其中的獨(dú)特價(jià)值主張,我們才有可能建立起一家成功的AI企業(yè)。垂直AI初創(chuàng)企業(yè)交付產(chǎn)品,橫向AI初創(chuàng)企業(yè)則交付數(shù)據(jù)科學(xué)工作流中的組件。當(dāng)然,也有不少將這兩類業(yè)務(wù)集合于一身的復(fù)合型AI初創(chuàng)企業(yè),受篇幅所限本文就不多做介紹了。
最后,在投身于創(chuàng)業(yè)大潮之前,請務(wù)必明確理想的AI初創(chuàng)企業(yè)類型,這也將給產(chǎn)品路線圖帶來直接影響。
垂直AI初創(chuàng)企業(yè),需要專注于建立一個(gè)足以維持起成長型公司的核心用例。
橫向AI初創(chuàng)企業(yè),需要在選定的市場區(qū)間內(nèi)占得領(lǐng)導(dǎo)地位,為眾多數(shù)據(jù)科學(xué)家提供實(shí)際價(jià)值。
好文章,需要你的鼓勵(lì)
騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng),首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù),通過交錯(cuò)式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時(shí)學(xué)習(xí)外觀和運(yùn)動信息,顯著解決了當(dāng)前視頻生成模型中動作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個(gè)線性層就能大幅提升運(yùn)動質(zhì)量,在多項(xiàng)測試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評測基準(zhǔn),通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平,為AI價(jià)值觀對齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊(duì)開發(fā)的GraphCast是一個(gè)革命性的AI天氣預(yù)測模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào),準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來了效率和精度的雙重突破。