AI初創(chuàng)企業(yè)主要分為兩種風格,我們將在今天的文章中,對二者做出分析與展望。
當下,AI初創(chuàng)企業(yè)正在快速涌現(xiàn)。根據(jù)斯坦福大學AI指數(shù)報告數(shù)據(jù),自2014年以來,已經(jīng)有超過15798家AI初創(chuàng)拿到超過40萬美元的投資。正如CB Insights公布的結(jié)果,AI初創(chuàng)企業(yè)在2019年吸引到創(chuàng)紀錄的266億美元投資。鑒于統(tǒng)計數(shù)據(jù)的指數(shù)級增長,投資者與企業(yè)家都迫切希望借AI的東風扶搖直上。
▲ 圖片來源/斯坦福大學AI指數(shù)報告,88頁
然而,AI初創(chuàng)企業(yè)擁有自己的分類方式。本文將主要研究垂直與橫向AI初創(chuàng)企業(yè)之間的區(qū)別與共性。以下提出的見解,基于一家硅谷風險投資商、一家柏林AI風投工作室以及一位AI創(chuàng)業(yè)者的共同討論。
要理解垂直與橫向AI產(chǎn)品,我們首先需要明確AI產(chǎn)品的開發(fā)主題。
每一款基于AI技術的產(chǎn)品,都擁有大致相同的工作流程。在各個機器學習項目中,團隊都需要收集及準備數(shù)據(jù)、開發(fā)模型、部署模型、監(jiān)控模型性能等。以下列出的CRISP-DM模型描述了機器學習的一般工作流程。
▲ 圖片來源/Uni Dresden
要辨別垂直與橫向AI初創(chuàng)企業(yè)的區(qū)別,首先要對數(shù)據(jù)科學工作流擁有清晰的了解。垂直AI初創(chuàng)企業(yè)需要擁有「完整的工作流」以交付最終產(chǎn)品,橫向AI初創(chuàng)企業(yè)則專注于打造「通用的數(shù)據(jù)科學工作流」中的特定環(huán)節(jié)。
“垂直AI初創(chuàng)企業(yè)”提供基于AI的產(chǎn)品,其擁有完整的工作流,以解決針對性較強的客戶需求。這些初創(chuàng)企業(yè)以端到端方式開發(fā)完整產(chǎn)品,業(yè)務鏈貫穿從「商業(yè)案例」到「產(chǎn)品性能監(jiān)控」等各個步驟。
以Vara公司為例,這是一家典型的垂直AI初創(chuàng)企業(yè),使用AI技術,通過X光片識別乳腺癌癥狀。Vara是第一家獲得美國聯(lián)邦政府批準,可利用其AI解決方案協(xié)助放射科醫(yī)師處理日常診斷的企業(yè)。該公司擁有自己完整的數(shù)據(jù)科學工作流,并以此為基礎提供基于AI的創(chuàng)新產(chǎn)品。
AI是一種強大的工具,能夠幫助企業(yè)在特定應用場景當中,實現(xiàn)超越人類的效能水平。AI也為交付新產(chǎn)品、改進現(xiàn)有產(chǎn)品或自動執(zhí)行任務,開辟了新的可能性。垂直AI初創(chuàng)企業(yè)能夠針對特定用例優(yōu)化預測結(jié)果,而一旦獲得成功,他們在對應用例中的表現(xiàn)將遠超人類或者其他AI競爭對手。
“垂直AI初創(chuàng)企業(yè)中聚集著來自各個領域的專家,他們這里出任關鍵職位(例如產(chǎn)品角色)。例如,一家制造自動癌癥檢測產(chǎn)品的企業(yè),可能會聘用放射科醫(yī)師及/或腫瘤科醫(yī)師。” ——創(chuàng)業(yè)企業(yè)家Sahar Mor
但是,垂直AI初創(chuàng)企業(yè)往往難以通過調(diào)整,讓產(chǎn)品在其他類似用例中發(fā)揮同樣的效果。對于擅長識別乳腺癌特征的Vara公司來說,他們的解決方案,就很難在診斷腦癌方面發(fā)揮作用。AI模型往往在少數(shù)特定任務中表現(xiàn)良好。Vara當然可以復用現(xiàn)有模型開發(fā)流程,但AI模型的訓練工作必須從頭再來,即利用新的數(shù)據(jù)集學習腦癌檢測。
“在未來十年內(nèi),垂直AI初創(chuàng)企業(yè)將極大改變某些行業(yè)的具體運作方式。”——Merantix公司CTO兼聯(lián)合創(chuàng)始人Rasmus Rothe
其他垂直AI初創(chuàng)企業(yè),還包括自動駕駛汽車公司W(wǎng)aymo,以及金融犯罪預防企業(yè)hawk.ai??偠灾瑢Υ怪盇I初創(chuàng)企業(yè)來說,最重要的就是保證把少數(shù)特定問題解決掉、解決好,并以此為基礎建立起穩(wěn)定的商業(yè)模式。由于新模型的訓練往往需要大量時間與數(shù)據(jù),因此,其初始用例必須具備充分的說服力,支持公司一路發(fā)展至盈利階段。
“橫向AI企業(yè)“的目標,在于幫助數(shù)據(jù)科學家們更高效地完成數(shù)據(jù)科學工作流。為此,橫向AI初創(chuàng)企業(yè)面向的客戶,往往是數(shù)據(jù)科學家或者開發(fā)團隊。
橫向AI企業(yè)往往會從數(shù)據(jù)科學工作流中,選擇特定的一個或者多個環(huán)節(jié)加以改進。例如,橫向AI企業(yè)可以專注于幫助數(shù)據(jù)科學家們監(jiān)控其模型??傊?,橫向AI產(chǎn)品與特定用例無關,其開發(fā)成果可服務于任何基于AI的產(chǎn)品。
Saturn Cloud就是一家橫向AI初創(chuàng)企業(yè),旨在提高數(shù)據(jù)科學家們的工作效率。他們提供一項全托管服務,幫助數(shù)據(jù)科學家們使用自己最熟悉的工具(Python、Jupyter及Dask等)進行大規(guī)模工作。這是一款通用型工具,適用于一切基于AI技術的產(chǎn)品。
“跨越幾乎各個行業(yè),自動化數(shù)據(jù)科學工作流,能夠為最終用戶帶來更高效的團隊協(xié)作與工作體驗。與此同時,Python的使用量開始一路猛增,并迅速獲得數(shù)據(jù)科學從業(yè)者們的青睞。因此,對大多數(shù)數(shù)據(jù)團隊而言,使用一套Python原生工具來分析并自動化處理日常工作,將極具現(xiàn)實意義。” ——Anaconda公司前創(chuàng)始人、Saturn Cloud公司聯(lián)合創(chuàng)始人Hugo Shi
根據(jù)IDC發(fā)布的預測結(jié)果,隨著數(shù)據(jù)總量呈指數(shù)級增長,橫向AI解決方案也將在未來發(fā)揮越來越重要的作用。數(shù)據(jù)是AI類產(chǎn)品的核心驅(qū)動力,因此可用數(shù)據(jù)量的增加,也將意味著,有價值數(shù)據(jù)產(chǎn)品的發(fā)展?jié)摿⒉讲教嵘?。另外,?shù)據(jù)科學家人才市場也保持著穩(wěn)定增長。根據(jù)IBM開展的一項研究,到2020年,美國對于數(shù)據(jù)科學家的需求將增長28%,達到270萬。很明顯,橫向AI解決方案的目標客戶群體仍在發(fā)展壯大。
▲ 圖片來源/IDC
但是,橫向AI產(chǎn)品也面臨著自己的發(fā)展難題。它們必須能夠無縫集成至目標數(shù)據(jù)科學工作流及軟件堆棧中。
此外,Rasmus Rothe表示,“在開發(fā)橫向AI產(chǎn)品時,奪取市場領導地位將變得至關重要。”橫向AI初創(chuàng)企業(yè)往往很難收集到專有數(shù)據(jù),并據(jù)此建立起排他性的商業(yè)優(yōu)勢。再有,在選擇將數(shù)據(jù)科學工作流中的哪個或哪些環(huán)節(jié)作為業(yè)務重點時,大家還需要牢記,針對不同AI模型的不同具體要求。只有始終高度關注對目標受眾最具價值的功能,橫向AI初創(chuàng)企業(yè)才能從同儕中脫穎而出,闖出一片屬于自己的天地。
“雖然橫向AI企業(yè)往往面臨更激烈的競爭態(tài)勢,但其產(chǎn)品的使用門檻一般更低,相關技術可以輕松融入采購方的技術棧當中。”——投資人Jason Risch
橫向AI初創(chuàng)企業(yè)中的典型案例,包括數(shù)據(jù)標記廠商understand.ai,以及數(shù)據(jù)科學工作流管理初創(chuàng)企業(yè)neptune.ai。在橫向AI市場上,超越一眾競爭對手并獲得市場領導地位往往非常困難,但只要我們能夠為眾多數(shù)據(jù)科學家提供實際價值,商業(yè)成功也將水到渠成。
AI初創(chuàng)企業(yè)各有特色,只有了解其中的獨特價值主張,我們才有可能建立起一家成功的AI企業(yè)。垂直AI初創(chuàng)企業(yè)交付產(chǎn)品,橫向AI初創(chuàng)企業(yè)則交付數(shù)據(jù)科學工作流中的組件。當然,也有不少將這兩類業(yè)務集合于一身的復合型AI初創(chuàng)企業(yè),受篇幅所限本文就不多做介紹了。
最后,在投身于創(chuàng)業(yè)大潮之前,請務必明確理想的AI初創(chuàng)企業(yè)類型,這也將給產(chǎn)品路線圖帶來直接影響。
垂直AI初創(chuàng)企業(yè),需要專注于建立一個足以維持起成長型公司的核心用例。
橫向AI初創(chuàng)企業(yè),需要在選定的市場區(qū)間內(nèi)占得領導地位,為眾多數(shù)據(jù)科學家提供實際價值。
好文章,需要你的鼓勵
新加坡國立大學研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓練AI玩簡單撲克游戲就能讓其數(shù)學推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學題目作為訓練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學解題中,為AI訓練提供了新思路。
同濟大學團隊開發(fā)的GIGA-ToF技術通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術利用圖像間的不變幾何關系,結(jié)合深度學習和數(shù)學優(yōu)化方法,在合成數(shù)據(jù)集上實現(xiàn)37.9%的精度提升,并在真實設備上展現(xiàn)出色泛化能力,為機器人、AR和自動駕駛等領域提供更可靠的3D視覺解決方案。
伊利諾伊大學研究團隊通過對比實驗發(fā)現(xiàn),經(jīng)過強化學習訓練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實際提升推理準確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質(zhì)量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構(gòu)聯(lián)合提出SparseLoRA技術,通過動態(tài)稀疏性實現(xiàn)大語言模型訓練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓練效率,已在多個任務上驗證有效性。