如今,幾乎每家上市企業(yè)都在積極討論人工智能技術(shù)對自身運營方式的重大影響。從特斯拉使用AI技術(shù)改善自動駕駛性能,到Levis通過AI強(qiáng)化產(chǎn)品決策能力,每個人都熱切想要在AI領(lǐng)域占據(jù)一席之地。
但要實現(xiàn)這一目標(biāo),組織的智能度必須進(jìn)一步提升。為了逐步發(fā)展出嚴(yán)肅AI,我們需要采用監(jiān)督學(xué)習(xí)方法,而監(jiān)督學(xué)習(xí)的效果又由標(biāo)記數(shù)據(jù)的質(zhì)量決定。原始數(shù)據(jù)需要經(jīng)過漫長的標(biāo)記過程,而后方可用于增強(qiáng)監(jiān)督學(xué)習(xí)模型,由此產(chǎn)生的預(yù)算甚至可能給組織帶來可感受的壓力。過去十年以來,組織高管在存儲數(shù)據(jù)并將數(shù)據(jù)轉(zhuǎn)化為收入方面,主要擁有三種選項:
1.DIY并建立自己的定制數(shù)據(jù)標(biāo)記系統(tǒng)。為人力、技術(shù)及時間層面的重大投資做好準(zhǔn)備并調(diào)撥預(yù)算,借此建立起一套規(guī)模龐大、可永久保存的健壯生產(chǎn)系統(tǒng)。聽起來不難?也許吧,畢竟谷歌和Facebook都成功了。但這一切未必適合您,因為那些科技巨頭擁有出色的人才與幾乎無窮的IT預(yù)算,足以建立并維護(hù)這些復(fù)雜的標(biāo)記系統(tǒng)——換言之,這類企業(yè)的預(yù)算甚至與世界上某些小國的GDP相當(dāng)。另外,即使您擁有充足的人力與時間來從零開始構(gòu)建大規(guī)模生產(chǎn)系統(tǒng),您的組織能接受這項長期延續(xù)的巨額投資嗎?
2. 外包。專業(yè)服務(wù)合作伙伴當(dāng)然很給力,但您仍然需要開發(fā)自己的內(nèi)部工具。這種方式還可能帶來其它風(fēng)險,因為此類解決方案要求將第三方數(shù)據(jù)與您自己的專有數(shù)據(jù)混合起來,通過顯著擴(kuò)大數(shù)據(jù)樣本量在理論上獲取質(zhì)量更高的模型。您是否對自己的數(shù)據(jù)審計跟蹤能力有信心,保證其能夠在持久數(shù)據(jù)標(biāo)記要求的整個生命周期中保持專有性?即使您的供應(yīng)商倒閉,您在AI旅程中作為競爭優(yōu)勢開發(fā)出的流程是否可重復(fù)且始終可靠?您積累了數(shù)十的知識產(chǎn)權(quán)(數(shù)據(jù))可能因此而不慎泄露,導(dǎo)致其落入同樣與您合作伙伴聯(lián)手構(gòu)建系統(tǒng)的競爭方手中。以自動駕駛汽車行業(yè)為例,Scale.ai已經(jīng)成為領(lǐng)域中規(guī)模最大的服務(wù)商,幾乎所有相關(guān)機(jī)構(gòu)都與其保持合作關(guān)系。
3. 使用訓(xùn)練數(shù)據(jù)平臺(TDP)。這些屬于相對較新的市場解決方案,可提供一套統(tǒng)一平臺,將負(fù)責(zé)收集、標(biāo)記并饋送數(shù)據(jù)的所有作業(yè)匯總至監(jiān)督學(xué)習(xí)模型當(dāng)中,或者幫助用戶自主構(gòu)建新模型。這種方法可幫助不同規(guī)模的組織獲得等同于Salesforce及Hubspot等客戶關(guān)系管理商的方式建立標(biāo)準(zhǔn)化工作流程。其中一些平臺還使用集成化機(jī)器學(xué)習(xí)算法自動執(zhí)行復(fù)雜任務(wù),借此進(jìn)一步降低工作難度。更重要的是,TDP解決方案能夠幫助數(shù)據(jù)科學(xué)家擺脫繁重的任務(wù),將主要精力集中在構(gòu)建實際結(jié)構(gòu)(而非構(gòu)建及維護(hù)復(fù)雜而脆弱的定制化系統(tǒng))當(dāng)中。目前比較重要的TDP廠商包括Labelbox、Alegion以及Superb.ai。
我們?yōu)槭裁葱枰?xùn)練數(shù)據(jù)平臺
任何組織在開啟自己的AI探索之旅前,首先需要明確一點:數(shù)據(jù)標(biāo)記是監(jiān)督機(jī)器學(xué)習(xí)系統(tǒng)中成本最高、最為耗時的部分之一。隨著機(jī)器學(xué)習(xí)系統(tǒng)逐步發(fā)展成熟并可用于生產(chǎn)環(huán)境,數(shù)據(jù)標(biāo)記任務(wù)仍然不會停止。這項任務(wù)將永遠(yuǎn)存在并不斷增長。無論選擇外包標(biāo)記還是內(nèi)部標(biāo)記,組織都需要選擇一套TDP進(jìn)行工作管理。
TDP旨在促進(jìn)整個數(shù)據(jù)標(biāo)記過程,加快產(chǎn)生高質(zhì)量數(shù)據(jù)的速度,由此幫助組織快速創(chuàng)建高性能的AI模型與應(yīng)用程序。如今,已經(jīng)有部分企業(yè)在強(qiáng)調(diào)TDP技術(shù)的重要性,但真正能被稱為“TDP”的解決方案仍然非常有限。
其中有兩點非常重要:業(yè)務(wù)準(zhǔn)備情況與直觀的使用界面。如果未對業(yè)務(wù)做好充分準(zhǔn)備,IT部門將拒絕使用。如果界面不夠直觀,用戶也會尋找其他更易于使用的方案。此外,任何負(fù)責(zé)處理敏感的、對業(yè)務(wù)至關(guān)重要的信息的系統(tǒng),也都需要具備企業(yè)級的安全性與可伸縮性保障,否則同樣無法正常起效。而實際情況甚至證明,這類目標(biāo)也許永遠(yuǎn)無法實現(xiàn)。IT消費化至少已經(jīng)持續(xù)了十年,但I(xiàn)nstagram這類簡單易用的應(yīng)用都很難在組織內(nèi)普及。Salesforce的自動化工具之所以能夠從Siebel手中奪取市場,靠的就是輕松愉快的用戶體驗與便捷的云交付。
除了這些基礎(chǔ)之外,數(shù)據(jù)注釋、管理與迭代同樣非常重要。如果候選系統(tǒng)無法滿足這三項要求,那么其同樣不能算是真正的TDP。下面來看關(guān)于這三項核心指標(biāo)的更多細(xì)節(jié):
注釋。TDP必須提供可用于智能自動注釋功能的工具,即盡可能自動做出更多標(biāo)記。高水平的TDP應(yīng)該能夠處理有限數(shù)量、帶有專業(yè)標(biāo)簽的數(shù)據(jù)。我們以放射科醫(yī)師處理的X光片為例,系統(tǒng)需要首先從圖像中識別出腫瘤,而后再做出預(yù)標(biāo)記。而審核人員的工作,就是糾正各類錯誤標(biāo)記問題。機(jī)器會為標(biāo)記結(jié)果提供一項置信度輸出,例如特定標(biāo)簽正確標(biāo)記的可能性為80%。對審核人員來說,優(yōu)先級最高的工作應(yīng)該是檢查并糾正機(jī)器認(rèn)為置信度不足的標(biāo)簽。因此,組織應(yīng)努力推動注釋自動化并投入于相關(guān)專業(yè)服務(wù),確保數(shù)據(jù)標(biāo)記的準(zhǔn)確性與完整性。好消息是,目前與注釋相關(guān)的多數(shù)任務(wù)無需人工即可輕松完成。
管理。TDP應(yīng)該用作數(shù)據(jù)訓(xùn)練項目中的中央記錄系統(tǒng)。數(shù)據(jù)科學(xué)家與其他團(tuán)隊成員將在TDP中開展協(xié)作,通過與傳統(tǒng)項目管理工具的集成、或者在平臺本體之內(nèi),創(chuàng)建工作流并分配任務(wù)。
由此得出的數(shù)據(jù)集,還可供后續(xù)項目使用。以美國為例,每年約30%的房屋會投保房屋保險。為了預(yù)測風(fēng)險并做出準(zhǔn)確定價,保險公司需要分析多種數(shù)據(jù)——例如房齡、是否有游戲池或者蹦床,或者房屋與樹木間的距離。為了推進(jìn)這個過程,企業(yè)現(xiàn)在使用計算機(jī)視覺通過衛(wèi)星圖像為保險公司提供連續(xù)分析支持。在對新興市場中的房屋進(jìn)行分類時,企業(yè)應(yīng)該使用TDP重復(fù)使用現(xiàn)有數(shù)據(jù)集。例如,如果某家公司有意進(jìn)軍英國市場,則應(yīng)該能夠重用來自美國的現(xiàn)有訓(xùn)練數(shù)據(jù),以此為基礎(chǔ)稍加更新以適應(yīng)當(dāng)?shù)夭町?例如英國本地的建筑材料選擇)。這些迭代周期,將使企業(yè)提供高準(zhǔn)確度數(shù)據(jù),同時迅速做出調(diào)整以適應(yīng)美國及其他地區(qū)的房屋情況變化。
這意味著您的TDP需要提供與其他軟件相集成的API,借此對接項目管理應(yīng)用、數(shù)據(jù)收集與處理工具,并幫助組織通過SDK建立自定義工具、擴(kuò)展TDP。
迭代。真正的TDP必須承認(rèn)這樣的現(xiàn)實:帶有注釋的數(shù)據(jù)永遠(yuǎn)不會保持靜態(tài)。相反,數(shù)據(jù)會不斷變化,隨著更多數(shù)據(jù)加入數(shù)據(jù)集而持續(xù)迭代,并由模型提供關(guān)于數(shù)據(jù)有效性的反饋。而保持?jǐn)?shù)據(jù)準(zhǔn)確性、客觀性的關(guān)鍵,就是迭代。我們需要測試模型、改進(jìn)模型、再次測試、持續(xù)循環(huán)。拖拉機(jī)的智能噴霧器能夠在50%的概率將除草劑準(zhǔn)確噴向雜草,而隨著訓(xùn)練數(shù)據(jù)中的雜草圖像越來越多,計算機(jī)視覺模型的后續(xù)迭代有望逐步將準(zhǔn)確率提升至90%或更高,同時幫助噴霧器更準(zhǔn)確地識別出那些不需要噴灑除草劑的植物。這個過程可能相當(dāng)耗時,而且在高自動化水平的支持下,往往仍需要審核人員的參與。通過一次次迭代,我們可以推動模型逐步走向最佳狀態(tài)。而TDP的目的就是加速這種迭代,并確保每次迭代都能給模型帶來積極的改進(jìn),由此節(jié)約時間和金錢。
展望未來
正如十八世紀(jì)的標(biāo)準(zhǔn)化與可互換部件引發(fā)了工業(yè)革命一樣,用于定義TDP的標(biāo)準(zhǔn)框架也開始將AI技術(shù)推向新的高度。盡管尚處于起步階段,但真正的TDP管理平臺能夠以更可靠的方式將原始數(shù)據(jù)(特別是寶貴的知識產(chǎn)權(quán))轉(zhuǎn)化為標(biāo)記數(shù)據(jù),由此幫助組織在所在行業(yè)中建立起實際競爭優(yōu)勢。
在另一方面,高層管理人員還需要切實理解通過投資挖掘AI潛在財富的必要性。以往,組織只能在自主構(gòu)建、外包或者直接采購之間做出選擇,三者都會帶來高昂的成本。更重要的是,自主構(gòu)建與外包還可能帶來巨大的隱性成本,導(dǎo)致組織難以成功邁入新的業(yè)務(wù)領(lǐng)域。真正的TDP能夠“降低”這一高成本決策的風(fēng)險,同時有效保護(hù)企業(yè)的核心競爭優(yōu)勢,即知識產(chǎn)權(quán)。
好文章,需要你的鼓勵
新加坡國立大學(xué)研究團(tuán)隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓(xùn)練AI玩簡單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟(jì)大學(xué)團(tuán)隊開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機(jī)噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實現(xiàn)37.9%的精度提升,并在真實設(shè)備上展現(xiàn)出色泛化能力,為機(jī)器人、AR和自動駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團(tuán)隊通過對比實驗發(fā)現(xiàn),經(jīng)過強(qiáng)化學(xué)習(xí)訓(xùn)練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強(qiáng)于驗證答案質(zhì)量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機(jī)構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動態(tài)稀疏性實現(xiàn)大語言模型訓(xùn)練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓(xùn)練效率,已在多個任務(wù)上驗證有效性。