計(jì)算機(jī)已經(jīng)能識別出小貓了,那么,它們能找出擁有升值潛力的股票嗎?
四年前,Chidananda Khatua在旁聽一場商學(xué)院關(guān)于對沖基金的演講時(shí),找到了解答這個問題的靈感。Khatua是一位英特爾資深工程師,有一段時(shí)間每天晚上以及周末,他都在加州大學(xué)伯克利分校進(jìn)修MBA學(xué)位。在他看來,將精確的財(cái)務(wù)數(shù)據(jù)與來自公司年報(bào)和新聞的信息結(jié)合起來,也許能產(chǎn)生一系列強(qiáng)大的功能。
縱觀華爾街的整個發(fā)展歷程,計(jì)算機(jī)長久以來負(fù)責(zé)的,一直都是嚴(yán)格定量類指標(biāo)——例如將價(jià)格除以收入,并對結(jié)果進(jìn)行排序之類。但近年來,情況開始發(fā)生變化。2011年,IBM公司打造的Watson系統(tǒng)在問答節(jié)目中擊敗了兩位人類冠軍,戲劇性地展示了計(jì)算機(jī)芯片的語言處理潛力。之所以令人驚訝,是因?yàn)橐雽?shí)現(xiàn)這樣的壯舉,計(jì)算機(jī)不僅需要處理數(shù)字,同時(shí)也要處理譜系、時(shí)間、鄰近性、因果關(guān)系、分類法以及多種其他關(guān)聯(lián)因素。
將這樣的人工智能推廣開來,那它所能做到的當(dāng)然不會局限于贏下電視問答節(jié)目。舉例來說,它可以擔(dān)當(dāng)醫(yī)師的助手,可以向消費(fèi)者保質(zhì)期產(chǎn)品,可以負(fù)責(zé)檢測信用卡欺詐活動,甚至可以管理投資組合。
如今,已經(jīng)44歲的Khatua邀請了兩位來自伯克利的同學(xué)。第一位是來自富達(dá)投資,35歲的Arthur Amador,他的主要工作是為富裕家庭提供理財(cái)咨詢服務(wù);第二位則是37歲的Christpher Natividad,曾擔(dān)任資金經(jīng)理職務(wù)。
作為務(wù)實(shí)的創(chuàng)業(yè)者,他們并不指望計(jì)算機(jī)能夠真正理解人類的行為。但計(jì)算機(jī)確實(shí)有可能掌握知識,收集大量事實(shí),對證券市場的整體格局與趨勢做出判斷,甚至可以用強(qiáng)大的算力彌補(bǔ)人類直覺所無法觸及的新高度。
這三位創(chuàng)業(yè)者從天使投資人拿到了73萬5千美元,再加上自己的個人積蓄,一家交易所買賣基金咨詢企業(yè)EquBot就此誕生。而作為渴望展示自家人工智能實(shí)力的科技巨頭,IBM公司則為這些企業(yè)家提供高達(dá)12萬美元的軟硬件資源免費(fèi)使用額度。
兩年前,EquBot公司開放其AI Powered Equity ETF,每天根據(jù)計(jì)算機(jī)的指令對投資組合加以更新。2018年,該公司又增設(shè)AI Powered International Equity服務(wù)。
EquBot公司首席執(zhí)行官Khatua負(fù)責(zé)管理舊金山總部的員工團(tuán)隊(duì),外加管理印度班加羅爾的17名程序員與統(tǒng)計(jì)學(xué)家。他們的系統(tǒng)每天能夠消化130萬條文本記錄,包括新聞、博文、社交媒體以及SEC文件。IBM Watson系統(tǒng)負(fù)責(zé)從中提取內(nèi)容,并將處理結(jié)果輸入擁有上百萬個節(jié)點(diǎn)的知識圖譜內(nèi)。
每一個連接點(diǎn),可能代表一家企業(yè)(總計(jì)15000家企業(yè))、關(guān)鍵字(例如FDA)或者某項(xiàng)經(jīng)濟(jì)指標(biāo)(例如油價(jià))。數(shù)萬億項(xiàng)潛在關(guān)系將這些信息彼此關(guān)聯(lián)起來。
在模擬大腦內(nèi)神經(jīng)元連接的神經(jīng)網(wǎng)絡(luò),并進(jìn)行反復(fù)試驗(yàn)之后,計(jì)算機(jī)會對其中幾項(xiàng)最重要的關(guān)聯(lián)進(jìn)行加權(quán)。通過這樣的方式,系統(tǒng)會嘗試分析一周、一個月或者一年之后的股票價(jià)格,并根據(jù)實(shí)際結(jié)果推斷輸入數(shù)據(jù)中的哪些波動更為關(guān)鍵。
如果業(yè)務(wù)較忙,那么EquBot公司的單日計(jì)算量可高達(dá)千萬億次。好在擁有英偉達(dá)公司出品的圖形芯片,雖然這類產(chǎn)品的設(shè)計(jì)初衷在于,為游戲玩家提供更精美的動態(tài)圖像,但事實(shí)證明,其同時(shí)也是神經(jīng)網(wǎng)絡(luò)內(nèi)高并行計(jì)算流的理想處理選項(xiàng)。亞馬遜大量采用英偉達(dá)圖形芯片,再將這些資源以云服務(wù)的形式,交付給EquiBot以及其他AI研究人員。
去年,EquBot的軟件在愛爾蘭醫(yī)藥企業(yè)Amarin內(nèi)引起了熱議——該公司專門出售作為純處方類包含補(bǔ)充劑的Omega-3脂肪酸藥品。這支國際ETF在其股價(jià)不足3美元時(shí)買進(jìn),但不久之后股價(jià)即一路飆升至15美元。EquBot方面的另一舉措,就是測算出了連鎖企業(yè)大量關(guān)閉門店會導(dǎo)致用戶對信用卡的依賴性提高,因此開始在國內(nèi)增持Visa股票。
當(dāng)然,計(jì)算機(jī)也有犯錯的時(shí)候。也許是受到云計(jì)算快速發(fā)展的影響,系統(tǒng)曾經(jīng)認(rèn)定NetApp與New Relic將迎來良好的增長勢頭。但結(jié)果是,兩家公司的股價(jià)反而有所下跌。Khatua倒不怎么擔(dān)心,他表示“神經(jīng)網(wǎng)絡(luò)也需要從錯誤中汲取教訓(xùn)”。
現(xiàn)在,我們還很難判斷EquBot能否利用AI系統(tǒng)成功管理這1.2億美元資金。截至目前,EquBot的美國本土基金較標(biāo)準(zhǔn)普爾500指數(shù)低3個百分點(diǎn),但其國際基金指數(shù)則領(lǐng)先6個百分點(diǎn)。
EquBot方面表示,他們是唯一一家利用AI技術(shù)主動管理ETF的基金,但相信很快會有更多參與者加入戰(zhàn)團(tuán)。IBM公司正在華爾街積極銷售AI方案,身在紐約的IBM科學(xué)家Donna Dillenberger正在研究包含數(shù)百萬個節(jié)點(diǎn)的股票市場模型,她表示“十億級節(jié)點(diǎn)系統(tǒng)的建立也已經(jīng)指日可待”。
很明顯,Khatua等人掀起的這波浪潮,有可能令人類分析師們面臨失業(yè)的風(fēng)險(xiǎn)。因?yàn)檫@類系統(tǒng)不僅能夠分析投資市場,還可以跟蹤藥物試驗(yàn),而且亞馬遜提供的云資源既規(guī)模龐大又具有成本優(yōu)勢。EquBot所代表的,實(shí)際上是數(shù)字化數(shù)據(jù)的爆炸式增長以及芯片算力的持續(xù)提升——這二者結(jié)合起來,將帶來遠(yuǎn)超人類能力上限的分析判斷水平。
EquBot公司首席運(yùn)營官Art Amador總結(jié)道,“在全部現(xiàn)有數(shù)據(jù)當(dāng)中,有90%是過去兩年當(dāng)中才剛剛產(chǎn)生的。相信再有兩年,AI技術(shù)將真正主導(dǎo)投資領(lǐng)域。”
好文章,需要你的鼓勵
新加坡國立大學(xué)研究團(tuán)隊(duì)開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實(shí)驗(yàn)顯示,僅訓(xùn)練AI玩簡單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟(jì)大學(xué)團(tuán)隊(duì)開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機(jī)噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實(shí)現(xiàn)37.9%的精度提升,并在真實(shí)設(shè)備上展現(xiàn)出色泛化能力,為機(jī)器人、AR和自動駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團(tuán)隊(duì)通過對比實(shí)驗(yàn)發(fā)現(xiàn),經(jīng)過強(qiáng)化學(xué)習(xí)訓(xùn)練的視覺語言模型雖然表現(xiàn)出"頓悟時(shí)刻"現(xiàn)象,但這些自我糾錯行為并不能實(shí)際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗(yàn)證差距",即生成答案的能力強(qiáng)于驗(yàn)證答案質(zhì)量的能力,且模型在自我驗(yàn)證時(shí)無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機(jī)構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動態(tài)稀疏性實(shí)現(xiàn)大語言模型訓(xùn)練加速1.6倍,計(jì)算成本降低2.2倍。該方法使用SVD稀疏性估計(jì)器智能選擇重要計(jì)算部分,在保持模型性能的同時(shí)顯著提升訓(xùn)練效率,已在多個任務(wù)上驗(yàn)證有效性。