長期以來,LinkedIn(領(lǐng)英)一直處于AI技術(shù)的前沿,并將AI技術(shù)融入產(chǎn)品和服務(wù)。最近,筆者與LinkedIn公司首席數(shù)據(jù)官兼工程技術(shù)副總裁Igor Perisic進行了交流,探討了LinkedIn公司內(nèi)部AI技術(shù)發(fā)展,如何將AI應(yīng)用于日常工作,全球數(shù)據(jù)法規(guī)帶來的實際影響,以及如何應(yīng)對不斷變化的AI工作環(huán)境與工作角色等問題。
▲ 圖:LinkedIn公司工程技術(shù)副總裁兼首席數(shù)據(jù)官Igor Perisic
LinkedIn公司很早就意識到,「數(shù)據(jù)」將成為企業(yè)之間的一大核心差異化因素。為了從市場競爭中脫穎而出,該公司建立起“會員優(yōu)先”這一核心價值觀(以明確、統(tǒng)一的方式對會員數(shù)據(jù)加以控制),并以此為基礎(chǔ),為全球會員提供職業(yè)提升通道。
隨著LinkedIn將越來越多的AI技術(shù)融入產(chǎn)品與服務(wù),他們也意識到,必須為每一位員工在工作流程中配備必要的AI工具。為此,他們建立起內(nèi)部培訓(xùn)計劃,名為「AI Academy」。這項計劃希望覆蓋從軟件工程師到銷售團隊的各個群體,為員工們傳授最適合當(dāng)前崗位的AI知識,保證他們?yōu)檫@類技術(shù)的實際使用做好準(zhǔn)備。
LinkedIn早期AI項目之一正是「你可能認(rèn)識的人(People You May Know,簡稱PYMK)」推薦服務(wù)。在本質(zhì)上,這種算法可以向會員們推薦他們可能認(rèn)識的其他會員,并據(jù)此建立起人脈網(wǎng)絡(luò)。當(dāng)初的推薦系統(tǒng)當(dāng)然不像現(xiàn)在這么復(fù)雜,但確實成為LinkedIn產(chǎn)品的一大核心。PYMK以數(shù)據(jù)產(chǎn)品的形式亮相,約在2006年左右,當(dāng)時開發(fā)這項服務(wù)的是技術(shù)行業(yè)中最早的“數(shù)據(jù)科學(xué)”團隊之一。但在早期,沒人把PYMK稱為“AI”項目,因為當(dāng)時AI這種說法還沒流行起來。
大約在同一時期,LinkedIn啟動的另一個重要項目是「搜索排名」。谷歌的出現(xiàn)將搜索引擎領(lǐng)域的競爭推向白熱化,而搜索排名正是一類經(jīng)典的AI問題。
在LinkedIn,Igor表示“我們把AI技術(shù)看得像氧氣一樣重要——它會滲透到我們工作中的每一個角落。”例如,對于LinkedIn的會員,AI技術(shù)可以幫助推薦工作機會、組織簡歷資料、保證他們收到及時且翔實的通知,并根據(jù)個人特質(zhì)推薦新的技能與學(xué)習(xí)內(nèi)容。至于LinkedIn的企業(yè)產(chǎn)品,他表示“AI技術(shù)可以幫助銷售人員吸引到對其產(chǎn)品最感興趣的會員,幫助營銷人員發(fā)布高質(zhì)量贊助內(nèi)容,幫助招聘人員確定并接觸新的人才群體。”此外,LinkedIn還將AI技術(shù)廣泛引入后臺,幫助會員免受欺詐及有害內(nèi)容的影響,同時優(yōu)化互聯(lián)網(wǎng)連接以保證會員始終擁有最佳站點訪問速度等。
“保障平臺會員安全,一直是我們關(guān)注的重要目標(biāo)。”Igor說,作為一家具有明確職業(yè)傾向的社交網(wǎng)絡(luò),最重要的就是迅速采取行動,盡快識別并阻止一切惡意行為。隨著惡意與威脅形勢的不斷變化,AI技術(shù)也成為安全保障工作中的核心。事實證明,機器學(xué)習(xí)在檢測虛假資料信息方面確實表現(xiàn)出色。
如果沒有AI,LinkedIn的多數(shù)產(chǎn)品及服務(wù)將根本無法運行。LinkedIn針對全球經(jīng)濟體系建立起的“經(jīng)濟圖譜”實在太過龐大、太過細致,沒有AI根本無法進行解析。
AI也在切實增強每一項使用體驗。雖然「通知功能」已經(jīng)可以在一定程度上幫助會員了解項目情況,但目前AI體驗中最關(guān)鍵的一環(huán)主要體現(xiàn)在Feed方面——即對各類活動(包括網(wǎng)絡(luò)帖子、新聞、視頻以及文章等)進行分類與排序。為了保證摘要信息的相關(guān)性,算法必須有能力處理“內(nèi)容推薦”與“會員偏好”之間的細微差別,這種能力也成為決定成敗的關(guān)鍵。
Igor還分享了一個有趣的例子。2018年初,他們發(fā)現(xiàn)不同用戶群體在Feed中的參與度出現(xiàn)了嚴(yán)重分裂——前1%超級用戶依靠“病毒式傳播”獲得了巨大收益,但大多數(shù)創(chuàng)作者卻陷入零反饋困境。這是因為當(dāng)時的摘要模型遵循一條簡單粗暴的原理:分享那些能夠引起廣泛關(guān)注的“病毒式內(nèi)容”。
但LinkedIn很快意識到,這種優(yōu)化思路不一定適合所有會員。為了對抗由AI技術(shù)造成的負面生態(tài)系統(tǒng)影響,他們開始在Feed中引入更深層次的創(chuàng)作優(yōu)化功能,借此幫助那些受眾規(guī)模較小的創(chuàng)作者。
在此次更新中,排名算法開始考慮,讀者與創(chuàng)作者在特定項目之間產(chǎn)生的聯(lián)系與價值。對于讀者來說,他們希望根據(jù)自己的喜好獲取相關(guān)內(nèi)容;對于創(chuàng)作者來說,他們希望自己產(chǎn)出的高質(zhì)量內(nèi)容能夠切實吸引到目標(biāo)受眾。Igor指出,“通過模型的調(diào)整與優(yōu)化,我們將新聞?wù)鸩睫D(zhuǎn)化成意見領(lǐng)袖與受眾之間更加健康的關(guān)聯(lián)與內(nèi)容組合,從而極大提高了讀者與創(chuàng)作者的參與度。”
近幾年來,世界各地都已經(jīng)開始制定法律,借此約束企業(yè)對用戶數(shù)據(jù)的存儲與使用方式。歐洲推出的《通用數(shù)據(jù)保護條例(GDPR)》以及加利福尼亞州的《加州消費者隱私法(CCPA)》都在強化隱私權(quán)與消費者保護的重要意義。對部分企業(yè)來說,這意味著他們必須重新審視對用戶數(shù)據(jù)的處理思路。好在,LinkedIn一直將數(shù)據(jù)視為寶貴的企業(yè)資產(chǎn),同時也是該公司的核心差異化因素之一。
Igor解釋道,甚至早在GDPR出臺之前,LinkedIn就設(shè)有一套內(nèi)部框架,名為3C——即透明(clarity)、一致(consistency)以及控制(control)。他表示,“現(xiàn)在我們?nèi)匀粓猿种瑯拥乃悸?,保證會員們清楚我們在如何處理他們的數(shù)據(jù)、可以求證我們的言行之間是否一致,同時允許會員真正控制自己的數(shù)據(jù)。”結(jié)合當(dāng)前歷史背景,LinkedIn希望通過GDPR,進一步鞏固自己對全球會員做出的數(shù)據(jù)隱私保護承諾。例如,LinkedIn將把GDPR數(shù)據(jù)的主體權(quán)利擴展至全球所有會員。他們還在不斷思考,如何在LinkedIn與AI模型中處理會員數(shù)據(jù),同時增強查看與更新流程設(shè)計層面的私密性保障。LinkedIn始終將會員利益視為運營宗旨,并將保護會員數(shù)據(jù)視為組織內(nèi)部的整體責(zé)任。
作為規(guī)模龐大的專業(yè)社交網(wǎng)絡(luò),LinkedIn能夠以非常獨特視角,觀察并理解其他企業(yè)難以涉及的「職位變動」、「職位趨勢」以及「區(qū)域吸引力」等重要洞見。
去年底,LinkedIn發(fā)布了第三期年度新興工作崗位報告,希望確定增長速度最快的工作崗位。人工智能專家成為榜單中的頭名,在過去4年中年均增長率高達74%。這一增長遠遠超出科技行業(yè)的平均水平。尤其令人興奮的是,他們發(fā)現(xiàn)在2017年,來自教育領(lǐng)域的核心AI技術(shù)專家,已經(jīng)在LinkedIn平臺全部AI會員群體的占比中位列第二,這意味著大部分AI職位增長都與教育行業(yè)以及學(xué)術(shù)研究相關(guān)。
最近面對COVID-19疫情引發(fā)的經(jīng)濟衰退,LinkedIn發(fā)現(xiàn),AI就業(yè)市場仍然保持著持續(xù)增長。在對總發(fā)布職位數(shù)量進行標(biāo)準(zhǔn)化整理后,美國遭遇COVID-19疫情侵襲的十周之內(nèi),AI職位數(shù)量增長了8.3%——雖然這一增長速度要低于疫情之前,但相較于市場上人才需求總體下降的趨勢,雇主們似乎仍然更加關(guān)注AI技術(shù)專家。
AI領(lǐng)域的另一個有趣之處在于,LinkedIn觀察到一個完整的技術(shù)角色生態(tài)系統(tǒng),各角色支撐起AI生命周期中的不同階段?;仡櫲ツ甑装l(fā)布的新興工作報告,除了AI專家角色(負責(zé)模型創(chuàng)建與訓(xùn)練)的持續(xù)增加之外,與AI相關(guān)的“配套”崗位也在不斷發(fā)展。未來,市場對于「數(shù)據(jù)科學(xué)家」、「數(shù)據(jù)工程師」以及「云工程師」的需求也將提升——這種提升不僅體現(xiàn)在技術(shù)領(lǐng)域中,而是各行各業(yè)。
歸根結(jié)底,AI仍是一種工具,其最大的潛力在于增強人類智能并幫助人類取得更大的成就。LinkedIn目前的AI工具,在很大程度上仍依賴于人工輸入,而且永遠無法徹底實現(xiàn)自動化。
Igor堅信,AI的未來在于實際應(yīng)用,特別是如何利用AI工具提升人類的智能水平,從而更好更快地完成任務(wù)。為了實現(xiàn)這個目標(biāo),我們不僅需要AI專家,同時也要推動AI技術(shù)的大眾化。AI應(yīng)該逐步轉(zhuǎn)化為一種即插即用、能夠直接操作的界面。他發(fā)現(xiàn),各大主要云服務(wù)供應(yīng)商已經(jīng)參與進來,努力開發(fā)出各類有助于降低AI使用門檻的工具。一旦AI與應(yīng)用場景得到全面結(jié)合,就會真正激發(fā)出人們的創(chuàng)造力,開發(fā)出越來越多更酷、更有趣的實際用例。
以此為基礎(chǔ),AI技術(shù)也將實現(xiàn)貫通式的整體升級。從算法到數(shù)學(xué)發(fā)現(xiàn)、再到硬件與AI系統(tǒng)設(shè)計,從業(yè)者們將立足各個環(huán)節(jié),用自己的獨創(chuàng)性為AI發(fā)展貢獻力量。這將是一片廣闊的天地,每個角落當(dāng)中都有著值得奮力發(fā)掘的寶藏。
好文章,需要你的鼓勵
騰訊ARC實驗室推出AudioStory系統(tǒng),首次實現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù),通過交錯式推理生成、解耦橋接機制和漸進式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時學(xué)習(xí)外觀和運動信息,顯著解決了當(dāng)前視頻生成模型中動作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個線性層就能大幅提升運動質(zhì)量,在多項測試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實驗室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評測基準(zhǔn),通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時顯著提升人性化交互水平,為AI價值觀對齊提供了可行技術(shù)路徑。
谷歌DeepMind團隊開發(fā)的GraphCast是一個革命性的AI天氣預(yù)測模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報,準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來了效率和精度的雙重突破。