“網(wǎng)絡(luò)的出現(xiàn)以及隨之而來的信息爆炸,讓記者準(zhǔn)確迅速地報道新聞變得越來越具有挑戰(zhàn)性。”全球新聞機構(gòu)路透社的研發(fā)團隊本周在arXiv上發(fā)表的一篇論文用了這樣一句開場白。
對路透社而言,假新聞的出現(xiàn)讓問題變得更加嚴(yán)重,這些假新聞扭曲了事件認(rèn)知。
不過,像美聯(lián)社等新聞機構(gòu)已經(jīng)開始采用自動化的新聞寫作服務(wù)。這些報道使用了標(biāo)準(zhǔn)化的模式,例如財經(jīng)新聞或者特定體育比賽結(jié)果,將數(shù)據(jù)填到預(yù)先寫好的模板之中:“X在第三季度的財報顯示盈利為Y百萬,這一數(shù)值超出了華爾街的預(yù)期……”
所以其他新聞機構(gòu)在自動化新聞制作方面都面臨著很大的壓力。今天,路透社介紹了該社是如何幾乎完全自動化地識別突發(fā)新聞報道的。劉曉莫(Xiaomo Liu,音譯)以及路透社研發(fā)部門和阿里巴巴的同事表示,新系統(tǒng)表現(xiàn)良好。事實上,它有可能能夠徹底革新新聞業(yè)務(wù)。但是它也引發(fā)了人們的擔(dān)憂——心懷叵測的人會如何利用這樣一個系統(tǒng)。
這個新系統(tǒng)被稱為路透社追蹤器(Reuters Tracer)。它將推特(Twitter)作為一種全球傳感器加以利用,新聞事件在發(fā)生的過程中,就會在推特上有相關(guān)記錄。然后該系統(tǒng)會使用各種數(shù)據(jù)挖掘和機器學(xué)習(xí)技術(shù)來挑選最為相關(guān)的事件,確定它們的主題,排列它們的優(yōu)先級,并寫出標(biāo)題和摘要。這個消息隨后會被分發(fā)到該公司的全球新聞專線上。
整個流程的第一步是提取推特的數(shù)據(jù)流。該追蹤器每天要查看大約1200萬條推特消息,占所有推特消息總數(shù)的2%。其中一半是隨機抽樣,另外一半來自路透社記者創(chuàng)建的推特賬戶列表。其中包含其他新聞機構(gòu)的賬戶、重要的公司、有影響力的個人等等。
下一步是確定新聞事件發(fā)生的時間。追蹤器(Tracer)是根據(jù)這樣一個前提假設(shè)完成這項工作的:如果幾個人同時開始談?wù)撨@件事,這個事件就已經(jīng)發(fā)生了。因此它使用聚類算法來尋找這些對話。
當(dāng)然,這些聚類中包括垃圾郵件、廣告、普通聊天等。其中只有一部分是具有新聞價值的事件。
所以下一個階段是對事件進行分類和排序。追蹤器(Tracer)使用一些算法來完成這項工作。第一個算法確定談話的主題。然后將它與一個主題數(shù)據(jù)庫進行比較,這個主題數(shù)據(jù)庫中的內(nèi)容是由路透團隊從31個官方新聞賬戶——例如@CNN、@BBCBreaking和@nytimes,以及@BreakingNews等新聞聚合器所發(fā)布的推特消息中收集的。
在這個階段,該算法還會使用包含了城市和基于位置關(guān)鍵字的數(shù)據(jù)庫來確定事件發(fā)生的地點。
一旦一段談話或流言被認(rèn)定為新聞,一個重要的考量就是確認(rèn)其準(zhǔn)確性。為了確定這一點,追蹤器(Tracer)通過識別對話中最早提及該話題的推特消息及其指向的站點來尋找來源。然后,它會查詢一個數(shù)據(jù)庫,其中列出了已知的假新聞的制作者,例如國家報告(National Report),或是洋蔥(The Onion)這類諷刺新聞網(wǎng)站。
最后,該系統(tǒng)會寫出標(biāo)題和摘要,并在路透社整個組織內(nèi)分發(fā)該消息。
在試驗過程中,路透社的團隊表示該系統(tǒng)表現(xiàn)良好。他們表示:“追蹤器(Tracer)能夠在新聞檢測和提交方面實現(xiàn)很有競爭力的準(zhǔn)確度、召回率、時效性和準(zhǔn)確度。”
他們有統(tǒng)計數(shù)據(jù)可以支持這一觀點。該系統(tǒng)每天處理1200萬條推特消息,將其中的大約百分之八十的內(nèi)容作為噪聲加以拒絕。其余的內(nèi)容則被劃分進入6000個聚類,系統(tǒng)用這種方式將新聞事件劃分為不同的類型。所有的這一切工作全部由13臺運行著10種不同算法的服務(wù)器完成。
相比之下,路透社在全球雇傭了大約2500名新聞記者,他們每天使用各種來源——包括推特——總共產(chǎn)生大約3000條新聞提醒。其中,大約有250條被寫成了新聞報道。
路透社將追蹤器(Tracer)識別出的新聞同BBC和CNN等新聞機構(gòu)的推送新聞進行了比較。劉和他的同事表示,“結(jié)果表明,追蹤器(Tracer)可以用2%的推特數(shù)據(jù)覆蓋大約70%的新聞報道。”
而這套系統(tǒng)的工作當(dāng)然是非常迅速的。該團隊舉了2017年10月份在拉斯維加斯發(fā)生的槍擊案作為例證,在那次事件中,有58人喪生。一位目擊者在凌晨1點22分報告了這一事件,隨即觸發(fā)了一個追蹤器(Tracer)聚類。但是,該聚類到凌晨1點39分之前都沒有達到該系統(tǒng)確認(rèn)新聞的標(biāo)準(zhǔn)。劉和他的同事表示:“路透社在凌晨1點49分報道了這一事件。”
這是一個有趣的工作,引發(fā)了很多問題,特別是圍繞著該系統(tǒng)是多么容易被操縱這個問題。不難想象會有心懷叵測的人設(shè)計推特消息,以欺騙追蹤器(Tracer),實現(xiàn)特定目的。
但是這套系統(tǒng)是否會比現(xiàn)有的系統(tǒng)更好糊弄,恐怕還很難說,人類也經(jīng)常會被各種假消息欺騙。
還有人類在新聞業(yè)中扮演的角色。新聞的未來顯然會變得日益自動化。人類如何適應(yīng)這種變化還未見端倪。
好文章,需要你的鼓勵
新加坡國立大學(xué)研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓(xùn)練AI玩簡單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟大學(xué)團隊開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實現(xiàn)37.9%的精度提升,并在真實設(shè)備上展現(xiàn)出色泛化能力,為機器人、AR和自動駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團隊通過對比實驗發(fā)現(xiàn),經(jīng)過強化學(xué)習(xí)訓(xùn)練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質(zhì)量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動態(tài)稀疏性實現(xiàn)大語言模型訓(xùn)練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓(xùn)練效率,已在多個任務(wù)上驗證有效性。