美國東部時間12月15日凌晨,NASA(美國國家航空航天局)宣布一項重大發(fā)現(xiàn):在距離地球2545光年的開普勒-90(Kepler-90,開普勒太空望遠鏡發(fā)現(xiàn)的第90顆恒星)星系中,又發(fā)現(xiàn)了第八顆行星!命名為“開普勒-90i”。
這也就意味著,就如同太陽有8大行星環(huán)繞一樣(分別是金星、木星、水星、火星、土星、地球、天王星、海王星),開普勒-90星系從此與太陽系并列成為行星數(shù)量最多的星系,堪稱“迷你太陽系”。
更重要的是,這顆新發(fā)現(xiàn)的行星,是谷歌人工智能系統(tǒng)發(fā)現(xiàn)的。
圖:隨著第八顆行星的發(fā)現(xiàn),開普勒90星系首次在行星數(shù)量上,和太陽系平起平坐了
這項研究表明,NASA的科學(xué)家們通過谷歌機器學(xué)習(xí)技術(shù)分析開普勒太空望遠鏡的觀測數(shù)據(jù),效率和效果遠超傳統(tǒng)的分析方法。
盡管機器學(xué)習(xí)之前也曾被用于搜索開普勒數(shù)據(jù)庫,然而神經(jīng)網(wǎng)絡(luò)在尋找來自遙遠世界最微弱的信號方面是一種非常有前途的工具。
[video]uu=dfa091e731&vu=23e28a4a0a&auto_play=0&width=600&height=450[/video]
美國東部時間12月15日下午三點,NASA就這一發(fā)現(xiàn)舉辦“Reddit Ask Me Anything”活動。谷歌AI高級軟件工程師克里斯托弗.夏爾(Christopher Shallue)與NASA博士后研究員兼德州大學(xué)奧斯汀分校的天體物理學(xué)家安德魯•范德伯格(Andrew Vanderburg)解釋了他們是如何訓(xùn)練人工智能系統(tǒng)來識別恒星周圍的行星的,“谷歌這一工具實際上與識別照片中貓和狗的工具類似”。
起初,Shallue想出了將神經(jīng)網(wǎng)絡(luò)應(yīng)用于開普勒數(shù)據(jù)的點子。太空科技的進步能夠收集越來越多的數(shù)據(jù),因此天文學(xué)也像科學(xué)的其他分支一樣正在迅速地被數(shù)據(jù)淹沒,在得知了這種情況之后,他對系外行星發(fā)現(xiàn)產(chǎn)生了興趣。
Shallue開始在業(yè)余時間里,研究“使用大數(shù)據(jù)集尋找系外行星”的方法,并且發(fā)現(xiàn)了開普勒的使命和可以使用的龐大數(shù)據(jù)集。Shallue說:“當(dāng)數(shù)據(jù)太多,人類無法自己研究的時候,機器學(xué)習(xí)真的可以大顯神通。”
開普勒太空望遠鏡四年收集到的數(shù)據(jù)集包含35,000種可能的行星信號。傳統(tǒng)方法有時候通過人眼查看數(shù)據(jù)集中最有可能的信號,然而,這種方法往往會錯過最微弱的信號。
因此Shallue和Vanderburg認為,這些數(shù)據(jù)中可能會隱藏了更多有趣的系外行星的發(fā)現(xiàn)。
他們的發(fā)現(xiàn)過程是這樣的:
首先,開普勒太空望遠鏡探測行星的方法為“凌日法”,數(shù)據(jù)來自行星經(jīng)過恒星之前或之后出現(xiàn)的一種微小的亮度變化。如下圖中,如果一顆行星從母恒星前方橫越時,恒星的視覺亮度會略微下降。
圖中,這種呈U形的明暗信號變化模式通過白色的線條來表示,而藍色的點狀分布,則是NASA在分析這些光變曲線后,得出的“開普勒天體”的數(shù)據(jù)。
然后,科學(xué)家們使用開普勒系外行星目錄的一組15000個預(yù)先驗證過的信號的數(shù)據(jù)集,創(chuàng)建了一個TensorFlow模型來區(qū)分行星與非行星。
接著,再讓人工智能系統(tǒng)學(xué)習(xí)開普勒太空望遠鏡收集的光線信號,以識別外系行星。
也就是說,神經(jīng)網(wǎng)絡(luò)“學(xué)會了”如何檢測系外行星經(jīng)過的模式,研究人員用機器學(xué)習(xí)模型研究670個恒星星系中較弱的信號(這些恒星星系已經(jīng)存在著一些已知的行星)。他們的假設(shè)是,多行星星系是尋找更多系外行星的最佳地點。
過程中,AI還發(fā)現(xiàn)了來自第八顆圍繞天龍座開普勒90旋轉(zhuǎn)的行星的微弱信號,而這些信號之前被錯過了。
在測試時,該系統(tǒng)還能準確地識別哪些信號是行星,哪些信號是誤報,準確率達96%。Vanderburg說:“我們得到了很多關(guān)于行星的誤報,但也有可能會有更多真的行星。這就像是在巖石中篩選寶石一樣,如果你用更細的篩子,你就會得到更多的石頭,但是你也可能會找到更多的寶石。”
至此,組成開普勒90星系的八顆行星分別是“開普勒90b”、“開普勒90c”、“開普勒90d”、“開普勒90e”、“開普勒90f”、“開普勒90g”、“開普勒90h”和最新發(fā)現(xiàn)的“開普勒90i”。
NASA華盛頓總部天體物理學(xué)部門主任保羅.赫茲(Paul Hertz)表示:“這一發(fā)現(xiàn)表明,我們的數(shù)據(jù)將在未來幾年成為創(chuàng)新研究人員的寶貴財富。”
開普勒90i——一個炎熱而布滿巖石的星球,是該星系中最小的行星,比地球體積大約30%左右,圍繞恒星公轉(zhuǎn)一周僅需14.4天。
據(jù)Andrew Vanderburg說,“開普勒-90i”距離恒星太近,表面溫度過高,超過800華氏度,與水星相仿?;蛟S不太可能有我們已知的生命形式存在。NASA認為,谷歌AI技術(shù)將有助于在太陽系外探測到外星生命的跡象。
之所以稱開普勒90星系為“迷你太陽系”,是因為它就像太陽系的一個迷你版本,體積較小的行星在內(nèi)圈環(huán)繞,體積較大的行星在外圈,只是相互之間距離挨的更近一些——當(dāng)中最外圍的行星——開普勒-90h圍繞恒星旋轉(zhuǎn)的距離與地球圍繞太陽旋轉(zhuǎn)的距離相似。
除了開普勒90i,谷歌的技術(shù)還發(fā)現(xiàn)了另外一顆恒星——開普勒-80星系中的最小行星“開普勒-80g”,同地球大小相仿。開普勒80g與相鄰的四顆行星形成了所謂的共振鏈——在這個共振鏈中,行星會被彼此的引力鎖定,在軌道上有節(jié)奏地運轉(zhuǎn),結(jié)果是形成一個非常穩(wěn)定的系統(tǒng),這種情況類似于TRAPPIST-1星系的七顆行星。
事實上,這兩顆全新系外行星,僅僅是谷歌AI技術(shù)在篩查了670顆星就發(fā)現(xiàn)的。未來,天文學(xué)家還將對開普勒所確定的大約15萬顆恒星進行研究,發(fā)現(xiàn)系外行星的可能性也會更高。
谷歌和NASA關(guān)于這些發(fā)現(xiàn)的研究論文已經(jīng)被《天文學(xué)報》(《The Astronomical Journal》)收錄。Shallue 和 Vanderburg 計劃將他們的神經(jīng)網(wǎng)絡(luò)應(yīng)用于開普勒所有的數(shù)據(jù)集(超過15萬顆恒星的數(shù)據(jù))。
開普勒已經(jīng)為系外行星搜尋產(chǎn)生了龐大的數(shù)據(jù)集,規(guī)模之大史無前例。在太空中的一個位置上觀察了四年之后,該航天器現(xiàn)在正在執(zhí)行擴展任務(wù),每八十天會更換一次視域。
【谷歌NASA“迷你太陽系”論文獲取方式:關(guān)注科技行者公眾號(itechwalker),并打開對話界面,回復(fù)關(guān)鍵字“迷你太陽系”,即可獲得地址】
<來源:NASA;編譯整理:科技行者>
好文章,需要你的鼓勵
新加坡國立大學(xué)研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓(xùn)練AI玩簡單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟大學(xué)團隊開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實現(xiàn)37.9%的精度提升,并在真實設(shè)備上展現(xiàn)出色泛化能力,為機器人、AR和自動駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團隊通過對比實驗發(fā)現(xiàn),經(jīng)過強化學(xué)習(xí)訓(xùn)練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實際提升推理準確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質(zhì)量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動態(tài)稀疏性實現(xiàn)大語言模型訓(xùn)練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓(xùn)練效率,已在多個任務(wù)上驗證有效性。