av天堂久久天堂色综合,最近中文字幕mv免费高清在线,在线a级毛片免费视频,av动漫,中文字幕精品亚洲无线码一区

微信掃一掃,關(guān)注公眾號

  • 科技行者

  • 算力行者

見證連接與計(jì)算的「力量」

首頁 突破性空間推理技術(shù):伊利諾伊大學(xué)研究團(tuán)隊(duì)開發(fā)出讓AI"看懂"空間關(guān)系的新方法

突破性空間推理技術(shù):伊利諾伊大學(xué)研究團(tuán)隊(duì)開發(fā)出讓AI"看懂"空間關(guān)系的新方法

2025-07-01 14:16
分享至:
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-
2025-07-01 14:16 ? 科技行者

這項(xiàng)由伊利諾伊大學(xué)香檳分校的沈藝凡研究員領(lǐng)導(dǎo)的研究團(tuán)隊(duì)于2025年6月發(fā)表在計(jì)算機(jī)視覺領(lǐng)域頂級會議上,有興趣深入了解的讀者可以通過arXiv:2506.21656訪問完整論文。該研究團(tuán)隊(duì)還包括來自賓夕法尼亞大學(xué)、上海交通大學(xué)和Google的多位研究者。

當(dāng)你看著廚房里的場景,你能輕松判斷冰箱比微波爐高多少,或者估算出餐桌到櫥柜的距離。這種空間感知能力對人類來說再自然不過,但對AI來說卻是一個(gè)巨大的挑戰(zhàn)。現(xiàn)在,研究團(tuán)隊(duì)開發(fā)出了一種名為SpatialReasoner-R1的新型AI系統(tǒng),它不僅能"看懂"圖片中的空間關(guān)系,還能像人類一樣進(jìn)行逐步推理。

這個(gè)發(fā)現(xiàn)對我們的日常生活意義重大。目前的AI視覺系統(tǒng)雖然能識別圖片中的物體,但在處理精確的空間關(guān)系時(shí)經(jīng)常出錯(cuò)。比如,當(dāng)你問AI"這張照片中的沙發(fā)離電視有多遠(yuǎn)"時(shí),它可能會給出完全錯(cuò)誤的答案。這種局限性嚴(yán)重影響了AI在自動駕駛、機(jī)器人導(dǎo)航、增強(qiáng)現(xiàn)實(shí)等應(yīng)用中的表現(xiàn)。

SpatialReasoner-R1的突破在于它采用了一種全新的訓(xùn)練方法,稱為"細(xì)粒度直接偏好優(yōu)化"(fDPO)。簡單來說,就像訓(xùn)練一個(gè)學(xué)生不僅要知道答案,還要懂得推理過程一樣。傳統(tǒng)的AI訓(xùn)練方法就像給學(xué)生一堆標(biāo)準(zhǔn)答案讓他死記硬背,而新方法則教會AI如何一步步分析空間關(guān)系,形成完整的推理鏈條。

研究團(tuán)隊(duì)還創(chuàng)造了一個(gè)巧妙的數(shù)據(jù)生成方法,叫做"多模型蒙特卡洛樹搜索"(M3CTS)。這就像組織一場頭腦風(fēng)暴,讓多個(gè)AI系統(tǒng)同時(shí)思考同一個(gè)空間問題,然后從眾多答案中篩選出最優(yōu)秀的推理過程。這種方法確保了訓(xùn)練數(shù)據(jù)的多樣性和高質(zhì)量。

一、從直覺判斷到邏輯推理:AI空間理解的革命性轉(zhuǎn)變

在我們的日常生活中,空間感知能力無處不在。當(dāng)你伸手夠桌上的水杯時(shí),大腦會自動計(jì)算距離和角度;當(dāng)你停車時(shí),會本能地判斷車位的大小和與其他車輛的距離。這些看似簡單的空間判斷,實(shí)際上涉及復(fù)雜的三維理解和度量推理。

然而,對于計(jì)算機(jī)視覺系統(tǒng)來說,這些任務(wù)卻異常困難。目前的AI系統(tǒng)雖然在物體識別方面表現(xiàn)出色,能夠準(zhǔn)確識別圖片中的汽車、行人、建筑物等,但一旦涉及到精確的空間關(guān)系判斷,就會出現(xiàn)各種問題。比如,AI可能會錯(cuò)誤地認(rèn)為遠(yuǎn)處的建筑物比近處的汽車更小,或者無法準(zhǔn)確估算兩個(gè)物體之間的實(shí)際距離。

這種局限性的根源在于傳統(tǒng)AI系統(tǒng)缺乏結(jié)構(gòu)化的空間推理能力。它們往往采用"直接回答"的方式,看到問題就立即給出答案,而不會像人類那樣進(jìn)行逐步分析。就好比一個(gè)學(xué)生在數(shù)學(xué)考試中,不寫解題過程就直接寫答案,即使偶爾答對了,也很難保證穩(wěn)定性和準(zhǔn)確性。

SpatialReasoner-R1的革命性在于它改變了AI處理空間問題的根本方式。這個(gè)系統(tǒng)不再滿足于簡單的"看圖說話",而是學(xué)會了進(jìn)行"長鏈條思考"(LongCoT)。當(dāng)面對一個(gè)空間問題時(shí),它會首先詳細(xì)描述看到的場景,然后逐步分析各個(gè)物體的位置關(guān)系,接著運(yùn)用物理常識和空間幾何知識進(jìn)行推理,最后得出結(jié)論。

舉個(gè)具體例子來說明這種差異。假設(shè)有一張廚房照片,問題是"廚房島臺的高度是多少"。傳統(tǒng)AI可能會直接回答"90厘米",但SpatialReasoner-R1會這樣推理:首先,它會觀察到廚房島臺旁邊有兩個(gè)白色吧臺椅;然后分析這些椅子看起來是標(biāo)準(zhǔn)高度,大約75厘米;接著比較椅子座位和島臺臺面的高度差,發(fā)現(xiàn)臺面比椅子高約20厘米;最后計(jì)算得出島臺高度約為95厘米。這種詳細(xì)的推理過程不僅提高了準(zhǔn)確性,還讓人能夠理解AI是如何得出答案的。

這種推理能力的提升對實(shí)際應(yīng)用有著深遠(yuǎn)影響。在自動駕駛領(lǐng)域,精確的空間理解能力意味著車輛能更準(zhǔn)確地判斷與行人、車輛的距離,做出更安全的駕駛決策。在機(jī)器人應(yīng)用中,這種能力讓機(jī)器人能夠更好地理解環(huán)境布局,執(zhí)行復(fù)雜的操作任務(wù)。在增強(qiáng)現(xiàn)實(shí)應(yīng)用中,它能確保虛擬物體與真實(shí)環(huán)境的精確對齊。

二、細(xì)粒度偏好優(yōu)化:讓AI學(xué)會分層思考的訓(xùn)練藝術(shù)

傳統(tǒng)的AI訓(xùn)練方法存在一個(gè)根本性問題:它們把AI的整個(gè)回答當(dāng)作一個(gè)整體來評判,就像老師給作文打分時(shí)只看最終效果,而不關(guān)注學(xué)生的思路展開過程。這種"一刀切"的評價(jià)方式導(dǎo)致AI在學(xué)習(xí)復(fù)雜推理時(shí)效果不佳,因?yàn)樗鼰o法區(qū)分描述準(zhǔn)確性和邏輯推理能力這兩種不同的技能。

研究團(tuán)隊(duì)創(chuàng)新性地提出了"細(xì)粒度直接偏好優(yōu)化"(fDPO)方法,這就像一位經(jīng)驗(yàn)豐富的老師,會分別評價(jià)學(xué)生的"觀察能力"和"推理能力"。具體來說,fDPO將AI的回答分解為兩個(gè)關(guān)鍵部分:描述性基礎(chǔ)(描述看到的內(nèi)容)和邏輯推理(分析和計(jì)算過程)。

描述性基礎(chǔ)就像是AI的"眼睛",負(fù)責(zé)準(zhǔn)確描述圖片中的場景內(nèi)容。這部分需要AI能夠正確識別物體、準(zhǔn)確描述顏色、形狀、相對位置等視覺信息。比如在描述一個(gè)客廳場景時(shí),AI需要準(zhǔn)確說出"圖片顯示一個(gè)現(xiàn)代客廳,中央有一個(gè)深灰色的L型沙發(fā),沙發(fā)前方放著一張玻璃茶幾,右側(cè)墻邊有一臺55英寸的平板電視"。

邏輯推理部分則像是AI的"大腦",負(fù)責(zé)基于觀察到的信息進(jìn)行分析計(jì)算。這部分要求AI能夠運(yùn)用物理常識、幾何知識和邏輯關(guān)系來解決問題。繼續(xù)以客廳為例,當(dāng)被問及"沙發(fā)到電視的距離"時(shí),AI需要這樣推理:首先識別出電視的尺寸作為參考標(biāo)準(zhǔn)(55英寸約為1.2米寬),然后估算沙發(fā)和電視之間的空間大約相當(dāng)于2.5個(gè)電視寬度,最后計(jì)算得出距離約為3米。

fDPO的巧妙之處在于它為這兩種不同的能力設(shè)計(jì)了不同的學(xué)習(xí)強(qiáng)度。研究發(fā)現(xiàn),描述性任務(wù)相對容易掌握,而邏輯推理則需要更多的訓(xùn)練關(guān)注。因此,fDPO會根據(jù)AI在不同方面的表現(xiàn)差異,動態(tài)調(diào)整學(xué)習(xí)重點(diǎn)。如果AI的描述能力已經(jīng)很好,但推理能力還有待提高,系統(tǒng)就會把更多的"注意力"放在加強(qiáng)推理訓(xùn)練上。

這種差異化的訓(xùn)練策略通過一套精巧的數(shù)學(xué)機(jī)制實(shí)現(xiàn)。系統(tǒng)會計(jì)算描述部分和推理部分的"偏好差異"分?jǐn)?shù),然后根據(jù)這些分?jǐn)?shù)自動調(diào)整學(xué)習(xí)參數(shù)。就像一個(gè)智能的健身教練,會根據(jù)你的具體情況調(diào)整訓(xùn)練計(jì)劃——如果你的力量訓(xùn)練已經(jīng)很好但柔韌性不足,教練就會增加拉伸訓(xùn)練的比重。

為了確保訓(xùn)練效果,研究團(tuán)隊(duì)還開發(fā)了一套綜合評價(jià)體系,從四個(gè)維度對AI的回答進(jìn)行評分:視覺一致性、深度引導(dǎo)的空間準(zhǔn)確性、邏輯連貫性,以及結(jié)論有效性。這就像給學(xué)生的作文從"內(nèi)容準(zhǔn)確性"、"邏輯清晰度"、"語言流暢性"和"結(jié)論合理性"四個(gè)角度分別打分,然后據(jù)此調(diào)整教學(xué)重點(diǎn)。

實(shí)驗(yàn)結(jié)果顯示,采用fDPO訓(xùn)練的SpatialReasoner-R1在空間質(zhì)量任務(wù)上比傳統(tǒng)方法平均提升了4.1%,在空間數(shù)量任務(wù)上提升了9.0%。這種顯著改進(jìn)證明了分層訓(xùn)練策略的有效性,也為未來AI訓(xùn)練方法的發(fā)展提供了新的思路。

三、多模型協(xié)作:構(gòu)建高質(zhì)量訓(xùn)練數(shù)據(jù)的智慧眾包

高質(zhì)量的訓(xùn)練數(shù)據(jù)是AI系統(tǒng)成功的關(guān)鍵,但創(chuàng)造用于空間推理訓(xùn)練的數(shù)據(jù)面臨著獨(dú)特的挑戰(zhàn)。傳統(tǒng)方法通常依賴單一模型生成訓(xùn)練樣本,這就像讓一個(gè)人獨(dú)自完成所有的頭腦風(fēng)暴,難免會有思維局限性和創(chuàng)造力不足的問題。

為了解決這個(gè)問題,研究團(tuán)隊(duì)開發(fā)了"多模型蒙特卡洛樹搜索"(M3CTS)方法。這個(gè)名字聽起來很復(fù)雜,但其核心思想其實(shí)很簡單:組織多個(gè)AI系統(tǒng)進(jìn)行"集體智慧"式的問題解決,就像召集不同專業(yè)背景的專家組成智囊團(tuán),共同分析復(fù)雜問題。

M3CTS的工作流程就像一場結(jié)構(gòu)化的頭腦風(fēng)暴會議。當(dāng)面對一個(gè)空間推理問題時(shí),系統(tǒng)會邀請多個(gè)不同的AI模型參與討論。每個(gè)模型都會提出自己的推理路徑和解決方案,形成一個(gè)"推理樹"結(jié)構(gòu)。這個(gè)過程包含四個(gè)關(guān)鍵步驟:擴(kuò)展、模擬、回傳和選擇。

在擴(kuò)展階段,各個(gè)AI模型會針對當(dāng)前的推理狀態(tài)提出不同的下一步思路。就像在討論"如何估算兩棟建筑之間的距離"時(shí),不同的專家可能會提出不同的參考方法:有的建議用已知的汽車長度作為測量單位,有的提議通過人的身高來估算,還有的推薦利用路面標(biāo)線間距作為參考。

模擬階段則像是對每個(gè)提議進(jìn)行可行性分析。系統(tǒng)會從三個(gè)角度評估每個(gè)推理步驟:視覺描述的準(zhǔn)確性(是否正確描述了圖像內(nèi)容)、空間關(guān)系的正確性(是否符合幾何常識)、邏輯推理的連貫性(推理過程是否合理)。每個(gè)評估都會得到一個(gè)分?jǐn)?shù),就像專家團(tuán)對每個(gè)方案進(jìn)行打分。

回傳階段負(fù)責(zé)將評估結(jié)果向上傳遞,更新整個(gè)推理樹的價(jià)值評估。這就像在公司決策中,下級部門的分析結(jié)果會影響上級的決策判斷。通過這種層層回傳的機(jī)制,系統(tǒng)能夠識別出哪些推理路徑更有前景。

選擇階段則運(yùn)用"上置信界"策略來平衡"利用已知的好方法"和"探索新的可能性"。這就像一個(gè)探險(xiǎn)家既要沿著已知的安全路徑前進(jìn),又要保持對未知路徑的好奇心。系統(tǒng)會優(yōu)先選擇那些既有良好表現(xiàn)記錄又還有進(jìn)一步探索價(jià)值的推理路徑。

通過這種多模型協(xié)作機(jī)制,M3CTS能夠生成質(zhì)量遠(yuǎn)超單一模型的訓(xùn)練數(shù)據(jù)。這些數(shù)據(jù)不僅推理過程更加豐富多樣,而且邏輯更加嚴(yán)密可靠。研究團(tuán)隊(duì)用這種方法生成了40萬個(gè)高質(zhì)量的空間推理樣本,為SpatialReasoner-R1的訓(xùn)練提供了堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ)。

這種方法的另一個(gè)優(yōu)勢是能夠捕捉不同的推理風(fēng)格和策略。就像人類專家團(tuán)隊(duì)中每個(gè)人都有自己的專長和思考方式,不同的AI模型也會展現(xiàn)出不同的推理特色。有些模型擅長精確的數(shù)值計(jì)算,有些模型更善于定性的空間關(guān)系分析,還有些模型在處理復(fù)雜場景時(shí)表現(xiàn)出色。M3CTS將這些不同的優(yōu)勢整合在一起,創(chuàng)造出更加全面和robust的訓(xùn)練體驗(yàn)。

四、空間獎勵(lì)機(jī)制:教AI理解三維世界的評價(jià)體系

為了訓(xùn)練一個(gè)真正理解空間關(guān)系的AI系統(tǒng),研究團(tuán)隊(duì)設(shè)計(jì)了一套精密的"空間獎勵(lì)機(jī)制",就像為AI配備了一位嚴(yán)格而全面的空間幾何老師。這套評價(jià)體系不僅要求AI能夠準(zhǔn)確描述看到的內(nèi)容,還要驗(yàn)證其空間理解的正確性和推理邏輯的合理性。

這個(gè)評價(jià)體系包含四個(gè)互補(bǔ)的獎勵(lì)組件,每個(gè)組件都專注于評估AI能力的不同方面。就像評判一名建筑師的作品時(shí),我們會從美觀性、結(jié)構(gòu)安全性、功能實(shí)用性和成本合理性等多個(gè)角度進(jìn)行全面考核。

視覺一致性獎勵(lì)充當(dāng)了AI的"視力檢查師"。它會仔細(xì)檢查AI對圖像的描述是否與實(shí)際看到的內(nèi)容相符。這個(gè)檢查包含四個(gè)細(xì)分標(biāo)準(zhǔn):存在性檢查(AI提到的物體是否真的在圖片中)、屬性準(zhǔn)確性檢查(顏色、形狀、大小等描述是否正確)、完整性檢查(是否遺漏了重要的視覺信息)、以及相關(guān)性檢查(描述內(nèi)容是否與問題相關(guān))。每個(gè)方面都采用0到1分的連續(xù)評分,允許對部分正確的情況給予相應(yīng)的分?jǐn)?shù)。

深度引導(dǎo)的空間獎勵(lì)是這套評價(jià)體系中最具創(chuàng)新性的部分。傳統(tǒng)的圖像分析只能處理二維信息,但空間關(guān)系本質(zhì)上是三維的。為了解決這個(gè)問題,研究團(tuán)隊(duì)引入了深度圖像作為"第三只眼睛"。深度圖像就像一張地形圖,能夠顯示圖片中每個(gè)點(diǎn)距離攝像頭的遠(yuǎn)近關(guān)系。

當(dāng)AI聲稱"汽車在建筑物前面"時(shí),系統(tǒng)會檢查深度圖像來驗(yàn)證這個(gè)說法是否正確。如果深度圖像顯示汽車確實(shí)比建筑物更靠近攝像頭,AI就會得到高分;如果相反,則會被扣分。這種驗(yàn)證機(jī)制確保了AI不是在胡亂猜測,而是真正理解了空間關(guān)系。

這個(gè)評價(jià)過程還考慮了AI表達(dá)的不確定性。當(dāng)AI使用"大約"、"可能"、"似乎"等不確定詞匯時(shí),系統(tǒng)會相應(yīng)地調(diào)整評分標(biāo)準(zhǔn)。這就像在考試中,如果學(xué)生明確表示"我不太確定,但我認(rèn)為...",老師可能會給予一定的理解和寬容。這種設(shè)計(jì)鼓勵(lì)A(yù)I在不確定時(shí)誠實(shí)表達(dá),而不是虛假地表現(xiàn)出過度自信。

邏輯連貫性獎勵(lì)專門評估AI的推理質(zhì)量。它會檢查AI的思維過程是否合乎邏輯,推理步驟之間是否存在矛盾,以及最終結(jié)論是否得到了充分的論證支持。這就像數(shù)學(xué)老師不僅關(guān)注學(xué)生的最終答案,更重視解題過程的邏輯性和嚴(yán)密性。

為了確保評價(jià)的客觀性和一致性,研究團(tuán)隊(duì)采用了多模型評估策略。就像重要的學(xué)術(shù)論文需要多位專家進(jìn)行同行評議一樣,每個(gè)AI回答都會接受多個(gè)評估模型的獨(dú)立評分,然后綜合這些評分得出最終結(jié)果。這種做法有效避免了單一評估模型可能存在的偏見或錯(cuò)誤。

這套獎勵(lì)機(jī)制的另一個(gè)巧妙設(shè)計(jì)是情境感知權(quán)重分配。系統(tǒng)會根據(jù)空間關(guān)系與問題的相關(guān)性給予不同的權(quán)重。直接回答問題所需的空間信息會獲得更高的權(quán)重,而輔助性或背景性的空間信息權(quán)重相對較低。這確保了AI學(xué)習(xí)過程中的重點(diǎn)明確,不會在次要信息上浪費(fèi)過多注意力。

五、實(shí)驗(yàn)驗(yàn)證:突破性成果的全面展示

為了驗(yàn)證SpatialReasoner-R1的實(shí)際效果,研究團(tuán)隊(duì)進(jìn)行了全面而嚴(yán)格的實(shí)驗(yàn)評估。這些實(shí)驗(yàn)就像給新研發(fā)的智能設(shè)備進(jìn)行全方位的質(zhì)量檢測,既要測試其專業(yè)能力,也要驗(yàn)證其在日常應(yīng)用中的表現(xiàn)。

在空間推理的專業(yè)測試中,SpatialReasoner-R1展現(xiàn)出了令人印象深刻的性能提升。在空間質(zhì)量判斷任務(wù)上,比如判斷"物體A是否比物體B更高"或"汽車是否停在建筑物前面",SpatialReasoner-R1的準(zhǔn)確率達(dá)到了95.59%,相比之前的最好成績提升了2.9%。更令人矚目的是在空間數(shù)量估算任務(wù)上的表現(xiàn),比如"估算兩個(gè)物體之間的距離"或"計(jì)算建筑物的高度",準(zhǔn)確率達(dá)到77.30%,相比基準(zhǔn)模型提升了驚人的15.8%。

這種改進(jìn)的意義可以通過具體例子來理解。當(dāng)被問及"估算廚房島臺和電視柜之間的水平距離"時(shí),傳統(tǒng)AI系統(tǒng)可能會簡單地回答"大約1.5米",但SpatialReasoner-R1會進(jìn)行詳細(xì)的推理:首先識別壁爐的寬度約為1.2米,然后觀察到壁爐右邊緣與電視左邊緣基本對齊,接著估算從壁爐中心到電視柜中心需要加上壁爐寬度的一半(0.6米)加上它們之間的間隔(0.2米)再加上電視柜寬度的一半(0.7米),最終得出1.5米的結(jié)論。這種詳細(xì)的推理過程不僅提高了準(zhǔn)確性,還提供了可驗(yàn)證的邏輯鏈條。

在不同類型的空間推理任務(wù)中,SpatialReasoner-R1都表現(xiàn)出了一致的優(yōu)越性。在方位判斷方面,比如"從A的角度看,B在幾點(diǎn)鐘方向",準(zhǔn)確率達(dá)到98.33%。在大小比較方面,準(zhǔn)確率為95.28%。在距離估算方面,包括直接距離、水平距離和垂直距離,準(zhǔn)確率分別達(dá)到70.95%、72.13%和74.52%。這種全面的優(yōu)異表現(xiàn)證明了新方法的通用性和穩(wěn)定性。

特別值得注意的是,SpatialReasoner-R1的4B參數(shù)版本甚至超越了一些參數(shù)量達(dá)到78B的大型模型。這就像一個(gè)技能嫻熟的工匠能夠勝過僅僅依靠力氣的工人,說明了方法創(chuàng)新比單純的規(guī)模擴(kuò)大更加重要。這個(gè)發(fā)現(xiàn)對于資源有限的應(yīng)用場景具有重要意義,因?yàn)樗馕吨梢杂酶俚挠?jì)算資源獲得更好的性能。

為了驗(yàn)證模型的通用性,研究團(tuán)隊(duì)還在多個(gè)通用視覺語言任務(wù)上測試了SpatialReasoner-R1。結(jié)果顯示,在專注于空間推理能力提升的同時(shí),模型在其他視覺理解任務(wù)上的表現(xiàn)不僅沒有下降,反而有所提升。在物體幻覺檢測、多模態(tài)理解、科學(xué)問答等任務(wù)上,SpatialReasoner-R1都展現(xiàn)出了競爭性的表現(xiàn),證明了專業(yè)化訓(xùn)練與通用能力可以很好地兼容。

研究團(tuán)隊(duì)還進(jìn)行了詳細(xì)的消融實(shí)驗(yàn)來驗(yàn)證各個(gè)技術(shù)組件的貢獻(xiàn)。結(jié)果顯示,細(xì)粒度偏好優(yōu)化(fDPO)相比傳統(tǒng)方法帶來了顯著改進(jìn),多模型協(xié)作數(shù)據(jù)生成策略提高了訓(xùn)練數(shù)據(jù)的質(zhì)量,而空間獎勵(lì)機(jī)制確保了學(xué)習(xí)過程的針對性。這些組件的協(xié)同作用最終造就了SpatialReasoner-R1的卓越性能。

定性分析進(jìn)一步揭示了SpatialReasoner-R1的優(yōu)勢所在。在一個(gè)涉及估算人行道上行人與街道上卡車距離的例子中,SpatialReasoner-R1能夠系統(tǒng)地分析交通車道的寬度、人行道的寬度以及路邊區(qū)域,最終給出16米的估算,與真實(shí)答案非常接近。而其他模型要么推理過程不夠詳細(xì),要么忽略了關(guān)鍵的空間要素,導(dǎo)致估算偏差較大。

六、技術(shù)細(xì)節(jié):深入探索創(chuàng)新方法的實(shí)現(xiàn)機(jī)制

SpatialReasoner-R1的成功離不開一系列精心設(shè)計(jì)的技術(shù)細(xì)節(jié)。這些技術(shù)創(chuàng)新就像一臺精密機(jī)器中的各個(gè)齒輪,每一個(gè)都發(fā)揮著不可替代的作用,共同驅(qū)動著整個(gè)系統(tǒng)的高效運(yùn)轉(zhuǎn)。

在細(xì)粒度偏好優(yōu)化的具體實(shí)現(xiàn)中,研究團(tuán)隊(duì)采用了動態(tài)權(quán)重調(diào)整機(jī)制。這個(gè)機(jī)制的核心思想是根據(jù)描述部分和推理部分的質(zhì)量差異,自動調(diào)整學(xué)習(xí)強(qiáng)度。當(dāng)系統(tǒng)發(fā)現(xiàn)AI在描述準(zhǔn)確性方面已經(jīng)表現(xiàn)很好,但在邏輯推理方面還有提升空間時(shí),就會自動增加對推理部分的訓(xùn)練關(guān)注度。這種自適應(yīng)調(diào)整就像一個(gè)智能的私人教練,能夠根據(jù)學(xué)生的具體情況隨時(shí)調(diào)整訓(xùn)練計(jì)劃。

具體的數(shù)學(xué)實(shí)現(xiàn)采用了指數(shù)加權(quán)的動態(tài)計(jì)算方法。系統(tǒng)會計(jì)算描述部分和推理部分的偏好差異分?jǐn)?shù),然后使用這些分?jǐn)?shù)生成相應(yīng)的權(quán)重。這些權(quán)重會被映射到以1為中心的調(diào)整因子,確??傮w學(xué)習(xí)強(qiáng)度保持穩(wěn)定的同時(shí),實(shí)現(xiàn)精細(xì)的重點(diǎn)調(diào)整。研究團(tuán)隊(duì)通過大量實(shí)驗(yàn)確定了最優(yōu)的參數(shù)設(shè)置:當(dāng)權(quán)重調(diào)整幅度設(shè)為30%時(shí),系統(tǒng)達(dá)到了最佳的學(xué)習(xí)效果。

在多模型協(xié)作的樹搜索過程中,系統(tǒng)采用了上置信界(UCB)策略來平衡探索和利用。這個(gè)策略的精妙之處在于它既鼓勵(lì)系統(tǒng)繼續(xù)完善已經(jīng)證明有效的推理路徑,又保持對新可能性的探索。就像一個(gè)經(jīng)驗(yàn)豐富的投資者,既會繼續(xù)投資已經(jīng)盈利的項(xiàng)目,也會適當(dāng)嘗試新的投資機(jī)會。

樹搜索的評估機(jī)制使用了多個(gè)獨(dú)立的評估模型,包括Gemini 1.5 Pro和Qwen2.5VL-72B等。每個(gè)評估模型都會從視覺描述準(zhǔn)確性、空間一致性和邏輯推理連貫性三個(gè)維度進(jìn)行評分。最終的評估結(jié)果通過加權(quán)平均得出,這種多重驗(yàn)證機(jī)制確保了評估的可靠性和客觀性。

為了處理空間推理中的不確定性,系統(tǒng)設(shè)計(jì)了專門的不確定性權(quán)重機(jī)制。當(dāng)AI在表達(dá)空間關(guān)系時(shí)使用"大約"、"可能"、"似乎"等詞匯時(shí),系統(tǒng)會將不確定性權(quán)重設(shè)置為0.8到1.0之間的值。這個(gè)設(shè)計(jì)既鼓勵(lì)A(yù)I在確定時(shí)表達(dá)自信,也允許它在不確定時(shí)誠實(shí)表達(dá)疑慮,避免了過度自信的問題。

深度圖像的集成是另一個(gè)技術(shù)亮點(diǎn)。研究團(tuán)隊(duì)使用了Depth Anything模型來生成高質(zhì)量的深度圖像,這些深度圖像作為"真實(shí)答案"來驗(yàn)證AI對空間關(guān)系的理解。深度信息的引入使得系統(tǒng)能夠處理傳統(tǒng)二維圖像分析難以解決的遮擋和透視問題。

在數(shù)據(jù)生成方面,M3CTS采用了結(jié)構(gòu)化的輸出格式要求。所有參與的AI模型都必須按照統(tǒng)一的格式生成推理內(nèi)容,包括描述部分、推理策略、逐步分析和最終結(jié)論。這種標(biāo)準(zhǔn)化格式確保了不同模型生成的內(nèi)容可以進(jìn)行公平比較和有效整合。

訓(xùn)練過程采用了兩階段策略:先進(jìn)行監(jiān)督微調(diào)來建立基礎(chǔ)能力,然后進(jìn)行偏好優(yōu)化來提升推理質(zhì)量。在監(jiān)督微調(diào)階段,模型學(xué)習(xí)從簡單的問答轉(zhuǎn)向結(jié)構(gòu)化的長鏈條推理。在偏好優(yōu)化階段,模型學(xué)習(xí)區(qū)分高質(zhì)量和低質(zhì)量的推理過程,逐步提升自身的空間推理能力。

為了確保訓(xùn)練的穩(wěn)定性,研究團(tuán)隊(duì)采用了梯度累積和學(xué)習(xí)率預(yù)熱等技術(shù)。這些技術(shù)就像給高性能汽車配備的穩(wěn)定控制系統(tǒng),確保在追求極致性能的同時(shí)保持系統(tǒng)的穩(wěn)定運(yùn)行。

七、性能對比:在競爭中展現(xiàn)卓越實(shí)力

為了全面展示SpatialReasoner-R1的優(yōu)勢,研究團(tuán)隊(duì)將其與當(dāng)前最先進(jìn)的多個(gè)AI系統(tǒng)進(jìn)行了詳細(xì)對比。這場"AI空間理解能力大比拼"涵蓋了從通用大型模型到專門優(yōu)化的空間推理系統(tǒng),為我們提供了一個(gè)清晰的性能基準(zhǔn)參考。

在與通用大型模型的對比中,SpatialReasoner-R1展現(xiàn)出了壓倒性的優(yōu)勢。Gemini 2.0 Flash這樣的頂級模型在空間質(zhì)量任務(wù)上的準(zhǔn)確率為44.29%,而SpatialReasoner-R1達(dá)到了95.59%,提升幅度超過了一倍。在更具挑戰(zhàn)性的空間數(shù)量估算任務(wù)上,差距更加明顯:Gemini 2.0 Flash的準(zhǔn)確率僅為22.43%,而SpatialReasoner-R1達(dá)到了77.30%,提升了近3倍。

這種巨大差距的背后反映了通用模型與專門優(yōu)化模型之間的本質(zhì)區(qū)別。通用模型就像一個(gè)博學(xué)的通才,在各個(gè)領(lǐng)域都有所涉獵,但在特定專業(yè)領(lǐng)域的深度可能不夠。而SpatialReasoner-R1則像一個(gè)空間幾何的專家,在這個(gè)特定領(lǐng)域有著深厚的專業(yè)功底。

在與其他專門的空間推理模型對比中,SpatialReasoner-R1同樣表現(xiàn)出色。InternVL2.5-78B是一個(gè)參數(shù)量達(dá)到780億的大型專業(yè)模型,但SpatialReasoner-R1的8B版本在多個(gè)任務(wù)上都超越了它。這個(gè)結(jié)果特別令人驚喜,因?yàn)樗砻饔行У姆椒▌?chuàng)新比單純的規(guī)模擴(kuò)大更加重要。

具體的任務(wù)表現(xiàn)分析reveals了SpatialReasoner-R1的全面優(yōu)勢。在"上下位置"判斷任務(wù)中,準(zhǔn)確率達(dá)到98.33%,在"左右位置"判斷中準(zhǔn)確率為98.10%,在"大小比較"任務(wù)中準(zhǔn)確率為95.28%。這些高準(zhǔn)確率表明模型不僅在整體上表現(xiàn)優(yōu)秀,在各個(gè)細(xì)分任務(wù)上都達(dá)到了專業(yè)水準(zhǔn)。

更有趣的是,在處理復(fù)雜空間關(guān)系時(shí),SpatialReasoner-R1展現(xiàn)出了其他模型難以匹敵的推理透明度。當(dāng)其他模型給出簡單答案時(shí),SpatialReasoner-R1會提供完整的推理過程。比如在估算兩個(gè)建筑物距離的任務(wù)中,傳統(tǒng)模型可能簡單回答"200米",而SpatialReasoner-R1會詳細(xì)解釋:首先識別參考物體(如停在路邊的汽車長度約4.5米),然后計(jì)算兩建筑間的空間相當(dāng)于多少個(gè)汽車長度,最后得出具體距離。

在計(jì)算效率方面,SpatialReasoner-R1也表現(xiàn)出了實(shí)用性優(yōu)勢。盡管其推理過程更加詳細(xì),但由于采用了優(yōu)化的模型架構(gòu),實(shí)際運(yùn)行速度與同等參數(shù)規(guī)模的模型相當(dāng)。這意味著用戶可以在不犧牲響應(yīng)速度的情況下獲得更準(zhǔn)確、更可解釋的結(jié)果。

研究團(tuán)隊(duì)還測試了模型在不同復(fù)雜度場景下的表現(xiàn)。在簡單場景(如只有兩三個(gè)主要物體)中,各個(gè)模型的表現(xiàn)差距相對較小。但隨著場景復(fù)雜度的增加,SpatialReasoner-R1的優(yōu)勢變得越來越明顯。在包含多個(gè)物體、存在遮擋關(guān)系、需要多步推理的復(fù)雜場景中,其他模型的準(zhǔn)確率會顯著下降,而SpatialReasoner-R1仍能保持穩(wěn)定的高性能。

值得特別提及的是,SpatialReasoner-R1在處理邊緣情況時(shí)表現(xiàn)出了出色的robust性。當(dāng)圖像質(zhì)量較差、光線條件不理想或者存在部分遮擋時(shí),傳統(tǒng)模型往往會出現(xiàn)較大誤差,而SpatialReasoner-R1由于其結(jié)構(gòu)化的推理方法,能夠更好地處理這些具有挑戰(zhàn)性的情況。

八、實(shí)際應(yīng)用:從實(shí)驗(yàn)室走向現(xiàn)實(shí)世界

SpatialReasoner-R1的突破性進(jìn)展不僅僅是學(xué)術(shù)上的成就,更重要的是它為現(xiàn)實(shí)世界的諸多應(yīng)用場景帶來了革命性的可能性。這些應(yīng)用的潛力就像一顆投入湖中的石子,激起的漣漪將波及我們生活的方方面面。

在自動駕駛領(lǐng)域,精確的空間理解能力將顯著提升行車安全性。傳統(tǒng)的自動駕駛系統(tǒng)雖然能夠識別道路上的車輛、行人和障礙物,但在精確判斷距離和相對位置方面仍存在局限。SpatialReasoner-R1的推理能力讓車輛能夠更準(zhǔn)確地評估"前方的行人距離我還有多遠(yuǎn)"、"左側(cè)變道是否安全"、"停車位的空間是否足夠"等關(guān)鍵問題。這種精確判斷對于避免交通事故、提高駕駛舒適性都具有重要意義。

在機(jī)器人應(yīng)用方面,SpatialReasoner-R1為家用服務(wù)機(jī)器人帶來了新的可能性。家庭環(huán)境中充滿了復(fù)雜的空間關(guān)系:桌子下面的空間高度是否足夠機(jī)器人通過,廚房臺面上的物品如何安全抓取而不碰倒其他東西,客廳的家具布局是否適合機(jī)器人導(dǎo)航等。具備了精確空間推理能力的機(jī)器人能夠更好地理解和適應(yīng)家庭環(huán)境,執(zhí)行更復(fù)雜的服務(wù)任務(wù)。

在增強(qiáng)現(xiàn)實(shí)(AR)和虛擬現(xiàn)實(shí)(VR)應(yīng)用中,準(zhǔn)確的空間理解是實(shí)現(xiàn)沉浸式體驗(yàn)的關(guān)鍵。當(dāng)我們在手機(jī)屏幕上放置虛擬家具來預(yù)覽裝修效果時(shí),或者在AR游戲中與虛擬角色互動時(shí),系統(tǒng)需要精確理解現(xiàn)實(shí)空間的布局和尺寸。SpatialReasoner-R1的能力使得這些虛擬內(nèi)容能夠更準(zhǔn)確地與現(xiàn)實(shí)環(huán)境融合,創(chuàng)造出更加逼真和實(shí)用的體驗(yàn)。

在建筑和工程領(lǐng)域,這項(xiàng)技術(shù)為施工現(xiàn)場的智能監(jiān)管提供了新工具。通過分析施工現(xiàn)場的照片或視頻,系統(tǒng)能夠自動檢查建筑構(gòu)件的位置是否正確、尺寸是否符合設(shè)計(jì)要求、安全距離是否得到保障等。這種自動化的質(zhì)量控制不僅提高了效率,還能減少人為疏忽導(dǎo)致的問題。

醫(yī)療影像分析是另一個(gè)受益領(lǐng)域。在分析CT掃描、MRI圖像或X光片時(shí),醫(yī)生需要準(zhǔn)確理解器官、骨骼和病變的空間位置關(guān)系。SpatialReasoner-R1的推理能力可以輔助醫(yī)生進(jìn)行更精確的診斷,特別是在復(fù)雜的外科手術(shù)規(guī)劃中,準(zhǔn)確的空間理解對于確保手術(shù)安全和效果至關(guān)重要。

在零售和電商領(lǐng)域,這項(xiàng)技術(shù)為在線購物體驗(yàn)帶來了革新。消費(fèi)者在網(wǎng)上購買家具或裝飾品時(shí),最大的困擾是不知道商品在自己家中的實(shí)際效果?;赟patialReasoner-R1的應(yīng)用可以幫助消費(fèi)者更準(zhǔn)確地評估商品尺寸與家庭空間的匹配度,甚至可以提供個(gè)性化的空間布局建議。

在教育領(lǐng)域,這項(xiàng)技術(shù)為幾何學(xué)、物理學(xué)等需要空間思維的學(xué)科提供了新的教學(xué)工具。學(xué)生可以通過與AI系統(tǒng)的互動來學(xué)習(xí)空間關(guān)系的分析方法,理解幾何概念的實(shí)際應(yīng)用。這種交互式的學(xué)習(xí)方式比傳統(tǒng)的理論講解更加生動有效。

安防監(jiān)控系統(tǒng)也將從中受益。傳統(tǒng)的監(jiān)控系統(tǒng)主要依賴人工觀察來判斷異常情況,而集成了SpatialReasoner-R1技術(shù)的智能監(jiān)控系統(tǒng)能夠自動分析監(jiān)控畫面中的空間關(guān)系,檢測可疑行為、評估安全風(fēng)險(xiǎn)、優(yōu)化巡邏路線等。

在游戲和娛樂產(chǎn)業(yè),這項(xiàng)技術(shù)為創(chuàng)造更智能的游戲AI提供了基礎(chǔ)。游戲中的非玩家角色(NPC)能夠更好地理解游戲環(huán)境的空間布局,做出更合理的行為決策,提供更有挑戰(zhàn)性和趣味性的游戲體驗(yàn)。

盡管應(yīng)用前景廣闊,研究團(tuán)隊(duì)也清醒地認(rèn)識到技術(shù)推廣中可能面臨的挑戰(zhàn)。目前的系統(tǒng)還需要明確的區(qū)域標(biāo)注作為輸入,在實(shí)際應(yīng)用中需要與物體檢測和分割技術(shù)結(jié)合使用。此外,從2D圖像理解擴(kuò)展到3D場景理解、從靜態(tài)分析擴(kuò)展到動態(tài)環(huán)境處理,都需要進(jìn)一步的技術(shù)發(fā)展。

九、局限性與未來發(fā)展:誠實(shí)面對挑戰(zhàn),展望發(fā)展方向

盡管SpatialReasoner-R1在空間推理方面取得了突破性進(jìn)展,但研究團(tuán)隊(duì)秉承科學(xué)研究的嚴(yán)謹(jǐn)態(tài)度,誠實(shí)地分析了當(dāng)前方法的局限性,并為未來的發(fā)展方向指明了道路。

當(dāng)前最主要的局限性在于系統(tǒng)對明確區(qū)域標(biāo)注的依賴。在實(shí)際使用中,用戶需要通過某種方式(比如在圖片上畫框或點(diǎn)擊)來指明要分析的物體或區(qū)域。這就像要求用戶在提問前先用手指指出問題涉及的具體物體。雖然這種做法保證了分析的準(zhǔn)確性,但也限制了系統(tǒng)的自然交互能力。理想情況下,用戶應(yīng)該能夠直接問"客廳里的沙發(fā)離電視有多遠(yuǎn)",而不需要事先標(biāo)注沙發(fā)和電視的位置。

這個(gè)局限性并非無法克服,而是需要與其他AI技術(shù)的協(xié)同發(fā)展。當(dāng)前已有很多優(yōu)秀的物體檢測和語義分割技術(shù),能夠自動識別和定位圖像中的物體。將這些技術(shù)與SpatialReasoner-R1結(jié)合,可以構(gòu)建出更加自然和完整的空間理解系統(tǒng)。用戶只需用自然語言描述要分析的物體,系統(tǒng)就能自動定位并進(jìn)行空間分析。

另一個(gè)限制是當(dāng)前系統(tǒng)主要針對二維圖像進(jìn)行空間推理。雖然通過深度圖像的引入增強(qiáng)了三維理解能力,但距離真正的三維場景理解還有差距。在現(xiàn)實(shí)應(yīng)用中,特別是機(jī)器人導(dǎo)航或增強(qiáng)現(xiàn)實(shí)應(yīng)用,往往需要處理完整的三維環(huán)境信息。這需要系統(tǒng)能夠整合多視角圖像、深度傳感器數(shù)據(jù),甚至是激光雷達(dá)等三維掃描設(shè)備的信息。

從技術(shù)實(shí)現(xiàn)角度看,當(dāng)前的訓(xùn)練數(shù)據(jù)主要來源于靜態(tài)圖像,而現(xiàn)實(shí)世界的空間理解往往涉及動態(tài)場景。比如,判斷一輛行駛中的汽車何時(shí)會到達(dá)特定位置,或者預(yù)測移動物體之間的碰撞風(fēng)險(xiǎn)等。這類動態(tài)空間推理需要系統(tǒng)不僅理解當(dāng)前的空間關(guān)系,還要能夠預(yù)測空間關(guān)系的變化趨勢。

計(jì)算資源的需求是另一個(gè)需要考慮的實(shí)際問題。雖然SpatialReasoner-R1在同等精度下比一些大型模型更加高效,但其詳細(xì)的推理過程仍然需要相當(dāng)?shù)挠?jì)算時(shí)間。在一些需要實(shí)時(shí)響應(yīng)的應(yīng)用場景中,比如自動駕駛的緊急避障,可能需要在推理深度和響應(yīng)速度之間找到平衡點(diǎn)。

數(shù)據(jù)多樣性也是一個(gè)持續(xù)的挑戰(zhàn)。盡管研究團(tuán)隊(duì)構(gòu)建了大規(guī)模的訓(xùn)練數(shù)據(jù)集,但現(xiàn)實(shí)世界的空間場景無限多樣,很難保證訓(xùn)練數(shù)據(jù)覆蓋所有可能的情況。特別是一些極端或罕見的空間配置,可能會讓系統(tǒng)產(chǎn)生意外的錯(cuò)誤。這需要持續(xù)不斷地收集新的訓(xùn)練樣本,并改進(jìn)訓(xùn)練方法來提高系統(tǒng)的泛化能力。

文化和地域差異也可能影響系統(tǒng)的表現(xiàn)。不同地區(qū)的建筑風(fēng)格、物體尺寸標(biāo)準(zhǔn)、空間布局習(xí)慣都可能存在差異。一個(gè)在歐美環(huán)境中訓(xùn)練的系統(tǒng),在亞洲的居住環(huán)境中可能會產(chǎn)生偏差。這需要在系統(tǒng)設(shè)計(jì)中考慮本地化適配的問題。

盡管存在這些挑戰(zhàn),研究團(tuán)隊(duì)對未來發(fā)展充滿信心。多模態(tài)信息融合是一個(gè)重要的發(fā)展方向,通過整合視覺、聽覺、觸覺等多種感知信息,可以構(gòu)建更加全面和robust的空間理解能力。聯(lián)邦學(xué)習(xí)和個(gè)性化適配技術(shù)可以讓系統(tǒng)在保護(hù)用戶隱私的同時(shí),適應(yīng)不同的使用環(huán)境和個(gè)人偏好。

端到端的神經(jīng)符號集成是另一個(gè)有前景的方向。通過將神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)能力與符號推理的邏輯性相結(jié)合,可以構(gòu)建出既能處理不確定性又能進(jìn)行嚴(yán)密邏輯推理的空間理解系統(tǒng)。這種系統(tǒng)不僅能夠給出準(zhǔn)確的答案,還能提供可驗(yàn)證的推理過程。

研究團(tuán)隊(duì)還計(jì)劃探索自監(jiān)督學(xué)習(xí)和零樣本學(xué)習(xí)技術(shù),減少對大量標(biāo)注數(shù)據(jù)的依賴。通過讓系統(tǒng)從未標(biāo)注的圖像和視頻中自主學(xué)習(xí)空間關(guān)系,可以大大降低數(shù)據(jù)收集和標(biāo)注的成本,同時(shí)提高系統(tǒng)對新環(huán)境的適應(yīng)能力。

人機(jī)協(xié)作也是一個(gè)重要的發(fā)展方向。未來的空間理解系統(tǒng)不應(yīng)該是完全自動化的,而應(yīng)該能夠與人類用戶進(jìn)行有效的協(xié)作。當(dāng)系統(tǒng)遇到困難或不確定的情況時(shí),能夠主動尋求人類的幫助和指導(dǎo),并從這些交互中學(xué)習(xí)和改進(jìn)。

說到底,SpatialReasoner-R1的意義不僅在于它在特定任務(wù)上的優(yōu)異表現(xiàn),更在于它為AI系統(tǒng)的空間理解能力開辟了一個(gè)全新的研究方向。隨著技術(shù)的不斷發(fā)展和完善,我們有理由相信,未來的AI系統(tǒng)將具備與人類相當(dāng)甚至超越人類的空間理解和推理能力,為我們創(chuàng)造一個(gè)更智能、更便捷的生活環(huán)境。

Q&A

Q1:SpatialReasoner-R1是什么?它能做什么? A:SpatialReasoner-R1是由伊利諾伊大學(xué)研究團(tuán)隊(duì)開發(fā)的AI空間推理系統(tǒng)。它能夠像人類一樣理解圖片中的空間關(guān)系,準(zhǔn)確估算物體之間的距離、判斷位置關(guān)系、比較大小高低等。最重要的是,它不僅能給出答案,還能提供完整的推理過程,比如"先識別參考物體的尺寸,再計(jì)算空間距離"等步驟,就像一個(gè)會解釋思路的空間幾何專家。

Q2:這個(gè)技術(shù)會不會改變我們的日常生活? A:會的,而且影響可能比我們想象的更廣泛。在自動駕駛方面,它能讓車輛更準(zhǔn)確判斷距離和位置,提高行車安全;在家居購物時(shí),能幫你判斷家具是否適合你的房間;在AR應(yīng)用中,能讓虛擬物體更準(zhǔn)確地與現(xiàn)實(shí)環(huán)境融合。醫(yī)療影像分析、建筑施工監(jiān)管、智能監(jiān)控等專業(yè)領(lǐng)域也會受益。不過目前還主要在實(shí)驗(yàn)階段,真正普及到消費(fèi)級應(yīng)用還需要一些時(shí)間。

Q3:普通人如何使用這項(xiàng)技術(shù)?有什么要求? A:目前SpatialReasoner-R1還主要是研究階段的技術(shù),普通用戶還不能直接使用。研究團(tuán)隊(duì)已經(jīng)開源了相關(guān)代碼和數(shù)據(jù),技術(shù)開發(fā)者可以在GitHub等平臺找到相關(guān)資源。未來這項(xiàng)技術(shù)可能會集成到各種應(yīng)用中,比如購物APP的空間測量功能、相機(jī)APP的智能測距、家裝設(shè)計(jì)軟件等。使用時(shí)只需要上傳圖片并標(biāo)注要分析的物體區(qū)域,系統(tǒng)就能提供詳細(xì)的空間分析結(jié)果。

分享至
0贊

好文章,需要你的鼓勵(lì)

推薦文章
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-