谷歌于當地時間本周二表示,該公司將發(fā)布iOS版Photo Sphere應用,此前該應用僅可在Android操作系統(tǒng)上使用。
Photo Sphere應用允許用戶對某一景象360度全景抓拍,并自動將圖片合成為一張全景圖,用戶可向左、向右、向上、向下全方位地欣賞其全景照片。此外用戶還可以將這些照片分享到他們的社交網絡或谷歌地圖中。而且當用戶在谷歌地圖上瀏覽這些照片時,該公司將自動為用戶挑選一些與當地相匹配的照片。
谷歌地圖和全景照片產品經理伊凡·蘭普波特(Evan Rapoport)曾在一份聲明中表示,將該照片應用與地圖一體化的目標之一是幫助人們“探索世界。”
對谷歌來說,推出iOS版Photo Sphere照片應用這種小拓展的效果是雙重的。它有助于增建該公司的地圖應用,爭取更多用戶,幫助他們標記下每一個獨特的地方。同時這也符合谷歌要確保其照片產品得以最大推廣的愿望——即使這意味著這款應用將登陸其競爭對手的移動平臺。
本月早些時候,有新聞報道稱谷歌正計劃解除其廣受歡迎的照片功能與其羽翼未豐的Google +社交網絡之間的綁定。此外,谷歌還在去年10月份對這項功能進行了改進,其中包括一些新的算法,它們能夠使用戶在大量存儲的照片中更容易地進行搜索,更好地備份照片文件。該公司還推出了一項名為Auto Awesome Movie的視頻直播版照片編輯功能,方便用戶通過拼接影片片段來快速構建電影,同時這款軟件還添有背景音樂和濾聲器。
當時擔任Google+負責人的維克·古多塔(Vic Gundotra)現已離開了谷歌,過去他曾表示,這款Photo Sphere服務正“試圖改變攝影界”。
好文章,需要你的鼓勵
新加坡國立大學研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓練AI玩簡單撲克游戲就能讓其數學推理能力提升8.6%,通用推理提升8.4%,且無需任何數學題目作為訓練材料。研究發(fā)現游戲中的三種推理模式能成功轉移到數學解題中,為AI訓練提供了新思路。
同濟大學團隊開發(fā)的GIGA-ToF技術通過融合多幀圖像的"圖結構"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術利用圖像間的不變幾何關系,結合深度學習和數學優(yōu)化方法,在合成數據集上實現37.9%的精度提升,并在真實設備上展現出色泛化能力,為機器人、AR和自動駕駛等領域提供更可靠的3D視覺解決方案。
伊利諾伊大學研究團隊通過對比實驗發(fā)現,經過強化學習訓練的視覺語言模型雖然表現出"頓悟時刻"現象,但這些自我糾錯行為并不能實際提升推理準確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構聯合提出SparseLoRA技術,通過動態(tài)稀疏性實現大語言模型訓練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓練效率,已在多個任務上驗證有效性。