作為全球消費電子巨頭,蘋果早在去年就被曝出,將進入機器人領(lǐng)域。
當時外媒報道稱,蘋果正在開發(fā)一款桌面機器人,該設(shè)備整合了一個類似iPad的顯示屏和一個機械臂,以及蘋果的人工智能技術(shù),顯示屏可以360°旋轉(zhuǎn),并可作為家庭控制中心。
這一項目的負責人據(jù)稱是蘋果此前負責自動駕駛汽車項目的技術(shù)副總裁的Kevin Lynch,它也負責過蘋果Apple Watch項目。
如今,這個桌面機器人相關(guān)項目資料以研究論文的形式對外曝光。
臺燈機器人,讓皮克斯照進現(xiàn)實
1985年,蘋果傳奇創(chuàng)始人喬布斯被董事會和他親自請來的CEO斯卡利趕出了自己一手創(chuàng)辦的公司蘋果,不過,在這一年,對計算機圖形學(xué)有濃厚興趣的喬布斯花1000萬美元投資了盧卡斯影業(yè)的電腦部門。
獨立后的盧卡斯影業(yè)電腦部門有了一個在后來為眾人熟知的名字,皮克斯(Pixar)。
雖然喬布斯投資皮克斯出于對于皮克斯的電腦和軟件設(shè)計能力看好,但同樣有著他對設(shè)計藝術(shù)的個人情懷。
在喬布斯與皮克斯正式達成投資協(xié)議的1986年,為了展示皮克斯的硬件和軟件,以推動電腦和圖像渲染軟件的商業(yè)化,喬布斯和新成立的皮克斯團隊決定制作一部動畫短片,參加這一年的SIGGRAPH大會。
這部短片就是《頑皮跳跳燈》(Luxo Jr.),這部僅有兩分鐘的動畫,在1986年SIGGRAPH大會上火爆全場,并在當年獲得了奧斯卡獎項提名。
時隔四十年后,當蘋果決定進入機器人領(lǐng)域時,第一款闖入大眾視野的,很可能也正是以當年這款跳跳燈為原型的機器人,一款看上去不那么像機器人的機器人。
這款機器人出現(xiàn)在近日蘋果機器學(xué)習研究團隊的對外公開的研究論文中。
在這篇論文中,蘋果機器學(xué)習研究團隊展示出的這款臺燈機器人,可以通過語音、手勢控制,還富有情感表達和更多AI功能。
例如,它會通過點頭、搖頭動作表示對你的觀點的贊同或不贊同,通過不同運動路徑向你表達它自己的情感。
又如,它還具備投影功能,通過攝像頭陪伴孩子寫作業(yè),并通過投影的圖像和語音功能,為孩子輔導(dǎo)作業(yè)、批改作業(yè),乃至一起畫畫本。
在你晚上口渴想喝水時,它還會打開燈,通過自己的照明軌跡告訴你水杯在哪里,喝完水你要把水杯放到桌上,它也會跟隨你的水杯運動軌跡,給你提供更好的照明體驗。
當你問它“今天天氣怎么樣”時,它會先看向窗外,然后告訴你今天的天氣狀況。
更為神奇的是,當你在桌前閱讀時,它還會通過將水杯推向你面前,提醒你,你該喝水了。
從蘋果機器學(xué)習研究團隊公布的4分鐘演示視頻中來看,它已經(jīng)不僅僅是一個桌面臺燈,更像是一個活潑可愛的小精靈,更富有陪伴屬性。
與此同時,我們發(fā)現(xiàn),這次,蘋果也在盡可能多得將大模型技術(shù)應(yīng)用的機器人中,它甚至可以為你提供一些專業(yè)指導(dǎo)和建議。
例如,當你在維修一個設(shè)備卻一直沒有頭緒時,你的臺燈可以直接為通過它的投影儀投射出正確的設(shè)備修理教程。
這就是蘋果近日公布的臺燈機器人研究項目。
蘋果押注家用機器人
蘋果上一個和機器人稍微沾點邊的產(chǎn)品,還是在WWDC 2017上發(fā)布的智能音箱HomePod,這一年,智能音箱百箱大戰(zhàn),一度被視為人工智能技術(shù)的絕佳載體,也被視為智能家居絕佳的入口級設(shè)備。
不過,當時的蘋果依舊晚了一步,在亞馬遜和谷歌占據(jù)美國智能音箱主導(dǎo)地位時,蘋果的HomePod在上市后的第一年,2018年,僅僅在美國市場拿下了6%的市場份額。
這次押注機器人是蘋果繼放棄造車、加碼Vision Pro后的又一個重大決策,據(jù)外媒透露,由Kevin Lynch領(lǐng)導(dǎo)的機器人團隊于2025年8月成立,并在全球范圍內(nèi)招聘機器人領(lǐng)域?qū)<摇?/p>
據(jù)外媒Appleinsider的近日報道,蘋果目前正在招聘更多機器人專家,旨在推進家用機器人領(lǐng)域的產(chǎn)品研發(fā)。
好文章,需要你的鼓勵
新加坡國立大學(xué)研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓(xùn)練AI玩簡單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟大學(xué)團隊開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實現(xiàn)37.9%的精度提升,并在真實設(shè)備上展現(xiàn)出色泛化能力,為機器人、AR和自動駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團隊通過對比實驗發(fā)現(xiàn),經(jīng)過強化學(xué)習訓(xùn)練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實際提升推理準確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質(zhì)量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動態(tài)稀疏性實現(xiàn)大語言模型訓(xùn)練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓(xùn)練效率,已在多個任務(wù)上驗證有效性。
關(guān)注智造、硬件、機器人。