CNET科技資訊網 5月25日 國際報道:谷歌正在碾壓著Siri,主導著智能家居,不過蘋果還有機會在6月來一波反擊。
在上周谷歌召開的一年一度的Google I/O開發(fā)者大會上,谷歌為我們展示了一連串令人興奮的創(chuàng)新點。蘋果應該為之顫抖了。
這家搜索及軟件巨頭目前正通過其Assistant在人工智能領域大步邁進,通過Google Lens在圖像搜索和檢測方面大顯身手,通過即時應用(Instant Apps)改進其網絡搜索,同時用戶可以在Google上通過Jobs搜索工作。
換句話說,谷歌的生態(tài)系統(tǒng)將能夠大大超越蘋果所構建的緊密集成型軟件和硬件系統(tǒng),畢竟在提及Siri、虛擬現(xiàn)實、智能家居和汽車儀表盤等領域時,蘋果的創(chuàng)新速度已經落后于谷歌了。
雖然谷歌的方法很清晰——利用深度信息數(shù)據庫,希望將其他公司所依賴的平臺據為己有,但蘋果更喜歡掌控一個完整的、可靠生態(tài)系統(tǒng),這也意味著后者需要花費更長的時間才能將所有事情“做好”。
在6月5日,也就是幾周后的蘋果開發(fā)者大會上,蘋果就有機會用其自己在iOS、iPhone、MacBook、Siri AI、智能手表甚至是智能家居領域的改進對谷歌和新版微軟系統(tǒng)進行反擊了。
但谷歌上周的開發(fā)者大會給蘋果帶來了很大的挑戰(zhàn)。我們將在下面闡述蘋果應該擔心、且需要將其A級產品帶到其6月份的WWDC全球開發(fā)者大會上的原因所在。
·虛擬助手:谷歌的語音搜索工具早就超過了蘋果的Siri。前者比后者更為精準,而且多數(shù)時候的反應都更為靈敏。而且不久以后,新一代Google Assistant將允許用戶用Google Lens輸入查詢并識別物體。用戶可以在會議結束后用Assistant迅速點午餐。而且它也將登陸iPhone。
·智能家居:Google Home剛剛為我們帶來了一系列激動人心的功能,它們甚至超越了業(yè)界領導者亞馬遜的Echo系列。即:它目前不僅區(qū)分與其對話用戶,并進行個性化的反應,而引入了免提通話功能。雖然蘋果有HomeKit,但我們還在等待傳聞中將會到來的控制中心,類似于Google Home,能夠將智能家居全部綁定到一起。
·圖像:盡管人們對Google Photos有一些有爭議的酷炫更新,但截至目前,最令人興奮的變化之處都圍繞著Google Lens,它主要是用來通過攝像頭識別物體和地點的。而且Google Lens將首度與Google Photos和Google Assistant深度融合。
·VR和AR:根據傳聞,蘋果將把交替現(xiàn)實(alternate reality)技術加入其下一代iPhone的攝像頭中,但谷歌已經推出了一款專用的虛擬現(xiàn)實頭盔、支持VR的手機和兩款AR手機了。
·Chrome:谷歌Chrome瀏覽器將可以同步移動手機,而且還可以支持更多設備(而用戶在Android設備上無法使用蘋果的Safari瀏覽器)。谷歌還宣布,其Chrome瀏覽器也將登陸VR。
·汽車:谷歌希望從一開始就讓用戶的汽車信息娛樂系統(tǒng)在Android平臺上運行,而它也正致力于達到這一目的的各種途徑。這其實不同于蘋果CarPlay和Android Auto,后兩者都是讓用戶通過手機來改變汽車屏幕上的內容,而谷歌正設法更進一步。
·搜索和數(shù)據庫:谷歌的主要優(yōu)勢在于其搜索工具和龐大的事件和地點信息數(shù)據庫。在I/O開發(fā)者大會上,谷歌宣布它將簡化工作列表,使它們看起來更像搜索結果。
不過,雖然谷歌在某些領域目前確實占有優(yōu)勢,但蘋果仍具有翻盤的空間。例如,其短信應用從iMessage到Face Time,都比谷歌的強,后者一直是一個混合復雜的冗余平臺。而且蘋果在跨設備整合其軟件生態(tài)系統(tǒng)方面也做的更好。
(隱藏在Google Tango項目里的AR夢)
與此同時,蘋果各設備的軟件更新更為及時,而這點谷歌并不能保證所有設備都可以及時更新。雖然新的Project Treble項目會緩和一點這種弊端,但是其他使用其自家界面的手機制造商仍做不到完全同步更新。
誠然,蘋果還有機會為其下一代操作系統(tǒng)(可能名為iOS 11)掀起一番熱潮,但是最好用一種谷歌的新版Android O沒有用過的方式。
盡管蘋果可能永遠也無法在搜索引擎領域趕超谷歌,但在其他一些重要領域,蘋果確實擁有足夠的資源來趕超這個對手,例如虛擬現(xiàn)實、增強現(xiàn)實技術和智能家居。
蘋果的反擊倒計時已開始。
蘋果并未就此置評。
好文章,需要你的鼓勵
新加坡國立大學研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓練AI玩簡單撲克游戲就能讓其數(shù)學推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學題目作為訓練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉移到數(shù)學解題中,為AI訓練提供了新思路。
同濟大學團隊開發(fā)的GIGA-ToF技術通過融合多幀圖像的"圖結構"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術利用圖像間的不變幾何關系,結合深度學習和數(shù)學優(yōu)化方法,在合成數(shù)據集上實現(xiàn)37.9%的精度提升,并在真實設備上展現(xiàn)出色泛化能力,為機器人、AR和自動駕駛等領域提供更可靠的3D視覺解決方案。
伊利諾伊大學研究團隊通過對比實驗發(fā)現(xiàn),經過強化學習訓練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實際提升推理準確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構聯(lián)合提出SparseLoRA技術,通過動態(tài)稀疏性實現(xiàn)大語言模型訓練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓練效率,已在多個任務上驗證有效性。