科技博客網(wǎng)站9to5Mac刊文稱,蘋果在全球開發(fā)商會議(以下簡稱“WWDC”)上公布的iOS 8為Safari瀏覽器增添了一項利用iOS設(shè)備攝像頭掃描信用卡的功能。
這一功能可以取代用戶輸入信用卡信息的過程。攝像頭拍攝的信用卡圖像會被內(nèi)置的光學(xué)字符識別(以下簡稱“OCR”)軟件轉(zhuǎn)換為文本信息。假定OCR過程很精確,這一功能將節(jié)省用戶人工輸入信用卡信息的時間。
但蘋果在移動支付領(lǐng)域落后于其他廠商。蘋果iOS設(shè)備尚不支持NFC(近距離通信)技術(shù),這一技術(shù)允許移動設(shè)備用于移動支付,Android很久以前就支持NFC。蘋果只是在2012年發(fā)布了Passbook應(yīng)用,在數(shù)字錢包領(lǐng)域邁出了一小步。
移動支付和數(shù)字錢包還是一個新興的領(lǐng)域,多家廠商推出了多款不同的產(chǎn)品,遠未實現(xiàn)標準化。消費者對NFC興趣不大,主要原因是廠商在簡化支付過程方面做得還很不夠。
但是,像Apple這樣的科技巨頭在移動支付領(lǐng)域的努力,將推動消費者對移動支付技術(shù)的興趣,以及移動支付技術(shù)的普及。除向第三方開發(fā)商開放Touch ID指紋傳感器外,蘋果在WWDC上沒有披露更多有關(guān)移動支付的消息。
好文章,需要你的鼓勵
騰訊ARC實驗室推出AudioStory系統(tǒng),首次實現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù),通過交錯式推理生成、解耦橋接機制和漸進式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準測試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時學(xué)習(xí)外觀和運動信息,顯著解決了當前視頻生成模型中動作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個線性層就能大幅提升運動質(zhì)量,在多項測試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實驗室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評測基準,通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時顯著提升人性化交互水平,為AI價值觀對齊提供了可行技術(shù)路徑。
谷歌DeepMind團隊開發(fā)的GraphCast是一個革命性的AI天氣預(yù)測模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報,準確性超越傳統(tǒng)方法90%的指標。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來了效率和精度的雙重突破。