科技行者 3月26日 北京消息: 一張PPT頁,今天出現(xiàn)在了朋友圈里,“缺失的爸爸 焦慮的媽媽 失控的孩子 守望的老人”是當代典型的“中國式家庭”,在朋友圈里發(fā)布這張圖片的朋友其實并不知道這張圖片的出處,但他很認同這句感悟。
實際上,這張PPT出自今天百度與“小魚在家”聯(lián)合出品的智能視頻音箱“小度在家”的發(fā)布會上,百度度秘事業(yè)部總經(jīng)理景鯤的演講PPT。
景鯤感慨,隨著當代社會生活工作節(jié)奏不斷加快,年輕的爸爸媽媽一方面要努力工作,一方面還要精心照顧孩子,兩方面的壓力導致經(jīng)常性的焦慮。同時很多年輕人在遠離家鄉(xiāng)的異地工作,和父母相隔千里,忙碌的工作節(jié)奏導致每年可能只有過年時才能見上一面,這種思念親人卻不能見面的遺憾時??M繞心頭。那么有沒有一種科技產(chǎn)品,可以大幅降低年輕媽媽焦慮指數(shù),提升家中老人的幸福指數(shù),讓不在家的人想家就能一秒回家?如何完美解決這一系列痛點,是百度與小魚推出“小度在家”的初衷。
“小度在家”搭載了百度DuerOS對話式AI操作系統(tǒng),融合了六麥遠場語音、優(yōu)質(zhì)音箱、觸摸屏、攝像頭于一身,聽得懂、看得見、能對話、會思考。查天氣、問菜譜、播視頻、講故事、看新聞……只需一句話,它就能滿足全部需求。“小度在家”擁有3000萬條短視頻、1400萬條百科、50萬兒童故事、100萬相聲小品戲曲、100萬道菜譜、上億母嬰知識等海量資源。
首先,“小度在家”是一款更好用的智能音箱,“小度在家”的語音交互能力、屏幕顯示能力和攝像頭視覺識別能力的組合產(chǎn)生了化學作用。“小度小度,我想看《熱血街舞團》”,極具視覺沖擊力的綜藝節(jié)目讓你大呼過癮;“小度小度,我想看雪球財經(jīng)”,播報新聞時,語音回答和屏幕動態(tài)的配合讓信息一目了然。在你和“小度在家”對話的過程中,它還可以隨時給出智能提示,告訴你接下來還可以怎么問。例如在播放音樂時,屏幕會提示“下一首、收藏這首歌、打開我的播放列表”等語音指令。通過持續(xù)培養(yǎng)使用習慣,讓語音交互真正成為所有家庭成員都能掌握技能。
“小度在家”也是更靈活的智能電視,百搭各個家庭場景。用戶可以全語音操作,想看什么,無需點按遙控器上和觸控手機屏幕。你可把設備任意擺放在需要的地方:放在廚房里,說一句“小度小度,魚香肉絲怎么做”,視頻演示的菜譜讓你變身廚藝達人;放在餐桌上,說一句“播放《老男孩》第五集”,讓你邊吃邊看全新熱??;放在兒童房,問一句“小度小度,恐龍是怎么滅絕的”?“小度在家”馬上變成帶娃神器,讓你的“十萬個為什么”寶寶滿足所有好奇心。
除此之外,“小度在家”還是更高效的可視電話,用戶可以完全用語音撥打接聽視頻電話,解放雙手。“小度在家”既支持多方高清視頻通話,也支持撥打普通電話號碼。其中,“一呼即通”功能最適合有老人和孩子的家庭。通過簡單的權限設置,當你向家里的小度在家撥出電話時,不需要家人操作接聽,小度在家就能幫你直接聯(lián)通。小度在家打造了一個永遠對家人敞開的時空門,改變了家人之間的連接方式。
小度在家還基于DuerOS平臺整合了藍港、果殼網(wǎng)、平安好醫(yī)生等豐富的第三方開發(fā)者技能。未來,通過搭載多種配件“小度在家”還將支持更多特色功能,包括電視互動、智能家居、家庭K歌、家庭健身等,讓“小度在家”真正成為中國用戶的智能家庭中心。發(fā)布會現(xiàn)場,百度DuerOS宣布智能設備激活量突破5000萬,月活躍設備量突破1000萬,累積回答問題數(shù)24億。
據(jù)了解,小度在家最終定價為599元,即日起,消費者可在京東0元預訂,4月10日起正式發(fā)貨。這樣一款極具性價比的家庭AI產(chǎn)品,將開啟人工智能走向中國普通家庭的大門。
好文章,需要你的鼓勵
騰訊ARC實驗室推出AudioStory系統(tǒng),首次實現(xiàn)AI根據(jù)復雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結合大語言模型的敘事推理能力與音頻生成技術,通過交錯式推理生成、解耦橋接機制和漸進式訓練,能夠將復雜指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準測試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學聯(lián)合研發(fā)的VideoJAM技術,通過讓AI同時學習外觀和運動信息,顯著解決了當前視頻生成模型中動作不連貫、違反物理定律的核心問題。該技術僅需添加兩個線性層就能大幅提升運動質(zhì)量,在多項測試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實用化應用奠定了重要基礎。
上海AI實驗室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓練數(shù)據(jù)集和MM-AlignBench評測基準,通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術能力的同時顯著提升人性化交互水平,為AI價值觀對齊提供了可行技術路徑。
谷歌DeepMind團隊開發(fā)的GraphCast是一個革命性的AI天氣預測模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預報,準確性超越傳統(tǒng)方法90%的指標。該模型采用圖神經(jīng)網(wǎng)絡技術,通過學習40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預測方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學領域帶來了效率和精度的雙重突破。