CNET科技資訊網(wǎng) 6月3日 北京消息(文/周雅):日前,京東智能發(fā)布“叮咚(DingDong)開放平臺”,聯(lián)合眾多互聯(lián)網(wǎng)行業(yè)合作伙伴,打造基于家庭全景數(shù)據(jù)的服務分發(fā)平臺,開啟智能生活。
京東現(xiàn)場描述這樣的場景:比如,當我們出門前,整理衣服的同時,順嘴就可以喊“叮咚叮咚,打輛出租車”,不需要通過手機即可通過滴滴出行完成叫車服務;或者,當周末你宅在家,家里很亂又懶得收拾,這個時候你只需對叮咚說:“叮咚叮咚,幫我上門取件衣服”,幾分鐘后,e袋洗就會上門來取……從控制家居,到觸發(fā)服務,叮咚希望不斷擴展使用場景。
首批合作伙伴包括:滴滴出行、京東到家、百度地圖、中通快遞、e袋洗、百度地圖、京東到家、JIMI機器人等,不管是家政服務還是出行打車,都可以通過語音來完成。
此次叮咚開放平臺除了會廣泛接入第三方的服務之外,對于此前成立的京東智能音頻聯(lián)盟來說,聯(lián)盟成員的產(chǎn)品也將共享平臺的接入服務。預計今年10月,采用“JD+智能音頻解決方案”的終端,將都可以使用叮咚開放平臺上的服務。
用數(shù)據(jù)打造智慧家居
長期以來,互聯(lián)網(wǎng)化的生活給我們帶來了各種便利,我們在互聯(lián)網(wǎng)上的各種行為產(chǎn)生的數(shù)據(jù)也在服務著我們的生活。叮咚將通過記錄用戶生活行為的數(shù)據(jù),將自動調(diào)整到最舒適狀態(tài)。例如,根據(jù)用戶作息自動打開關(guān)閉家電,根據(jù)用戶身體狀況自動訂購菜蔬,通過語音操作各類電器……
正是集成了每個合作伙伴掌握的不同服務數(shù)據(jù),叮咚開放平臺對此將拼湊成一副“家庭全景數(shù)據(jù)”,這也讓它成為應用大數(shù)據(jù)概念的智能音箱,實現(xiàn)“以家庭單位,用數(shù)據(jù)服務于家庭”。
會上,京東還推出了叮咚靈動版和悅動版兩款智能音箱新品。通過AIUI新一代人工智能語音技術(shù),結(jié)合京東積累的消費數(shù)據(jù),叮咚開放平臺可完成主動式的服務分發(fā)。
針對消費者,叮咚推出“211激活計劃”,即京東智能開放北京深圳2地孵器,用于幫助中小合作伙伴;1萬場活動,用于推廣合作伙伴的服務;1億元資金,用于補貼通過平臺訂購服務的用戶。
開發(fā)者受益
叮咚作為京東與科大訊飛合作推出的智能音箱,通過語音交互方式,實現(xiàn)了自然語言交互進行音頻點播和播放控制,憑借人工智能處理能力,它可以成為用戶的音頻助理,完成百科查詢、講故事、聊天等功能。同時,該產(chǎn)品可以讓用戶通過語音,控制接入京東微聯(lián)的智能產(chǎn)品,成為智能家居的全新交互入口。
據(jù)了解,京東微聯(lián)目前已經(jīng)接入超過400款產(chǎn)品,它不僅可以實現(xiàn)智能設(shè)備的統(tǒng)一管理控制,同時可以實現(xiàn)智能場景化以及開放服務,更可為傳統(tǒng)硬件廠商提供一站式智能解決方案。
叮咚開放平臺基于訊飛智能云,提供全雙工的交互模式、全球領(lǐng)先的語音識別、多語種、多發(fā)音人的語音合成、個性化的語義理解、高靈活度的流程會話,高安全性的第三方業(yè)務云端服務的接入。為所有合作伙伴提供開發(fā)、調(diào)試、部署、上線及更新等環(huán)節(jié)的完備保障。通過此計劃,開發(fā)者可以利用Open API開發(fā)出滿足用戶長尾需求的社交游戲、實用工具等諸多功能。
好文章,需要你的鼓勵
騰訊ARC實驗室推出AudioStory系統(tǒng),首次實現(xiàn)AI根據(jù)復雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù),通過交錯式推理生成、解耦橋接機制和漸進式訓練,能夠?qū)碗s指令分解為連續(xù)音頻場景并保持整體連貫性。在AudioStory-10K基準測試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時學習外觀和運動信息,顯著解決了當前視頻生成模型中動作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個線性層就能大幅提升運動質(zhì)量,在多項測試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實用化應用奠定了重要基礎(chǔ)。
上海AI實驗室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓練數(shù)據(jù)集和MM-AlignBench評測基準,通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時顯著提升人性化交互水平,為AI價值觀對齊提供了可行技術(shù)路徑。
谷歌DeepMind團隊開發(fā)的GraphCast是一個革命性的AI天氣預測模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預報,準確性超越傳統(tǒng)方法90%的指標。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過學習40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預測方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學領(lǐng)域帶來了效率和精度的雙重突破。