4月7日,阿里云公開“阿里版GPT”通義千問邀測(cè)入口,引發(fā)強(qiáng)烈關(guān)注。4月11日,阿里云再放大招。“所有軟件都值得接入大模型升級(jí)改造”,阿里云智能CTO周靖人在北京云峰會(huì)現(xiàn)場(chǎng)宣布:“我們將開放通義千問的能力,幫助每家企業(yè)打造自己的專屬大模型!”據(jù)悉,阿里所有產(chǎn)品未來將接入通義千問進(jìn)行全面改造,釘釘、天貓精靈率先接入測(cè)試,將在評(píng)估認(rèn)證后正式發(fā)布新功能。
“通義千問”將全面接入阿里辦公、購物、語音助手等場(chǎng)景
根據(jù)釘釘當(dāng)天預(yù)告的Demo演示,接入通義千問之后的釘釘可實(shí)現(xiàn)近10項(xiàng)新AI功能,全面激發(fā)創(chuàng)意和辦公生產(chǎn)力。通過類似微軟Copilot“副駕駛”的設(shè)定,用戶可隨時(shí)隨地喚起AI,開啟全新工作方式。在釘釘文檔中,通義千問可以創(chuàng)作詩歌小說、撰寫郵件、生成營銷策劃方案等,全面輔助辦公。在釘釘會(huì)議中,通義千問可以隨時(shí)生成會(huì)議記錄并自動(dòng)總結(jié)會(huì)議紀(jì)要、生成待辦事項(xiàng)。通義千問還可以幫助自動(dòng)總結(jié)未讀群聊信息中的要點(diǎn)。最驚艷的是,釘釘展示了拍照生成小程序場(chǎng)景,上傳一張功能草圖,不用寫一行代碼,可立刻生成訂餐輕應(yīng)用。
根據(jù)天貓精靈官方預(yù)告的演示Demo,接入通義千問后,新天貓精靈變得更擬人更聰明,知識(shí)、情感、個(gè)性、記憶能力大幅躍升。它支持自由對(duì)話,可以隨時(shí)打斷、切換話題,能根據(jù)用戶需求和場(chǎng)景隨時(shí)生成內(nèi)容。比如,用戶可以在跑步時(shí)要求天貓精靈“合成1小時(shí)歌單,50%穿插搖滾風(fēng)格的歌曲”,也可以和天貓精靈聊文化談人生。新天貓精靈不僅能回答小朋友的各種刁鉆問題,還可以一起創(chuàng)作“宇宙大爆炸”的新故事。
此外,通義千問還將陸續(xù)嵌入阿里電商、搜索、導(dǎo)航、文娛等場(chǎng)景。比如在網(wǎng)購場(chǎng)景,用戶如果想開生日party,通義千問可以幫助生成生日活動(dòng)方案和購物清單。
以云為基礎(chǔ)設(shè)施幫助每個(gè)企業(yè)打造自己的GPT
“未來所有軟件都值得接入大模型升級(jí)改造,我們將開放通義千問的能力,為每一家企業(yè)打造自己的專屬GPT,歡迎所有人用阿里云開發(fā)自己的大模型。”周靖人表示,阿里云將提供完備的算力和大模型基礎(chǔ)設(shè)施,讓包括創(chuàng)業(yè)公司在內(nèi)的所有企業(yè)和機(jī)構(gòu)更好地實(shí)現(xiàn)創(chuàng)新,讓中國整體的 AI 能力有全方位的提升。
周靖人介紹,未來每一個(gè)企業(yè)在阿里云上既可以調(diào)用通義千問的全部能力,也可以結(jié)合企業(yè)自己的行業(yè)知識(shí)和應(yīng)用場(chǎng)景,訓(xùn)練自己的企業(yè)大模型。比如,每個(gè)企業(yè)都可以有自己的智能客服、智能導(dǎo)購、智能語音助手、文案助手、AI設(shè)計(jì)師、自動(dòng)駕駛模型等。
發(fā)布會(huì)當(dāng)天,阿里云宣布將與OPPO安第斯智能云聯(lián)合打造OPPO大模型基礎(chǔ)設(shè)施,基于通義千問完成大模型的持續(xù)學(xué)習(xí)、精調(diào)及前端提示工程,未來建設(shè)服務(wù)于其海量終端用戶的AI服務(wù)。同時(shí),吉利汽車、智己汽車、奇瑞新能源、毫末智行、太古可口可樂、波司登、掌閱科技等多家企業(yè)表示,將與阿里云在大模型相關(guān)場(chǎng)景展開技術(shù)合作的探索和共創(chuàng)。
除了開放自研的通義千問大模型外,阿里云也在積極建設(shè)開源的AI社區(qū)生態(tài)。去年11月,阿里云正式提出“Model as a Service”理念,并推出國內(nèi)首個(gè)AI模型社區(qū)“魔搭”,開發(fā)者可以在魔搭上下載各類開源AI模型,并直接調(diào)用阿里云的算力和一站式的AI大模型訓(xùn)練及推理平臺(tái)。發(fā)布不到半年,“魔搭”社區(qū)總用戶量已超100萬,模型總下載量超1600萬次,成為國內(nèi)規(guī)模最大的AI模型社區(qū)。
好文章,需要你的鼓勵(lì)
騰訊ARC實(shí)驗(yàn)室推出AudioStory系統(tǒng),首次實(shí)現(xiàn)AI根據(jù)復(fù)雜指令創(chuàng)作完整長篇音頻故事。該系統(tǒng)結(jié)合大語言模型的敘事推理能力與音頻生成技術(shù),通過交錯(cuò)式推理生成、解耦橋接機(jī)制和漸進(jìn)式訓(xùn)練,能夠?qū)?fù)雜指令分解為連續(xù)音頻場(chǎng)景并保持整體連貫性。在AudioStory-10K基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,為AI音頻創(chuàng)作開辟新方向。
Meta與特拉維夫大學(xué)聯(lián)合研發(fā)的VideoJAM技術(shù),通過讓AI同時(shí)學(xué)習(xí)外觀和運(yùn)動(dòng)信息,顯著解決了當(dāng)前視頻生成模型中動(dòng)作不連貫、違反物理定律的核心問題。該技術(shù)僅需添加兩個(gè)線性層就能大幅提升運(yùn)動(dòng)質(zhì)量,在多項(xiàng)測(cè)試中超越包括Sora在內(nèi)的商業(yè)模型,為AI視頻生成的實(shí)用化應(yīng)用奠定了重要基礎(chǔ)。
上海AI實(shí)驗(yàn)室發(fā)布OmniAlign-V研究,首次系統(tǒng)性解決多模態(tài)大語言模型人性化對(duì)話問題。該研究創(chuàng)建了包含20萬高質(zhì)量樣本的訓(xùn)練數(shù)據(jù)集和MM-AlignBench評(píng)測(cè)基準(zhǔn),通過創(chuàng)新的數(shù)據(jù)生成和質(zhì)量管控方法,讓AI在保持技術(shù)能力的同時(shí)顯著提升人性化交互水平,為AI價(jià)值觀對(duì)齊提供了可行技術(shù)路徑。
谷歌DeepMind團(tuán)隊(duì)開發(fā)的GraphCast是一個(gè)革命性的AI天氣預(yù)測(cè)模型,能夠在不到一分鐘內(nèi)完成10天全球天氣預(yù)報(bào),準(zhǔn)確性超越傳統(tǒng)方法90%的指標(biāo)。該模型采用圖神經(jīng)網(wǎng)絡(luò)技術(shù),通過學(xué)習(xí)40年歷史數(shù)據(jù)掌握天氣變化規(guī)律,在極端天氣預(yù)測(cè)方面表現(xiàn)卓越,能耗僅為傳統(tǒng)方法的千分之一,為氣象學(xué)領(lǐng)域帶來了效率和精度的雙重突破。