10月26日,快手正式內(nèi)測(cè)“AI小快”賬號(hào),在短視頻評(píng)論區(qū)為用戶(hù)提供互動(dòng)問(wèn)答、圖片生成、攻略檢索、文案修改等多種基于短視頻應(yīng)用場(chǎng)景的AIGC服務(wù)。“AI小快”背后是快手自研大模型的強(qiáng)力支持,包括快手從零到一獨(dú)立自主研發(fā)的大規(guī)模語(yǔ)言模型“快意”大模型和文生圖大模型“可圖”。據(jù)悉,這是今年快手在評(píng)論區(qū)場(chǎng)景落地的首款人格化應(yīng)用,也集成了大語(yǔ)言模型和文生圖模型的能力,讓“AI小快”實(shí)現(xiàn)了“能說(shuō)會(huì)畫(huà)”的能力。今年以來(lái),快手加快了AIGC的技術(shù)布局。8月,快手宣布內(nèi)測(cè)自研大語(yǔ)言模型“快意”(KwaiYii),9月,快手推出了文生圖大模型“可圖”(Kolors),在大模型業(yè)務(wù)方面繼“文生文”之后又補(bǔ)上了“文生圖”這塊版圖。
短視頻評(píng)論區(qū)天然是一個(gè)用戶(hù)表達(dá)、互動(dòng)、交流的公域場(chǎng)地,各品類(lèi)內(nèi)容下均存在用戶(hù)表達(dá)和提問(wèn)的訴求,而且用戶(hù)的提問(wèn)類(lèi)別豐富,覆蓋視頻內(nèi)容的討論交流、對(duì)專(zhuān)業(yè)信息的疑惑以及自我情緒的抒發(fā)等。在快手3.76億DAU的社區(qū)生態(tài)中,用戶(hù)的每一次表達(dá),每一次提問(wèn),都是對(duì)社區(qū)的信任,背后都是對(duì)“被回應(yīng)”的期待。
為了更好的滿(mǎn)足用戶(hù)在評(píng)論區(qū)的訴求,讓用戶(hù)表達(dá)有途徑、互動(dòng)有回應(yīng)、互動(dòng)有驚喜,“AI小快”應(yīng)運(yùn)而生。據(jù)了解,用戶(hù)在快手搜索“AI小快”即可申請(qǐng)參與內(nèi)測(cè),獲得資格的用戶(hù)在短視頻評(píng)論區(qū)發(fā)布艾特@AI小快 的評(píng)論,便可收到@AI小快 的回復(fù)。“AI小快”不僅可以為用戶(hù)們的提問(wèn)給出有效的答案和信息參考,且能在短視頻信息延展的基礎(chǔ)上,有效提升用戶(hù)之間的互動(dòng)頻次和信息交互體驗(yàn)。
值得一提的是,“AI小快”也具有自己的人設(shè),即一個(gè)有態(tài)度、有能力、有感情、有梗的四有AI賬號(hào)。無(wú)論是聊刷劇細(xì)節(jié)還是數(shù)理化難題,只要是用戶(hù)在評(píng)論區(qū)的評(píng)論,“AI小快”有問(wèn)必答。同時(shí),AI小快也是一個(gè)活潑友愛(ài)的聊天搭子,既能提供有效的情緒價(jià)值,也能根據(jù)網(wǎng)絡(luò)熱梗、時(shí)事熱點(diǎn)等信息隨時(shí)“造梗”,力求打造評(píng)論區(qū)的顯眼包。
據(jù)了解,“AI小快”的背后是快意大模型強(qiáng)大的理解、生成與交互能力的支持。本次發(fā)布的“AI小快”的能力已升級(jí)到了快意大模型的 66B 版本。這也是繼8月份快手發(fā)布快意13B模型后的又一次技術(shù)升級(jí)。更大規(guī)模的模型,也帶來(lái)了更強(qiáng)大的能力。
今年下半年以來(lái),快手加快AIGC的布局。8月,快手宣布內(nèi)測(cè)自研大語(yǔ)言模型“快意”(KwaiYii),打造“全模態(tài)大模型AIGC解決方案”。基于自研的基座大模型,為用戶(hù)提供包括文本生成、圖像生成、3D素材生成、音頻生成、視頻生成等在內(nèi)的多種技術(shù)能力。其中,KwaiYii-13B在多個(gè) Benchmark 上都處于領(lǐng)先水平,證明了其在自然語(yǔ)言處理任務(wù)中的出色性能。
基于目前在大模型的技術(shù)積累,快手已經(jīng)在搜索、評(píng)論等多個(gè)場(chǎng)景實(shí)現(xiàn)了應(yīng)用落地。7月8日,快手開(kāi)啟智能問(wèn)答產(chǎn)品的內(nèi)測(cè);8月8日,啟動(dòng)“AI對(duì)話(huà)”內(nèi)測(cè),并于8月18日在快手App安卓版本開(kāi)放內(nèi)測(cè)“快手AI對(duì)話(huà)”功能;9月15日,快手宣布在站內(nèi)短視頻評(píng)論開(kāi)始內(nèi)測(cè)AI文生圖功能——快手AI玩評(píng),用戶(hù)通過(guò)輸入各種創(chuàng)意文字,可一鍵生成海量風(fēng)格圖片,更便捷的在評(píng)論區(qū)進(jìn)行趣味互動(dòng)。
隨著AIGC商業(yè)落地迎來(lái)新一輪波峰,技術(shù)與產(chǎn)業(yè)的融合度及場(chǎng)景應(yīng)用豐富度在迅速提高。短視頻擁有龐大的用戶(hù)基礎(chǔ)和強(qiáng)大社交屬性,為AIGC的落地提供了更多應(yīng)用場(chǎng)景。未來(lái),快手將持續(xù)深耕AI技術(shù),推動(dòng)產(chǎn)品形態(tài)、用戶(hù)體驗(yàn)發(fā)展,探索短視頻業(yè)務(wù)的第二曲線(xiàn),推動(dòng)其成為短視頻+直播平臺(tái)的基礎(chǔ)設(shè)施。
好文章,需要你的鼓勵(lì)
新加坡國(guó)立大學(xué)研究團(tuán)隊(duì)開(kāi)發(fā)了SPIRAL框架,通過(guò)讓AI與自己對(duì)弈零和游戲來(lái)提升推理能力。實(shí)驗(yàn)顯示,僅訓(xùn)練AI玩簡(jiǎn)單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無(wú)需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟(jì)大學(xué)團(tuán)隊(duì)開(kāi)發(fā)的GIGA-ToF技術(shù)通過(guò)融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機(jī)噪聲問(wèn)題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實(shí)現(xiàn)37.9%的精度提升,并在真實(shí)設(shè)備上展現(xiàn)出色泛化能力,為機(jī)器人、AR和自動(dòng)駕駛等領(lǐng)域提供更可靠的3D視覺(jué)解決方案。
伊利諾伊大學(xué)研究團(tuán)隊(duì)通過(guò)對(duì)比實(shí)驗(yàn)發(fā)現(xiàn),經(jīng)過(guò)強(qiáng)化學(xué)習(xí)訓(xùn)練的視覺(jué)語(yǔ)言模型雖然表現(xiàn)出"頓悟時(shí)刻"現(xiàn)象,但這些自我糾錯(cuò)行為并不能實(shí)際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗(yàn)證差距",即生成答案的能力強(qiáng)于驗(yàn)證答案質(zhì)量的能力,且模型在自我驗(yàn)證時(shí)無(wú)法有效利用視覺(jué)信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機(jī)構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過(guò)動(dòng)態(tài)稀疏性實(shí)現(xiàn)大語(yǔ)言模型訓(xùn)練加速1.6倍,計(jì)算成本降低2.2倍。該方法使用SVD稀疏性估計(jì)器智能選擇重要計(jì)算部分,在保持模型性能的同時(shí)顯著提升訓(xùn)練效率,已在多個(gè)任務(wù)上驗(yàn)證有效性。