av天堂久久天堂色综合,最近中文字幕mv免费高清在线,在线a级毛片免费视频,av动漫,中文字幕精品亚洲无线码一区

微信掃一掃,關(guān)注公眾號(hào)

  • 科技行者

  • 算力行者

見(jiàn)證連接與計(jì)算的「力量」

首頁(yè) 為創(chuàng)意寫(xiě)作量身定制:Midjourney團(tuán)隊(duì)如何讓AI寫(xiě)作變得更有趣更多樣化

為創(chuàng)意寫(xiě)作量身定制:Midjourney團(tuán)隊(duì)如何讓AI寫(xiě)作變得更有趣更多樣化

2025-07-30 10:01
分享至:
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-
2025-07-30 10:01 ? 科技行者

這篇由Midjourney公司的John Joon Young Chung等研究人員撰寫(xiě)的論文發(fā)表于2025年3月,展示了如何讓大型語(yǔ)言模型在創(chuàng)意寫(xiě)作方面變得更加多樣化和有趣。研究團(tuán)隊(duì)還包括來(lái)自紐約大學(xué)的Vishakh Padmakumar,對(duì)創(chuàng)意寫(xiě)作領(lǐng)域有著深入理解的讀者可以通過(guò)GitHub項(xiàng)目頁(yè)面(https://github.com/mj-storytelling/DiversityTuning)獲取完整的技術(shù)代碼和實(shí)現(xiàn)細(xì)節(jié)。

一、為什么AI寫(xiě)作變得千篇一律了

當(dāng)你讓ChatGPT或其他AI助手寫(xiě)故事時(shí),有沒(méi)有發(fā)現(xiàn)它們的創(chuàng)作風(fēng)格越來(lái)越相似?這不是你的錯(cuò)覺(jué)。研究團(tuán)隊(duì)發(fā)現(xiàn)了一個(gè)有趣的現(xiàn)象:雖然現(xiàn)在的AI在寫(xiě)作質(zhì)量上已經(jīng)相當(dāng)不錯(cuò),但它們的創(chuàng)作內(nèi)容卻變得越來(lái)越單調(diào)乏味,就像是同一個(gè)作者在反復(fù)創(chuàng)作相似的故事。

這個(gè)問(wèn)題的根源在于AI的訓(xùn)練方式。目前主流的AI訓(xùn)練方法就像是一個(gè)嚴(yán)格的寫(xiě)作老師,它會(huì)告訴AI什么是"好"的寫(xiě)作,什么是"壞"的寫(xiě)作。AI為了討好這位老師,逐漸學(xué)會(huì)了寫(xiě)出"標(biāo)準(zhǔn)答案"式的內(nèi)容。雖然這些內(nèi)容質(zhì)量不錯(cuò),但缺乏創(chuàng)新和個(gè)性,就像是工廠流水線上生產(chǎn)出來(lái)的產(chǎn)品一樣標(biāo)準(zhǔn)化。

研究團(tuán)隊(duì)通過(guò)大量實(shí)驗(yàn)發(fā)現(xiàn),這種訓(xùn)練方式確實(shí)能提高AI寫(xiě)作的整體質(zhì)量,但同時(shí)也扼殺了創(chuàng)作的多樣性。當(dāng)AI總是選擇最"安全"的寫(xiě)作路徑時(shí),它們就失去了探索不同創(chuàng)作可能性的勇氣。這對(duì)創(chuàng)意寫(xiě)作來(lái)說(shuō)是個(gè)嚴(yán)重問(wèn)題,因?yàn)閯?chuàng)意的本質(zhì)就是要有多種不同的思路和表達(dá)方式。

想象一下,如果所有人都用同樣的方式講同一個(gè)故事,那這個(gè)世界會(huì)變得多么無(wú)聊。比如給AI一個(gè)關(guān)于"月球上的狗"的故事提示,理想情況下應(yīng)該能得到各種各樣的故事:有的講狗狗的冒險(xiǎn)經(jīng)歷,有的講它在月球上的孤獨(dú)生活,有的講它如何適應(yīng)外太空環(huán)境。但現(xiàn)實(shí)中,大多數(shù)AI都會(huì)選擇最"安全"的故事情節(jié),導(dǎo)致生成的故事大同小異。

這個(gè)問(wèn)題不僅影響AI的創(chuàng)作表現(xiàn),也會(huì)影響使用AI進(jìn)行創(chuàng)作的人類作者。當(dāng)作家們依賴AI助手進(jìn)行創(chuàng)作時(shí),如果AI總是提供相似的建議和思路,那么人類的作品也會(huì)趨向同質(zhì)化。這種現(xiàn)象已經(jīng)在一些研究中得到了證實(shí),使用同樣AI工具的作者確實(shí)會(huì)產(chǎn)生風(fēng)格相似的作品。

研究團(tuán)隊(duì)意識(shí)到,要解決這個(gè)問(wèn)題,不能簡(jiǎn)單地調(diào)整AI的生成參數(shù),比如增加隨機(jī)性或改變溫度設(shè)置。這些方法雖然能在一定程度上增加輸出的變化,但往往是以犧牲質(zhì)量為代價(jià)的。真正需要的是從根本上改變AI的學(xué)習(xí)方式,讓它不僅能學(xué)會(huì)寫(xiě)好的內(nèi)容,還能學(xué)會(huì)寫(xiě)有趣的、不同尋常的內(nèi)容。

二、挖掘那些被忽視的優(yōu)秀創(chuàng)意

研究團(tuán)隊(duì)提出了一個(gè)巧妙的解決方案,就像是在茫茫人海中尋找那些被忽視的天才一樣。他們的核心思想是:在訓(xùn)練數(shù)據(jù)中,那些質(zhì)量高但又與眾不同的內(nèi)容往往被傳統(tǒng)訓(xùn)練方法忽視了,而這些內(nèi)容恰恰是創(chuàng)意的寶藏。

為了更好地理解這個(gè)概念,可以把訓(xùn)練數(shù)據(jù)想象成一個(gè)巨大的創(chuàng)作比賽。在這個(gè)比賽中,有大量的參賽作品。傳統(tǒng)的AI訓(xùn)練方法就像是只關(guān)注那些獲得最高分的"標(biāo)準(zhǔn)優(yōu)秀作品",而忽視了那些可能分?jǐn)?shù)不是最高,但創(chuàng)意獨(dú)特、風(fēng)格新穎的作品。這些被忽視的作品雖然可能在某些評(píng)判標(biāo)準(zhǔn)上略遜一籌,但它們卻代表了創(chuàng)作的多樣性和可能性。

研究團(tuán)隊(duì)引入了一個(gè)叫做"偏差度"的概念來(lái)衡量每個(gè)訓(xùn)練樣本的獨(dú)特性。這個(gè)偏差度就像是一個(gè)"與眾不同指數(shù)",它能夠計(jì)算出某個(gè)創(chuàng)作樣本與同類其他樣本的差異程度。差異越大,偏差度就越高,說(shuō)明這個(gè)樣本越獨(dú)特。

具體來(lái)說(shuō),他們使用了兩種不同的測(cè)量方式來(lái)計(jì)算偏差度。第一種是語(yǔ)義偏差,主要看內(nèi)容的意思和主題是否獨(dú)特。比如在寫(xiě)"月球上的狗"這個(gè)主題時(shí),大部分故事可能都圍繞狗狗的冒險(xiǎn)展開(kāi),但如果有一個(gè)故事是從狗狗的心理角度探討孤獨(dú)和思鄉(xiāng)之情,那這個(gè)故事的語(yǔ)義偏差度就會(huì)比較高。

第二種是風(fēng)格偏差,主要看寫(xiě)作風(fēng)格和表達(dá)方式是否獨(dú)特。即使是同樣的故事主題,不同的敘述方式、語(yǔ)言風(fēng)格、文體結(jié)構(gòu)都會(huì)產(chǎn)生不同的閱讀體驗(yàn)。有些作者喜歡用對(duì)話推進(jìn)情節(jié),有些喜歡用大量的環(huán)境描寫(xiě)營(yíng)造氛圍,有些則傾向于簡(jiǎn)潔明快的敘述。這些風(fēng)格差異就構(gòu)成了風(fēng)格偏差度的基礎(chǔ)。

研究團(tuán)隊(duì)的創(chuàng)新之處在于,他們?cè)谟?xùn)練過(guò)程中給這些高偏差度的優(yōu)質(zhì)樣本更多的關(guān)注。就像是一個(gè)開(kāi)明的評(píng)委,不僅要欣賞那些傳統(tǒng)意義上的佳作,更要發(fā)掘那些風(fēng)格獨(dú)特、創(chuàng)意新穎的作品。這種方法能夠讓AI學(xué)會(huì)欣賞和模仿多樣化的創(chuàng)作風(fēng)格,而不是只會(huì)重復(fù)那些"標(biāo)準(zhǔn)答案"。

這個(gè)方法的巧妙之處在于它不是簡(jiǎn)單地追求不同,而是在保證質(zhì)量的前提下追求多樣性。那些偏差度高的樣本仍然需要是高質(zhì)量的作品,只是它們?cè)陲L(fēng)格或內(nèi)容上與主流作品有所不同。這樣既能保證AI學(xué)到的都是好的創(chuàng)作技巧,又能讓它掌握各種不同的創(chuàng)作風(fēng)格和思路。

通過(guò)這種方式,AI就像是一個(gè)見(jiàn)多識(shí)廣的作家,它不僅掌握了各種經(jīng)典的寫(xiě)作技巧,還了解各種新穎的創(chuàng)作手法。當(dāng)它進(jìn)行創(chuàng)作時(shí),就能根據(jù)不同的需求和情境,選擇最合適的風(fēng)格和內(nèi)容,而不是千篇一律地重復(fù)同一種模式。

三、兩種新的訓(xùn)練方法讓AI更有創(chuàng)意

研究團(tuán)隊(duì)基于偏差度概念,開(kāi)發(fā)了兩種新的AI訓(xùn)練方法,分別改進(jìn)了目前最流行的兩種訓(xùn)練技術(shù):DPO(直接偏好優(yōu)化)和ORPO(比值偏好優(yōu)化)。這就像是給原本只會(huì)做標(biāo)準(zhǔn)菜品的廚師傳授了制作創(chuàng)意料理的秘訣。

第一種方法叫做多樣化DPO,簡(jiǎn)稱DDPO。原本的DPO訓(xùn)練方法就像是讓AI在兩道菜之間做選擇:哪道更好吃?AI會(huì)學(xué)習(xí)選擇更好的那道菜。但DDPO不僅要求AI選擇更好的菜,還要求它特別關(guān)注那些好吃且獨(dú)特的菜品。具體操作方式是,當(dāng)訓(xùn)練數(shù)據(jù)中出現(xiàn)一個(gè)質(zhì)量高且風(fēng)格獨(dú)特的樣本時(shí),系統(tǒng)會(huì)給這個(gè)樣本更多的"學(xué)習(xí)權(quán)重",讓AI更仔細(xì)地研究和學(xué)習(xí)這種獨(dú)特的創(chuàng)作方式。

第二種方法叫做多樣化ORPO,簡(jiǎn)稱DORPO。ORPO的工作原理稍有不同,它不需要預(yù)先訓(xùn)練的參考模型,而是直接通過(guò)比較不同樣本的概率來(lái)學(xué)習(xí)。DORPO在這個(gè)基礎(chǔ)上增加了對(duì)獨(dú)特樣本的特殊關(guān)注,就像是一個(gè)美食評(píng)論家不僅要品嘗食物的美味,還要特別留意那些有創(chuàng)新元素的菜品。

這兩種方法的核心思想都是在保持訓(xùn)練質(zhì)量的同時(shí),讓AI更多地學(xué)習(xí)那些與眾不同的優(yōu)秀創(chuàng)作。這就像是在培養(yǎng)一個(gè)全面發(fā)展的藝術(shù)家,既要掌握扎實(shí)的基本功,又要培養(yǎng)獨(dú)特的創(chuàng)作風(fēng)格和創(chuàng)新思維。

研究團(tuán)隊(duì)還考慮到了不同類型的多樣性需求。有時(shí)候我們希望AI在內(nèi)容主題上更加多樣化,有時(shí)候希望它在寫(xiě)作風(fēng)格上更加豐富。因此,他們提供了三種不同的配置選項(xiàng):只關(guān)注語(yǔ)義多樣性、只關(guān)注風(fēng)格多樣性,或者同時(shí)關(guān)注兩種多樣性。這就像是給廚師提供了不同的菜譜選擇:有時(shí)候創(chuàng)新在于食材搭配,有時(shí)候創(chuàng)新在于烹飪技法,有時(shí)候則需要兩者兼而有之。

在實(shí)際實(shí)現(xiàn)過(guò)程中,研究團(tuán)隊(duì)還需要解決一個(gè)技術(shù)難題:如何確保偏差度的計(jì)算是公平和準(zhǔn)確的。他們使用了先進(jìn)的文本嵌入技術(shù)來(lái)計(jì)算不同樣本之間的相似度,就像是用精密的儀器來(lái)測(cè)量不同食材的味道差異。通過(guò)這種方式,系統(tǒng)能夠準(zhǔn)確地識(shí)別出哪些樣本是真正獨(dú)特的,哪些只是表面上看起來(lái)不同。

為了防止系統(tǒng)過(guò)度偏向某些特殊樣本,研究團(tuán)隊(duì)還設(shè)計(jì)了一套平衡機(jī)制。這個(gè)機(jī)制確保每個(gè)提示詞對(duì)應(yīng)的所有訓(xùn)練樣本的權(quán)重總和保持恒定,就像是在保證總體營(yíng)養(yǎng)平衡的前提下調(diào)整不同食材的比例。這樣既能突出獨(dú)特樣本的重要性,又不會(huì)破壞整體的訓(xùn)練平衡。

四、實(shí)驗(yàn)結(jié)果證明新方法確實(shí)有效

為了驗(yàn)證這兩種新方法的效果,研究團(tuán)隊(duì)進(jìn)行了大規(guī)模的實(shí)驗(yàn)。他們選擇了Reddit上的創(chuàng)意寫(xiě)作社區(qū)作為數(shù)據(jù)源,這個(gè)社區(qū)匯集了大量真實(shí)的創(chuàng)意寫(xiě)作作品,每個(gè)寫(xiě)作提示都有多個(gè)不同作者的回應(yīng),而且社區(qū)用戶會(huì)對(duì)這些作品進(jìn)行評(píng)分,這為研究提供了理想的實(shí)驗(yàn)環(huán)境。

整個(gè)實(shí)驗(yàn)設(shè)計(jì)就像是一場(chǎng)大型的創(chuàng)作比賽。研究團(tuán)隊(duì)收集了超過(guò)40萬(wàn)個(gè)寫(xiě)作樣本,涵蓋了各種不同的創(chuàng)作提示和風(fēng)格。他們用這些數(shù)據(jù)訓(xùn)練了多個(gè)不同版本的AI模型,然后讓這些模型參與同樣的創(chuàng)作任務(wù),最后比較它們的表現(xiàn)。

實(shí)驗(yàn)結(jié)果令人振奮。使用新方法訓(xùn)練的AI模型在保持寫(xiě)作質(zhì)量的同時(shí),顯著提高了創(chuàng)作的多樣性。具體來(lái)說(shuō),新方法訓(xùn)練的最佳模型(基于Llama-3.1-8B的DDPO模型)在寫(xiě)作質(zhì)量上與GPT-4o和DeepSeek-R1等頂級(jí)AI模型不相上下,但在創(chuàng)作多樣性方面卻遠(yuǎn)遠(yuǎn)超越了它們,甚至接近了人類創(chuàng)作者的多樣性水平。

這個(gè)成果的意義就像是培養(yǎng)出了一個(gè)既有深厚功底又有獨(dú)特風(fēng)格的作家。傳統(tǒng)的AI模型雖然寫(xiě)作水平很高,但就像是一個(gè)只會(huì)寫(xiě)標(biāo)準(zhǔn)作文的學(xué)生,作品質(zhì)量不錯(cuò)但缺乏個(gè)性。而新方法訓(xùn)練的模型則像是一個(gè)真正的創(chuàng)作者,既能保證作品質(zhì)量,又能展現(xiàn)出豐富的創(chuàng)作風(fēng)格和想象力。

研究團(tuán)隊(duì)還進(jìn)行了詳細(xì)的對(duì)比分析。他們發(fā)現(xiàn),當(dāng)給AI相同的寫(xiě)作提示時(shí),傳統(tǒng)方法訓(xùn)練的模型往往會(huì)生成非常相似的故事情節(jié)和敘述方式,而新方法訓(xùn)練的模型則能產(chǎn)生各種不同的創(chuàng)作思路。比如面對(duì)"月球上的狗"這個(gè)提示,傳統(tǒng)模型可能都會(huì)寫(xiě)關(guān)于狗狗太空冒險(xiǎn)的故事,而新模型則可能寫(xiě)出關(guān)于孤獨(dú)、關(guān)于思鄉(xiāng)、關(guān)于適應(yīng)新環(huán)境等各種不同主題的故事。

在風(fēng)格多樣性方面,改進(jìn)效果同樣明顯。新方法訓(xùn)練的模型能夠采用不同的敘述視角、語(yǔ)言風(fēng)格和文體結(jié)構(gòu)。有時(shí)它會(huì)用第一人稱的內(nèi)心獨(dú)白,有時(shí)用第三人稱的全知視角,有時(shí)采用對(duì)話體,有時(shí)則用散文詩(shī)的形式。這種風(fēng)格的豐富性讓生成的內(nèi)容更加有趣和引人入勝。

研究團(tuán)隊(duì)還測(cè)試了不同配置選項(xiàng)的效果。結(jié)果顯示,專門(mén)針對(duì)語(yǔ)義多樣性優(yōu)化的模型在故事主題和情節(jié)方面更加豐富,而專門(mén)針對(duì)風(fēng)格多樣性優(yōu)化的模型在表達(dá)方式和文體風(fēng)格方面更加多元。同時(shí)關(guān)注兩種多樣性的模型則在各個(gè)方面都表現(xiàn)出色,成為了最全面的創(chuàng)作助手。

特別值得一提的是,研究團(tuán)隊(duì)還與人類評(píng)估者進(jìn)行了對(duì)比實(shí)驗(yàn)。結(jié)果顯示,人類評(píng)估者普遍認(rèn)為新方法生成的內(nèi)容不僅更加多樣化,在有趣程度和創(chuàng)意水平方面也超越了傳統(tǒng)方法。這說(shuō)明多樣性的提升不僅僅是技術(shù)指標(biāo)上的改進(jìn),更是真正提升了內(nèi)容的吸引力和價(jià)值。

五、深入分析發(fā)現(xiàn)了更多有趣的規(guī)律

研究團(tuán)隊(duì)沒(méi)有滿足于初步的成功,而是進(jìn)一步深入分析了影響新方法效果的各種因素。他們發(fā)現(xiàn)了一個(gè)重要規(guī)律:訓(xùn)練數(shù)據(jù)的豐富程度對(duì)新方法的效果有決定性影響。

當(dāng)每個(gè)寫(xiě)作提示對(duì)應(yīng)的訓(xùn)練樣本足夠多時(shí),新方法能夠發(fā)揮出最佳效果。這就像是一個(gè)廚師需要足夠多的食材才能創(chuàng)作出豐富多樣的菜品。如果食材種類太少,即使有再好的烹飪技巧也難以做出令人驚艷的創(chuàng)意料理。具體來(lái)說(shuō),當(dāng)每個(gè)提示至少有6-8個(gè)不同的高質(zhì)量樣本時(shí),新方法就能顯著提升創(chuàng)作多樣性。

但是,當(dāng)訓(xùn)練樣本過(guò)少時(shí)(比如每個(gè)提示只有4個(gè)樣本),新方法可能會(huì)出現(xiàn)質(zhì)量下降的問(wèn)題。研究團(tuán)隊(duì)深入分析后發(fā)現(xiàn),這是因?yàn)闃颖咎贂r(shí),偏差度的計(jì)算變得不夠準(zhǔn)確,系統(tǒng)可能會(huì)過(guò)度關(guān)注一些并非真正優(yōu)秀的特殊樣本。這就像是在食材有限的情況下,廚師可能會(huì)選擇一些看起來(lái)特別但實(shí)際上并不美味的搭配。

針對(duì)這個(gè)問(wèn)題,研究團(tuán)隊(duì)提出了兩種解決方案。第一種是設(shè)置偏差度的最小閾值,確保系統(tǒng)不會(huì)過(guò)度偏向那些偏差度接近零的樣本。第二種是在樣本較少的情況下,優(yōu)先選擇那些質(zhì)量最高的樣本進(jìn)行訓(xùn)練,而不是過(guò)分追求多樣性。這兩種方法都能有效緩解樣本不足時(shí)的質(zhì)量問(wèn)題。

研究團(tuán)隊(duì)還與另一種現(xiàn)有的多樣化訓(xùn)練方法DivPO進(jìn)行了詳細(xì)比較。DivPO的工作原理是預(yù)先篩選訓(xùn)練數(shù)據(jù),只保留那些高質(zhì)量且多樣化的樣本。雖然這種方法也能在一定程度上提升多樣性,但它需要舍棄大量的訓(xùn)練數(shù)據(jù),而且在多樣性提升方面的效果不如新方法顯著。

更重要的是,新方法能夠充分利用所有可用的訓(xùn)練數(shù)據(jù),而不需要預(yù)先篩選和舍棄任何樣本。這對(duì)于數(shù)據(jù)資源有限的情況特別有價(jià)值。就像是一個(gè)優(yōu)秀的廚師能夠充分利用所有可用的食材,而不是只挑選其中的一小部分。

在不同類型的多樣性指標(biāo)上,新方法也表現(xiàn)出了不同的特點(diǎn)。研究團(tuán)隊(duì)測(cè)試了包括語(yǔ)義多樣性、風(fēng)格多樣性在內(nèi)的多種評(píng)估指標(biāo),發(fā)現(xiàn)新方法在各個(gè)方面都有顯著提升。特別是在一些表面特征指標(biāo)(如文本壓縮率、重復(fù)度等)上,改進(jìn)效果也很明顯,這說(shuō)明新方法不僅能提升深層次的創(chuàng)意多樣性,也能改善文本的表面表現(xiàn)。

六、人工評(píng)估進(jìn)一步驗(yàn)證了研究成果

為了確保研究結(jié)果的可靠性,研究團(tuán)隊(duì)還進(jìn)行了大規(guī)模的人工評(píng)估實(shí)驗(yàn)。他們邀請(qǐng)了多名專業(yè)評(píng)估者,讓他們?cè)诓恢谰唧w訓(xùn)練方法的情況下,對(duì)不同模型生成的內(nèi)容進(jìn)行質(zhì)量和多樣性評(píng)估。

評(píng)估過(guò)程就像是一場(chǎng)盲品比賽。評(píng)估者會(huì)看到同一個(gè)寫(xiě)作提示對(duì)應(yīng)的多組創(chuàng)作內(nèi)容,然后判斷哪一組質(zhì)量更高、哪一組更加多樣化。為了確保評(píng)估的準(zhǔn)確性,研究團(tuán)隊(duì)對(duì)每組內(nèi)容都提供了摘要版本,避免評(píng)估者因?yàn)殚喿x長(zhǎng)文而產(chǎn)生疲勞。

評(píng)估結(jié)果與自動(dòng)化測(cè)試完全一致。評(píng)估者普遍認(rèn)為,新方法訓(xùn)練的模型生成的內(nèi)容不僅在多樣性方面明顯超越了傳統(tǒng)方法,在質(zhì)量方面也不遜色甚至略有優(yōu)勢(shì)。特別是與GPT-4o的對(duì)比中,評(píng)估者認(rèn)為新方法生成的內(nèi)容在68%的情況下質(zhì)量更高,在100%的情況下多樣性更好。

這個(gè)結(jié)果特別有說(shuō)服力,因?yàn)樗砻餍路椒ǖ母倪M(jìn)不僅僅是技術(shù)指標(biāo)上的提升,更是真正得到了人類用戶的認(rèn)可。評(píng)估者們表示,新方法生成的故事更加有趣、更有創(chuàng)意,閱讀起來(lái)不會(huì)有千篇一律的感覺(jué)。

評(píng)估者之間的一致性也相當(dāng)高,特別是在多樣性判斷方面,幾乎所有評(píng)估者都能明顯感受到新方法的優(yōu)勢(shì)。這說(shuō)明多樣性的改進(jìn)是顯而易見(jiàn)的,不是某種微妙的技術(shù)改進(jìn),而是真正能被普通讀者感知到的質(zhì)量提升。

研究團(tuán)隊(duì)還分析了評(píng)估者的具體反饋意見(jiàn)。他們發(fā)現(xiàn),評(píng)估者特別欣賞新方法在故事情節(jié)創(chuàng)新和敘述風(fēng)格變化方面的表現(xiàn)。許多評(píng)估者提到,新方法生成的故事"更有意思"、"更有想象力"、"不會(huì)讓人覺(jué)得無(wú)聊"。

七、方法的局限性和未來(lái)改進(jìn)方向

盡管新方法取得了顯著成果,研究團(tuán)隊(duì)也誠(chéng)實(shí)地討論了當(dāng)前方法的局限性和需要改進(jìn)的地方。這種科學(xué)嚴(yán)謹(jǐn)?shù)膽B(tài)度讓研究更加可信和有價(jià)值。

最主要的局限性是對(duì)訓(xùn)練數(shù)據(jù)規(guī)模的依賴。新方法需要每個(gè)寫(xiě)作提示都有足夠多的不同樣本才能發(fā)揮最佳效果。在現(xiàn)實(shí)應(yīng)用中,很多專業(yè)領(lǐng)域或特定主題的寫(xiě)作可能沒(méi)有足夠豐富的訓(xùn)練數(shù)據(jù),這會(huì)限制新方法的適用范圍。這就像是某些珍貴食材只有少量樣本,廚師難以從中學(xué)會(huì)各種不同的烹飪方法。

另一個(gè)局限是當(dāng)前研究主要集中在創(chuàng)意寫(xiě)作領(lǐng)域,對(duì)于其他類型的文本生成任務(wù)(如技術(shù)文檔、新聞報(bào)道等)的效果還需要進(jìn)一步驗(yàn)證。不同類型的寫(xiě)作任務(wù)對(duì)多樣性的需求可能不同,新方法是否在所有情況下都有效還需要更多實(shí)驗(yàn)來(lái)證明。

研究團(tuán)隊(duì)還發(fā)現(xiàn),新方法在計(jì)算成本方面會(huì)有一定增加。因?yàn)樾枰?jì)算每個(gè)樣本的偏差度,并且在訓(xùn)練過(guò)程中給不同樣本分配不同的權(quán)重,這會(huì)增加計(jì)算的復(fù)雜度。雖然這種增加在可接受范圍內(nèi),但對(duì)于資源有限的研究機(jī)構(gòu)或個(gè)人開(kāi)發(fā)者來(lái)說(shuō)可能是個(gè)考慮因素。

在技術(shù)實(shí)現(xiàn)方面,偏差度的準(zhǔn)確計(jì)算依賴于高質(zhì)量的文本嵌入模型。如果嵌入模型本身存在偏見(jiàn)或局限性,可能會(huì)影響偏差度計(jì)算的準(zhǔn)確性,進(jìn)而影響最終的訓(xùn)練效果。這需要研究者在選擇嵌入模型時(shí)特別謹(jǐn)慎。

研究團(tuán)隊(duì)提出了幾個(gè)未來(lái)的改進(jìn)方向。首先是探索如何在數(shù)據(jù)稀缺的情況下仍然能夠有效應(yīng)用新方法,比如通過(guò)數(shù)據(jù)增強(qiáng)或遷移學(xué)習(xí)等技術(shù)來(lái)擴(kuò)充訓(xùn)練樣本。其次是研究如何將新方法擴(kuò)展到其他類型的文本生成任務(wù),驗(yàn)證其通用性。

另一個(gè)重要的研究方向是探索在線學(xué)習(xí)場(chǎng)景下的應(yīng)用。目前的研究主要基于離線訓(xùn)練,但在實(shí)際應(yīng)用中,很多AI系統(tǒng)需要能夠持續(xù)學(xué)習(xí)和改進(jìn)。如何在在線學(xué)習(xí)過(guò)程中應(yīng)用多樣化訓(xùn)練方法,是一個(gè)值得深入研究的問(wèn)題。

研究團(tuán)隊(duì)還提到了個(gè)性化的可能性。未來(lái)的系統(tǒng)可能需要根據(jù)不同用戶的偏好來(lái)調(diào)整多樣性的程度和類型。有些用戶可能更喜歡風(fēng)格多樣的內(nèi)容,有些可能更看重主題的豐富性,如何讓系統(tǒng)根據(jù)用戶需求靈活調(diào)整是個(gè)有趣的挑戰(zhàn)。

八、這項(xiàng)研究對(duì)未來(lái)的深遠(yuǎn)影響

這項(xiàng)研究的影響遠(yuǎn)遠(yuǎn)超出了技術(shù)層面的改進(jìn)。它為整個(gè)AI創(chuàng)作領(lǐng)域指出了一個(gè)新的發(fā)展方向,可能會(huì)改變我們對(duì)AI創(chuàng)造力的理解和期待。

從技術(shù)發(fā)展的角度來(lái)看,這項(xiàng)研究證明了AI不僅能夠生成高質(zhì)量的內(nèi)容,還能展現(xiàn)出真正的創(chuàng)意多樣性。這打破了人們對(duì)AI創(chuàng)作的一些固有印象,即AI只能產(chǎn)生標(biāo)準(zhǔn)化、缺乏個(gè)性的內(nèi)容。新方法展示了AI在創(chuàng)意領(lǐng)域的巨大潛力,為人工智能的創(chuàng)造性應(yīng)用開(kāi)辟了新的可能性。

對(duì)于創(chuàng)意產(chǎn)業(yè)而言,這項(xiàng)研究提供了強(qiáng)有力的工具。作家、編劇、廣告創(chuàng)意人員等專業(yè)創(chuàng)作者可以利用這種技術(shù)獲得更加豐富多樣的創(chuàng)意靈感。與傳統(tǒng)的AI寫(xiě)作助手相比,基于新方法的系統(tǒng)能夠提供更多不落俗套的創(chuàng)意思路,幫助創(chuàng)作者突破思維定勢(shì)。

教育領(lǐng)域也將從這項(xiàng)研究中受益。在創(chuàng)意寫(xiě)作教學(xué)中,教師可以使用這種技術(shù)為學(xué)生展示各種不同的寫(xiě)作風(fēng)格和敘述方法。學(xué)生們可以看到同一個(gè)主題可以有多少種不同的處理方式,這有助于培養(yǎng)他們的創(chuàng)意思維和表達(dá)能力。

從更廣泛的社會(huì)影響來(lái)看,這項(xiàng)研究有助于促進(jìn)文化多樣性。如果AI能夠?qū)W習(xí)和模仿各種不同的創(chuàng)作風(fēng)格,它就能更好地理解和傳承不同文化背景下的表達(dá)方式。這對(duì)于保護(hù)和傳播文化多樣性具有重要意義。

研究還提出了一些深層次的思考。什么是真正的創(chuàng)造力?AI是否能夠具備真正的創(chuàng)意能力?這項(xiàng)研究雖然不能完全回答這些哲學(xué)問(wèn)題,但它確實(shí)展示了AI在創(chuàng)造性任務(wù)上的巨大進(jìn)步。它讓我們重新思考創(chuàng)造力的本質(zhì),以及人工智能在創(chuàng)意領(lǐng)域的角色定位。

對(duì)于AI安全和倫理方面,這項(xiàng)研究也有積極意義。多樣化的AI輸出有助于減少算法偏見(jiàn),避免AI系統(tǒng)產(chǎn)生單一化、刻板化的內(nèi)容。當(dāng)AI能夠生成更加多元化的內(nèi)容時(shí),它就不太可能強(qiáng)化某種特定的觀點(diǎn)或偏見(jiàn)。

從商業(yè)應(yīng)用的角度來(lái)看,這項(xiàng)技術(shù)有著廣闊的市場(chǎng)前景。內(nèi)容創(chuàng)作、游戲開(kāi)發(fā)、廣告營(yíng)銷等眾多行業(yè)都需要大量的創(chuàng)意內(nèi)容,而傳統(tǒng)的AI工具往往無(wú)法滿足多樣性需求。新方法提供的技術(shù)有望開(kāi)創(chuàng)全新的商業(yè)模式和應(yīng)用場(chǎng)景。

研究團(tuán)隊(duì)的開(kāi)源態(tài)度也值得贊賞。他們將代碼和數(shù)據(jù)公開(kāi)分享,讓更多研究者和開(kāi)發(fā)者能夠在此基礎(chǔ)上繼續(xù)改進(jìn)和創(chuàng)新。這種開(kāi)放的科研態(tài)度有助于加速整個(gè)領(lǐng)域的發(fā)展,讓更多人能夠從這項(xiàng)技術(shù)中受益。

這項(xiàng)研究最重要的啟示可能在于它展示了一種新的思維方式:在追求質(zhì)量的同時(shí),我們不應(yīng)該忽視多樣性的價(jià)值。無(wú)論是在AI訓(xùn)練還是在其他領(lǐng)域,單純追求"最優(yōu)解"可能會(huì)導(dǎo)致創(chuàng)新的缺失。只有在保證質(zhì)量的基礎(chǔ)上擁抱多樣性,我們才能真正釋放創(chuàng)造力的潛能。

說(shuō)到底,這項(xiàng)研究為我們描繪了一個(gè)更加豐富多彩的AI未來(lái)。在這個(gè)未來(lái)中,AI不再是冷冰冰的標(biāo)準(zhǔn)化工具,而是充滿創(chuàng)意和個(gè)性的創(chuàng)作伙伴。它能夠理解和欣賞各種不同的表達(dá)方式,能夠?yàn)槿祟愄峁┰丛床粩嗟膭?chuàng)意靈感。雖然我們還不能說(shuō)AI已經(jīng)具備了真正的創(chuàng)造力,但至少在多樣性和創(chuàng)意性方面,它已經(jīng)向前邁出了重要的一步。

對(duì)于普通人來(lái)說(shuō),這意味著我們將擁有更加有趣、更加個(gè)性化的AI助手。無(wú)論是寫(xiě)作、學(xué)習(xí)還是娛樂(lè),AI都能提供更加豐富多樣的體驗(yàn)。這不僅會(huì)改變我們與AI的互動(dòng)方式,也可能會(huì)激發(fā)我們自己的創(chuàng)造力和想象力。畢竟,當(dāng)我們接觸到更多不同的思維方式和表達(dá)方法時(shí),我們自己的創(chuàng)作能力也會(huì)得到提升。

對(duì)于有興趣深入了解技術(shù)細(xì)節(jié)的讀者,可以通過(guò)研究團(tuán)隊(duì)提供的GitHub項(xiàng)目頁(yè)面(https://github.com/mj-storytelling/DiversityTuning)獲取完整的實(shí)現(xiàn)代碼和實(shí)驗(yàn)數(shù)據(jù),這為進(jìn)一步的研究和應(yīng)用開(kāi)發(fā)提供了寶貴的資源。

Q&A

Q1:這種新的AI訓(xùn)練方法會(huì)不會(huì)讓生成的內(nèi)容質(zhì)量下降? A:研究結(jié)果顯示不會(huì)。新方法在提升多樣性的同時(shí)能夠保持甚至略微提升內(nèi)容質(zhì)量。最佳模型的寫(xiě)作質(zhì)量與GPT-4o等頂級(jí)AI相當(dāng),但多樣性遠(yuǎn)超傳統(tǒng)方法。只有在訓(xùn)練樣本過(guò)少(少于4個(gè))時(shí)才可能出現(xiàn)質(zhì)量問(wèn)題,但研究團(tuán)隊(duì)已經(jīng)提供了解決方案。

Q2:普通用戶什么時(shí)候能用上這種更有創(chuàng)意的AI寫(xiě)作工具? A:研究團(tuán)隊(duì)已經(jīng)將代碼開(kāi)源,技術(shù)上已經(jīng)可以實(shí)現(xiàn)。但要成為普通用戶能直接使用的產(chǎn)品,還需要進(jìn)一步的工程化開(kāi)發(fā)和優(yōu)化。預(yù)計(jì)在不久的將來(lái),會(huì)有基于這種技術(shù)的創(chuàng)意寫(xiě)作工具面向公眾發(fā)布。

Q3:這種方法除了創(chuàng)意寫(xiě)作還能用在其他地方嗎? A:目前研究主要集中在創(chuàng)意寫(xiě)作領(lǐng)域,但研究團(tuán)隊(duì)認(rèn)為這種方法有潛力應(yīng)用到其他需要多樣性的文本生成任務(wù)中,比如廣告文案、產(chǎn)品描述、教育內(nèi)容等。不過(guò)具體效果還需要進(jìn)一步的研究驗(yàn)證。

分享至
0贊

好文章,需要你的鼓勵(lì)

推薦文章
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-